Overview
Programming Guides
Quick Start RDDs, Accumulators, Broadcasts Vars SQL, DataFrames, and Datasets Structured Streaming Spark Streaming (DStreams) MLlib (Machine Learning) GraphX (Graph Processing) SparkR (R on Spark) PySpark (Python on Spark) Declarative Pipelines
API Docs
Python Scala Java R SQL, Built-in Functions
Deploying
Overview Submitting Applications
Spark Standalone YARN Kubernetes
More
Configuration Monitoring Tuning Guide Job Scheduling Security Hardware Provisioning Migration Guide
Building Spark Contributing to Spark Third Party Projects

Tree ensemble methods

This section has been moved into the classification and regression section.