Apache Spark est un framework open source de calcul distribué in-memory, dédié au big data et au machine learning, permettant d'effectuer des analyses à grande échelle. Son installation nécessite Java JDK et Python, suivie du téléchargement et de la configuration de Spark. L'outil permet de charger, traiter, analyser des données et de créer des modèles d'apprentissage automatique.