Le document présente le fonctionnement de MapReduce, un modèle de développement permettant le traitement de grandes quantités de données de manière parallèle et distribuée. Il décrit les étapes de mapping et de réduction, ainsi que les composants nécessaires à l'exécution des tâches. Les nouveautés de Hadoop 2, notamment YARN, améliorent la gestion des ressources et la scalabilité tout en permettant l'exécution d'autres types d'applications de traitement de données.