Ce document présente l'écosystème Hadoop, détaillant ses composants principaux, comme HDFS et MapReduce, ainsi que des cas d'application typiques tels que l'analyse de logs et le machine learning. Il aborde les défis techniques liés à la gestion de grandes quantités de données et décrit l'architecture distribuée et les processus essentiels qui sous-tendent le fonctionnement de Hadoop. Enfin, il mentionne les outils complémentaires comme Pig, Sqoop et HBase, ainsi que les améliorations et perspectives d'avenir pour l'écosystème Hadoop.