Hadoop est un framework open source pour le traitement de grandes quantités de données non structurées, développé par Doug Cutting et inspiré par des concepts de Google. Il comprend deux composants majeurs : HDFS pour le stockage des données en cluster et MapReduce pour le traitement distribué de ces données. Utilisé par de grandes entreprises pour des besoins massifs d'analyse de données, Hadoop continue d'évoluer avec de nouveaux outils et langages pour faciliter son utilisation.