Le document présente une introduction au big data, soulignant la croissance de l'utilisation d'Internet et la montée en volume de données générées, avec des statistiques clés sur l'interaction des utilisateurs et la création de données. Il décrit les caractéristiques des big data, les défis de stockage et de traitement, et se concentre sur les solutions offertes par le modèle de programmation mapreduce dans le framework Hadoop, qui permet le stockage et le traitement efficace de grandes quantités de données. Enfin, il détaille l'architecture de Hadoop et le fonctionnement de ses composants principaux, HDFS et MapReduce, pour une gestion distribuée des données.