Le document présente une vue d'ensemble sur le phénomène du big data, abordant son histoire, ses définitions, ainsi que les défis liés à son stockage, traitement et collecte. Il met en évidence les trois problématiques majeures du big data : le volume, la vélocité et la variété, et discute des solutions possibles, y compris l'architecture lambda et les systèmes de stockage distribués. Enfin, il aborde des principes fondamentaux pour le traitement des données massives, tels que le déplacement du traitement vers les données.