Le document explique le concept de regroupement (clustering) en tant que méthode de classification non supervisée, visant à rassembler des objets similaires tout en les distinguant des objets dissimilaires. Il décrit les différentes structures de données, mesures de similarité, types de variables et approches de clustering, notamment les algorithmes k-means et k-medoids, ainsi que leurs forces et faiblesses. Le contenu met en évidence l'importance de la qualité de regroupement basée sur la mesure de similarité utilisée et la nature des données.