Le document aborde les méthodes de regroupement (clustering), en détaillant les critères d'un bon regroupement et les différentes structures de données nécessaires. Il décrit diverses mesures de similarité et de distance pour évaluer la qualité des regroupements, ainsi que plusieurs algorithmes de partitionnement, comme k-means et k-medoids. Enfin, il souligne l'importance de choisir les bonnes méthodes en fonction des types de données et des caractéristiques des résultats souhaités.