Рассматривается проблема обнаружения аномалий в данных, области применения этой задачи (обнаружение подозрительный транзакций, отслеживание качества продукции, анализ потребительского рынка и т.д.) и самые популярные алгоритмы, предназначенные для обнаружения объектов, сильно отличающихся от других - OneClassSVM и статистический подход. Также рассматривается алгоритм кластеризации DBSCAN, способный помимо прочего находить "выбросы". И, конечно, иллюстрируется задача на простом и понятном примере.