Это старая версия (1.17) АлгоритмKСредних.

Содержание

Алгоритм k-средних

Простейший алгоритм кластеризации (деления данных на относительно однородные группы — т. н. кластеры).

Алгоритм k-средних делит имеющиеся данные на заданное число групп k.

Описание алгоритма

Шаг 0

Выбирается число групп k >= 2.

Шаг 1

Случайно выбираются k точек, которые назначаются начальными центрами масс кластеров: M sub 1 (x sub 1 , y sub 1 ), M sub 2 (x sub 2 , y sub 2 ), ldots , M sub k (x sub k , y sub k ).

Шаг 2

Проводится начальное разбиение на кластеры. Точка принадлежит тому кластеру, расстояние до центра масс которого будет наименьшим.

Шаг 3

Происходит вычисление нового центра масс каждого кластера. Затем все точки заново разбиваются на кластеры по тому же правилу, что и в шаге 2. Эта процедура завершается тогда, когда после очередного пересчёта текущий центр масс совпадает с предыдущим.

Недостатки алгоритма

Модификации алгоритма



КатегорияПрикладнаяМатематика | КатегорияАлгоритмы