Добрый день!Подскажите пожалуйста, возможно ли реализовать упрощенный вариант алгоритма к-средних?! Например, для кластеров выбрать произвольно центры, рассчитать Евклидово расстояние до них, и сравнивать расстояния - так принадлежность к кластеру и определять ?
Привет :)
С R сдвигов нет?
Максим, а есть пример данных и полученный результат для контроля? Он так и так понадобится чтобы проверить работу алгоритма.
Затронутая тема довольно сложная. Думаю не ошибусь, что многие с этой темой только в институте и сталкивались.
Дано:
LOAD *Inline
[
Customer, Покупки, Сумма, Магазин,
1, 5, 100, 1
2, 3, 300, 2
3, 7, 700, 2
4, 2, 800, 2
5, 10, 200, 2
6, 4, 150, 1
7, 11, 550, 1
8, 5, 800, 2
];
В результате получаем таблицу в которой: С1 – расстояние (Евклидово) до первого произвольного центра ( 0.3 ; 0.3), С2 – до второго ( 0.7 ; 0.7). Сравниваем расстояния и проставляем два кластера. Норм_сумма – нормализация данных.