6_Categorical_clustering
Требуемые условия завершения
Открыто с: воскресенье, 6 апреля 2025, 00:00
Срок сдачи: понедельник, 28 апреля 2025, 16:16
Найти датасет, содержащий числовые и категориальные признаки. Подойдут ДС для классификации.
Провести кластеризацию:
а) только по числовым характеристикам (всем/избранным/PCA)
б) только по категориальным (всем/избранным/PCA)
в) смешанную с наиболее значимыми признаками
Визуализировать результаты и метрики.
Важно! ДС не должен повторяться более 1 раза в одной группе и более 3 раз в потоке.
Примечание: Если характеристик очень много, можно не пробовать кластеризовать по всем признакам.
Примечание2: Можете использовать sklearn
Провести кластеризацию:
а) только по числовым характеристикам (всем/избранным/PCA)
б) только по категориальным (всем/избранным/PCA)
в) смешанную с наиболее значимыми признаками
Визуализировать результаты и метрики.
Важно! ДС не должен повторяться более 1 раза в одной группе и более 3 раз в потоке.
Примечание: Если характеристик очень много, можно не пробовать кластеризовать по всем признакам.
Примечание2: Можете использовать sklearn