Минимальный датасет
Минимальный датасет содержит менее 100 объектов.
Такие датасеты предназначены для первых учебных примеров: загрузки данных, вывода первых строк, первичного анализа, простейшей классификации или регрессии.
Характеристики минимального датасета:
- 20–100 строк
- 5–10 признаков
- простая и понятная предметная область
- одна основная задача машинного обучения
- данные могут быть полностью синтетическими
- обязательны CSV-файл,
.meta-файл и хотя бы один пример использования
Примеры тем:
- прогноз итоговой оценки студента
- выбор кружка школьником
- цена квартиры в небольшом городе
- погода и решение «идти гулять / не идти»
- покупки в магазине
- расходы семьи за месяц
- выбор направления подготовки абитуриентом
- рейтинг кафе или ресторана