Минимальный датасет содержит менее 100 объектов.

Такие датасеты предназначены для первых учебных примеров: загрузки данных, вывода первых строк, первичного анализа, простейшей классификации или регрессии.

Характеристики минимального датасета:

  • 20–100 строк
  • 5–10 признаков
  • простая и понятная предметная область
  • одна основная задача машинного обучения
  • данные могут быть полностью синтетическими
  • обязательны CSV-файл, .meta-файл и хотя бы один пример использования

Примеры тем:

  • прогноз итоговой оценки студента
  • выбор кружка школьником
  • цена квартиры в небольшом городе
  • погода и решение «идти гулять / не идти»
  • покупки в магазине
  • расходы семьи за месяц
  • выбор направления подготовки абитуриентом
  • рейтинг кафе или ресторана