Большие (реальные русские) датасеты основаны на реальных открытых данных и относятся к широким тематикам: демография, география, социология, экономика, образование, транспорт, экология, культура и туризм.

Для таких датасетов необходимо особенно внимательно указывать источники, лицензии и этапы обработки данных.

Желательно подготовить не только полный датасет, но и учебные сэмплы:

dataset_sample_1000.csv
dataset_sample_1000.meta

dataset_sample_10000.csv
dataset_sample_10000.meta

dataset_full.csv
dataset_full.meta

Примеры тем:

  • демография регионов России
  • социально-экономические показатели регионов
  • география населённых пунктов России
  • образовательная статистика
  • экологические показатели
  • транспортная инфраструктура
  • культура и туризм
  • муниципальная статистика
  • динамика цен
  • открытые данные городских порталов