Большой датасет
Большие (реальные русские) датасеты основаны на реальных открытых данных и относятся к широким тематикам: демография, география, социология, экономика, образование, транспорт, экология, культура и туризм.
Для таких датасетов необходимо особенно внимательно указывать источники, лицензии и этапы обработки данных.
Желательно подготовить не только полный датасет, но и учебные сэмплы:
dataset_sample_1000.csv
dataset_sample_1000.meta
dataset_sample_10000.csv
dataset_sample_10000.meta
dataset_full.csv
dataset_full.meta
Примеры тем:
- демография регионов России
- социально-экономические показатели регионов
- география населённых пунктов России
- образовательная статистика
- экологические показатели
- транспортная инфраструктура
- культура и туризм
- муниципальная статистика
- динамика цен
- открытые данные городских порталов