Требования к CSV-файлам
CSV-файлы должны быть подготовлены так, чтобы их можно было без дополнительных исправлений загрузить в PascalABC.NET.
Обязательные требования:
- кодировка UTF-8
- первая строка содержит имена столбцов
- разделитель – запятая
- десятичный разделитель – точка
- имена столбцов записываются латиницей
- имена столбцов записываются в стиле
snake_case - в именах столбцов не должно быть пробелов
- пропущенные значения обозначаются как
NA - булевы значения записываются как
trueиfalse - категориальные значения желательно задавать техническими английскими кодами
- русские описания признаков размещаются не в CSV, а в
.meta-файле
Пример CSV-файла:
rooms,area,kitchen_area,floor,floors_total,metro_minutes,renovation,price2,54.3,9.2,5,12,7,cosmetic,175000001,38.1,7.5,9,17,15,without,121000003,78.0,12.0,3,9,5,euro,28400000Нежелательно использовать в CSV русские названия столбцов, пробелы в именах признаков, смешанные типы данных в одном столбце и неочевидные обозначения пропусков.