Формат .meta-файла
Формат .meta-файла
Для каждого CSV-файла должен быть подготовлен .meta-файл с метаинформацией о датасете.
Формат .meta – простой текстовый формат: ключ = значение
Пример:
name = MoscowHousingtask = regressionfeatures = rooms,area,kitchen_area,floor,floors_total,metro_minutes,renovationtarget = pricedescription.en = Apartment prices in Moscow with basic structural and location features.description.ru = Цены на квартиры в Москве с основными характеристиками жилья и расположения.source = Real estate listings (aggregated dataset)url = https://example.com/moscow-housingfeature.price = floatfeature.rooms = intfeature.area = floatfeature.kitchen_area = floatfeature.floor = intfeature.floors_total = intfeature.metro_minutes = floatfeature.renovation = categoricalfeature.price.ru = цена квартирыfeature.rooms.ru = число комнатfeature.area.ru = площадь квартирыfeature.kitchen_area.ru = площадь кухниfeature.floor.ru = этажfeature.floors_total.ru = этажей в домеfeature.metro_minutes.ru = минуты до метроfeature.renovation.ru = тип ремонтаfeature.price.en = apartment pricefeature.rooms.en = number of roomsfeature.area.en = apartment areafeature.kitchen_area.en = kitchen areafeature.floor.en = floorfeature.floors_total.en = total floors in buildingfeature.metro_minutes.en = minutes to metrofeature.renovation.en = renovation typevalue.renovation.without.ru = без ремонтаvalue.renovation.cosmetic.ru = косметическийvalue.renovation.euro.ru = евроремонтvalue.renovation.designer.ru = дизайнерскийvalue.renovation.without.en = without renovationvalue.renovation.cosmetic.en = cosmeticvalue.renovation.euro.en = european renovationvalue.renovation.designer.en = designer renovationОбязательные поля .meta
В .meta-файле должны быть указаны:
name = ...task = ...features = ...target = ...description.ru = ...description.en = ...source = ...url = ...Если у датасета нет целевой переменной, например для задачи кластеризации, можно указать:
task = clusteringtarget = noneДопустимые типы признаков
В .meta используются следующие типы признаков:
intfloatstringcategoricalboolDateTime
DateTime используется для дат и времени.Пример:
feature.sale_date = DateTimefeature.sale_date.format = yyyy-MM-ddfeature.sale_date.ru = дата продажиfeature.sale_date.en = sale dateРекомендуемый формат дат:
yyyy-MM-ddЕсли используется дата и время, рекомендуется формат:
yyyy-MM-dd HH:mm:ssПример: 2025-03-17 14:30:00
Дополнительные поля .meta
Рекомендуется также указывать:
title.ru = ...title.en = ...family = ...variant = ...rows = ...columns = ...version = ...license = ...synthetic = ...missing = ...missing_values = ...Пример:
title.ru = Цены на квартиры в Москвеtitle.en = Moscow apartment pricesfamily = MoscowHousingvariant = mediumrows = 1200columns = 8version = 1.0license = educationalsynthetic = partialmissing = yesmissing_values = NAsynthetic может принимать значения:no– данные реальныеpartial– данные частично синтетическиеfull– данные полностью синтетические
Пример .meta с DateTime-признаком
name = ShopSalesRUtitle.ru = Продажи учебного магазинаtitle.en = Educational shop salestask = regressionfamily = ShopSalesRUvariant = mediumrows = 3000columns = 9version = 1.0features = sale_date,city,category,brand,price,discount,quantity,is_weekendtarget = revenuedescription.ru = Учебный датасет продаж магазина с датами, категориями товаров и выручкой.description.en = Educational shop sales dataset with dates, product categories and revenue.source = synthetic dataset based on typical retail scenariosurl = nonelicense = educationalsynthetic = fullmissing = yesmissing_values = NAfeature.sale_date = DateTimefeature.city = categoricalfeature.category = categoricalfeature.brand = categoricalfeature.price = floatfeature.discount = floatfeature.quantity = intfeature.is_weekend = boolfeature.revenue = floatfeature.sale_date.format = yyyy-MM-ddfeature.sale_date.ru = дата продажиfeature.city.ru = городfeature.category.ru = категория товараfeature.brand.ru = брендfeature.price.ru = цена товараfeature.discount.ru = скидкаfeature.quantity.ru = количествоfeature.is_weekend.ru = выходной деньfeature.revenue.ru = выручкаfeature.sale_date.en = sale datefeature.city.en = cityfeature.category.en = product categoryfeature.brand.en = brandfeature.price.en = product pricefeature.discount.en = discountfeature.quantity.en = quantityfeature.is_weekend.en = weekend flagfeature.revenue.en = revenue