Тематический план

  • Общее

    Для получения зачета (60 баллов) по курсу достаточно выполнить лабораторные работы (30 баллов) и набрать как минимум 50% по сумме теоретических тестов на лекциях.
    Дополнительные баллы (40) будут начисляться за особые успехи в решении теоретических задач на тестированиях.

    Лабораторные работы нужно сдавать до установленного для каждой из них дедлайна.
    Тестирование будет проходить на лекциях очно (нужно иметь с собой смартфон/ноутбук с доступом к этому сайту). 

    Добор баллов по практике будет состоять в решении индивидуальных заданий (номер варианта нужно согласовать с преподавателем).
    Добор баллов по теории состоится на зачете в виде решения заданий очень похожих на тестовые (но других).

  • Основные понятия

    История. Постановка задачи обучения по прецедентам. Типы задач. Вероятностная постановка задачи обучения. Выбор алгоритма в вероятностной постановке задачи. Проблема переобучения и обобщающая способность алгоритма. 

  • Метрические алгоритмы

    Обобщенный алгоритм. Примеры частных алгоритмов:
       - метод ближайших соседей
       - метод окна Парзена
    Понятие выступа объекта. Алгоритм отбора эталонов. Проклятие размерности. Выбор метрики

  • Байесовский подход к обучению

    Применение формула Байеса к задаче машинного обучения. Построение приближенной плотности распределения: одномерный и многомерный  случаи.
    Логистическая регрессия. Бинаризация признаков. Скоринг.
    Смеси распределений. EM-алгоритм восстановления смеси.

  • Линейные алгоритмы классификации

    Общая формула линейного классификатора
    Метод стохастического градиента. Обоснование
    Выступ объекта для линейного классификатора
    Кривая ошибок (ROC) и PR-кривая

  • Методы восстановления регрессии

    Метод наименьших квадратов. Геометрический смысл. Регуляризация. Сингулярное разложение. Непараметрическая регрессия

  • Логические методы классификации

    Понятие закономерности. Критерий качества закономерностей. Поиск закономерностей. Алгоритмы классификации на основе логических закономерностей

  • Метод опорных векторов

    Случаи линейно разделимой и неразделимой выборок. Двойственная задача. Типы объектов. Нелинейное обобщение SVM. SVM-регрессия. L1 регуляризация