Машинное обучение, часть 1
Санкт-Петербург, осень 2016
Описание
Это первая половина годового курса.
Цель курса — сформировать целостное представление о методах машинного обучения, об ограничениях этих методов и о задачах, которые можно решать с их помощью. Курс предназначен для широкого круга слушателей.
Для понимания излагаемого материала достаточно знания статистики и линейной алгебры в объеме первых двух курсов математического факультета университета.
Курс построен таким образом, чтобы слушатель, который ранее не сталкивался с машинным обучением, мог понять большую часть курса и научиться применять излагаемые методы. При этом даже самый опытный слушатель в этом курсе найдёт для себя что-то новое.
Для более эффективного понимания курса в течение семестра будут даны несколько домашних заданий, связанных с практическим применением методов, о которых рассказывается в лекциях.
По окончании семестра будет проведён устный экзамен. В итоговой оценке за семестр также будет учитываться качество выполнения домашних заданий.
Содержание курса
Модуль 1 (Введение)
- Обзор методов машинного обучения. Отличия от смежных областей
- Разбор эксперимента «предсказание оценки студента»
- Практическая оценка качества обучения
Модуль 2 (Классы решающих функций)
- Ближайшие соседи
- Линейные модели
- Деревья решений
- Нейронные сети
- Метод опорных векторов (SVM)
Модуль 3 (Ансамбли решающих функций)
- Леса
- Ансамбли
- Gradient Bossting Decision Tree
Модули 4-6 рассматриваются в продолжении курса весной.
Модуль 4 (Работа с данными)
- Сэмплирование данных
- Уменьшение размерности
- Кластеризация
- Feature extraction
- Обучение метрики
Модуль 5 (Обучение на сырых данных)
- Коллаборативная фильтрация
- Обучение на последовательностях, HMM
- Глубокое обучение
Модуль 6 (Создание методов обучения)
- Целевые функции
- Вероятностные модели
- EM, Gibbs sampling, MCMC
- Теоретическая оценка качества обучения
- Регуляризация, LASSO
Для слушателей курса будет полезна книга The Elements of Statistical Learning: Data Mining, Inference, and Prediction.
Преподаватели
Список лекций
На этой лекции мы будем разбирать каким образом можно предсказывать оценку студента на экзамене.
В этой лекции будут рассказано как можно и нужно оценивать качество машинного обучения.
Продолжим разговор про оценку качества машинного обучения.
В этой лекции будет рассказано о самом работающем методе в машинном обучении. О методе ближайших соседей.
На этой лекции будет рассказана вся правда про линейные модели.
На предыдущей лекции про линейные модели было рассказано только про постановку самой задачи, её простое решение и свойствах этого решения по теореме Гаусса-Маркова. В этой лекции будут рассказаны более эффективные линейные модели для задач классификации.
В этой лекции будут рассмотрены базовые деревья решений.
Продолжаем разговор о деревьях решений.
Поговорим про нейронные сети — математические модели, построенные по принципу организации и функционирования биологических нейронных сетей.
Продолжаем рассказ про нейронные сети.
Расскажем про многолетнего фаворита методов машинного обучения.
Первый день сдачи экзамена. Аудитория ещё уточняется.
Второй день сдачи экзамена.
День для пересдачи плюс смелых людей, которым не нужна пересдача.