Машинное обучение, часть 1
Санкт-Петербург, осень 2015
Описание
Модуль 1 (Введение)
Постановка задачи, классификация видов обучения. Отличия от смежных областей.
Разбор эксперимента «предсказание оценки студента».
Оценка качества обучения.
Некоторые способы построения целевой функции.
Модуль 2 (Переборные методы)
Сэмплирование пространства параметров.
Генетические алгоритмы, Differential evolution.
Модуль 3 (Линейные решения)
- Линейная регрессия. Логистическая регрессия. Линейный дискриминантный анализ (LDA) и его вариации.
- LASSO, случайные DFT проекции.
- Compressed sensing, Elastic net. Обзор имплементаций LASSO.
- Метод опорных векторов (SVM).
Модуль 4 (Факторизация)
- Collaborative filtering. Регуляризации SVD разложения. Factorization Machines.
- LSA. Informational bottleneck. PLSA, LDA.
Модуль 5 (Прямая оптимизация целевой функции)
Обзор методов оптимизации.
Выпуклая оптимизация (по Ю. Е. Нестерову).
Модули 6-9 рассматриваются в продолжении курса весной.
Модуль 6 (Ближайшие соседи)
Instance based learning (IBL). Проклятие размерности.
Практические аспекты реализации IBL.
Обучение метрикам (по Brian Kulis).
Модуль 7 (Уменьшение размерности)
- Обзор методов уменьшения размерности. Johnson-Lindenstrauss Lemma.
- Выбор свойств (feature selection).
- Выделение новых свойств: PCA, ICA.
- Кластерный анализ. Самоорганизующиеся сети Кохоннена.
Модуль 8 (Нейронные сети)
- Персептронные сети. Обратное распространение ошибки.
- Сети Хопфилда, Bolzman machine.
- Обзор глубокого обучения (Deep Learning).
Модуль 9 (Деревья решений и их ансамбли)
- Деревья решений: ID3/C4.5. CART, забывчивые деревья.
- Bagging. Случайные леса. Boosting на примере AdaBoost.
- Gradient Boosting. MatrixNet.
Видеозаписи лекций курса 2014 года можно найти на канале CS центра на YouTube. В 2015 году съёмка не ведётся.
Преподаватели
Список лекций
Полезная статья про Factorization Machines - http://www.ismll.uni-hildesheim.de/pub/pdfs/Rendle2010FM.pdf
Мы не ждём в этот день никого раньше 18.
В этот день мы не ждём пересдающих — пересдача у несогласных с оценкой не раньше пятницы.