Анализ данных на R в примерах и задачах, часть 2

Санкт-Петербург, весна 2017

Описание

  1. Нейронные сети
    1. Теоретические результаты
    2. Нейронные сети в задачах аппроксимации
    3. Нейронные сети в регрессионных задачах
    4. Нейронные сети для прогнозирования
    5. Нейронные сети в задачах распознавания образов
  2. Предствление о DeepLearning

  3. Регуляризация

  4. Latent semantic analysis и работа с разреженными данными

  5. XGBoost

  6. Кейс: подготовка данных для анализа

  7. Совместный (conjoint) анализ

Преподаватели

Список лекций

Занятие 01. Нейронные сети. Теоретические результаты

Модель нейрона. Активационная функция. Сети прямого распространения. Архитектура нейронной сети. Коннективизм. Обучение нейронной сети. Обратное распространение ошибки. Метод скорейшего спуска. Эпохи и batch'и. Инициализация нейронной сети. Пример: задача Обучающее или. Библиотека Neuralnet. Пороговое значение.

Занятие 02. Нейронные сети в регрессионных задачах.

Обучение нейронной сети прямого распространения. Метод скорейшего спуска. Формулы для поправок весов при обучении нейронной сети. Задача распознавания цен квартир в Бостоне.

Занятие 03. Примеры решения задач Machine Learning с помощью нейронных сетей. Часть 1

Нейронные сети для прогнозирования. Сведение прогнозирования к регрессионной задаче. Прогнозирование рядов с сезонной составляющей. Библиотека nnet. Задача прогнозирования авиаперевозок. Задача распознавания сорта вина (не завершена)

Занятие 04. Примеры решения задач Machine Learning с помощью нейронных сетей. Часть 2

Решение задачи распознавания производителя оливкового масла с помощью нейронных сетей. Калибровка модели.

Занятие 05. Нейронные сети. Представление о DeepLearning

Новые идеи. Rectified linear units и ее обобщения. Softmax. Кроссэнтропия. Инициализация. Декорреляция. Big Data. Каскад Хаара. Сверточные слои (convolution layer).

Занятие 06. Регуляризация. Назначение и примеры использования

Пример применения регуляризации. Нормальные уравнения линейного регрессионного анализа. Добавление регуляризационного слагаемого в нормальные уравнения. Особая роль свободного члена. Пример: аппроксимация точек многочленом. Выборка валидации. Варианты регуляризационного слагаемого (ridge regression, lasso). SVD разложение при построении рекомендательной системы.

Занятие 07. SVD разложение (Singular Value Decomposition)

Спектральное разложение матрицы, метод главных компонент (факторный анализ), оценка матрицы корреляций. Связь между ними. SVD разложение. SVD разложение и анализ главных компонент. SVD разложение как основа латентно - семантического анализа (LSA). SVD разложение при построении рекомендательной системы. SVD разложение матрицы данных, содержащей пропуски. Метод Simon'a Funk'a Регуляризация в методе Simon'a Funk'a. Процедуры R, реализующие SVD разложение (классическое и Funk'a). Примеры проведения SVD разложения в R.

Занятие 08. XGboost

Теоретическое обоснование метода. Пример решения задачи в R с использованием XGboost.

Занятие 10. Ядерные оценка плотности. Непараметрическая регрессия.

Ядерная оценка плотности и гистограмма. Оценка Розенблата-Парзена. Ядро оценки. Ширина окна. Кластеризация. Непараметрическая (ядерная) регрессия. Оценка Надарая-Ватсона.