Анализ данных с помощью языка R
Санкт-Петербург / осень 2014, посмотреть все семестры

Введение в R

  • Элементы программирования в R.
  • Построение графиков и диаграмм средствами Base R. Описательные статистики.

Проверка статистических гипотез * Тест для пропорций * Критерии Стьюдента * Критерий Ливиня * Критерий Уилкоксона-Манна-Уитни

Линейный регрессионный анализ * Отбор переменных, коллинеарность, влиятельные наблюдения, анализ остатков. Непараметрическая регрессия (ядерное сглаживание) * Прогнозирование коротких рядов с сезонной составляющей с помощью линейной регрессии

Кластерный анализ * Иерархический кластерный анализ. Метод к-средних. * Метод к-медоидов.

Распознавание образов (Machine Learning) * Наивный Байес * Метод k-го ближайшего соседа Деревья классификации (CART). Случайные леса * AdaBoost * Gradient boosting machine

Прогнозирование * Сезонная декомпозиция (X-1) Экспоненциальное сглаживание * Дисперсионный анализ (ANOVA)

Оценки за курс

Слушателям будут выданы 14 лабораторных работ. Оценка за курс выставляется по следующему правилу:

  • Отлично — зачтены все работы;
  • Хорошо – зачтены все работы, кроме одной;
  • Удовлетворительно – зачтены все работы, кроме двух;
  • Неудовлетворительно — в остальных случаях.

Что нужно знать, чтобы слушать курс

Предполагается, что слушатели курса уже прослушали курс теории вероятностей.

Литература

  • C. Bishop Pattern Recognition and Machine Learning.
  • James, Witten, Hastie, Tibshirani. An Introduction to Statistical Learning. With Applications in R.
  • Hastie, Tibshirani, Friedman. The Elements of Statistical Learning_Data Mining, Inference, and Prediction 2+ed
  • M. Crawley. The R Book.
  • R. Kabacoff R in Action. Data analysis and graphics with R.
Дата и время Название Место Материалы
16 сентября
18:30–19:50
Элементы программирования в R, лекция Таймс, ауд. с белыми досками Нет
16 сентября
20:00–21:20
Элементы программирования в R, семинар Таймс, ауд. с белыми досками Нет
23 сентября
18:30–19:50
Кластерный анализ, лекция Таймс, ауд. с белыми досками Нет
23 сентября
20:00–21:20
Кластерный анализ, семинар Таймс, ауд. с белыми досками Нет
30 сентября
18:30–19:50
Проверка статистических гипотез, лекция Таймс, ауд. с белыми досками Нет
30 сентября
20:00–21:20
Проверка статистических гипотез, семинар Таймс, ауд. с белыми досками Нет
07 октября
18:30–19:50
Проверка статистических гипотез, семинар Таймс, ауд. с белыми досками Нет
07 октября
20:00–21:20
Проверка статистических гипотез, семинар Таймс, ауд. с белыми досками Нет
14 октября
18:30–19:50
Проверка статистических гипотез, семинар Таймс, ауд. с белыми досками Нет
14 октября
20:00–21:20
Линейный регрессионный анализ, лекция Таймс, ауд. с белыми досками Нет
21 октября
18:30–19:50
Линейный регрессионный анализ, семинар Таймс, ауд. с белыми досками Нет
21 октября
20:00–21:20
Прогнозирование, семинар Таймс, ауд. с белыми досками Нет
28 октября
18:30–19:50
Прогнозирование. Экспоненциальное сглаживание., семинар Таймс, ауд. с белыми досками Нет
28 октября
20:00–21:20
Machine Learning. Метод к-го ближайшего соседа, семинар Таймс, ауд. с белыми досками Нет
04 ноября
18:30–21:20
Праздник... занятия не будет, лекция Таймс, ауд. с белыми досками Нет
11 ноября
18:30–19:50
Machine Learning. Деревья классификации. Случайные леса, семинар Таймс, ауд. с белыми досками Нет
18 ноября
18:30–21:20
Conjoint (совместный анализ). Деревья классификации. Случайные леса, семинар Таймс, ауд. с белыми досками Нет
25 ноября
18:30–21:20
Деревья классификации. Случайные леса. Adaboost, семинар Таймс, ауд. с белыми досками Нет
02 декабря
18:30–19:50
Adaboost, семинар Таймс, ауд. с белыми досками Нет
02 декабря
20:00–21:20
Сдаем лабораторные работы, семинар Таймс, ауд. с белыми досками Нет
09 декабря
18:30–21:20
Сдаем лабораторные работы, семинар Таймс, ауд. с белыми досками Нет