Анализ данных с помощью языка R

Санкт-Петербург, осень 2014

Описание

Введение в R

  • Элементы программирования в R.
  • Построение графиков и диаграмм средствами Base R. Описательные статистики.

Проверка статистических гипотез * Тест для пропорций * Критерии Стьюдента * Критерий Ливиня * Критерий Уилкоксона-Манна-Уитни

Линейный регрессионный анализ * Отбор переменных, коллинеарность, влиятельные наблюдения, анализ остатков. Непараметрическая регрессия (ядерное сглаживание) * Прогнозирование коротких рядов с сезонной составляющей с помощью линейной регрессии

Кластерный анализ * Иерархический кластерный анализ. Метод к-средних. * Метод к-медоидов.

Распознавание образов (Machine Learning) * Наивный Байес * Метод k-го ближайшего соседа Деревья классификации (CART). Случайные леса * AdaBoost * Gradient boosting machine

Прогнозирование * Сезонная декомпозиция (X-1) Экспоненциальное сглаживание * Дисперсионный анализ (ANOVA)

Оценки за курс

Слушателям будут выданы 14 лабораторных работ. Оценка за курс выставляется по следующему правилу:

  • Отлично — зачтены все работы;
  • Хорошо – зачтены все работы, кроме одной;
  • Удовлетворительно – зачтены все работы, кроме двух;
  • Неудовлетворительно — в остальных случаях.

Что нужно знать, чтобы слушать курс

Предполагается, что слушатели курса уже прослушали курс теории вероятностей.

Литература

  • C. Bishop Pattern Recognition and Machine Learning.
  • James, Witten, Hastie, Tibshirani. An Introduction to Statistical Learning. With Applications in R.
  • Hastie, Tibshirani, Friedman. The Elements of Statistical Learning_Data Mining, Inference, and Prediction 2+ed
  • M. Crawley. The R Book.
  • R. Kabacoff R in Action. Data analysis and graphics with R.

Преподаватели

Список лекций

Элементы программирования в R
  • Построение графиков и диаграмм средствами Base R.
  • Описательные статистики в R.
  • Квантили.
  • Среднее, медиана, мода.
  • Дисперсия, IQR.
  • Выбор описательных статистик в конкретной задаче.
Кластерный анализ
  • Иерархический кластерный анализ. Метод к-средних.
  • Метод к-медоидов.
Проверка статистических гипотез
  • A/B тестирование: Тест для пропорций
  • Сравнение типичных значений выборок: Критерии Стьюдента, Критерий Ливиня, Критерии Уилкоксона-Манна-Уитни
Праздник... занятия не будет

Тестовая информация