Анализ данных с помощью языка R
Санкт-Петербург, осень 2014
Описание
Введение в R
- Элементы программирования в R.
- Построение графиков и диаграмм средствами Base R. Описательные статистики.
Проверка статистических гипотез * Тест для пропорций * Критерии Стьюдента * Критерий Ливиня * Критерий Уилкоксона-Манна-Уитни
Линейный регрессионный анализ * Отбор переменных, коллинеарность, влиятельные наблюдения, анализ остатков. Непараметрическая регрессия (ядерное сглаживание) * Прогнозирование коротких рядов с сезонной составляющей с помощью линейной регрессии
Кластерный анализ * Иерархический кластерный анализ. Метод к-средних. * Метод к-медоидов.
Распознавание образов (Machine Learning) * Наивный Байес * Метод k-го ближайшего соседа Деревья классификации (CART). Случайные леса * AdaBoost * Gradient boosting machine
Прогнозирование * Сезонная декомпозиция (X-1) Экспоненциальное сглаживание * Дисперсионный анализ (ANOVA)
Оценки за курс
Слушателям будут выданы 14 лабораторных работ. Оценка за курс выставляется по следующему правилу:
Отлично
— зачтены все работы;Хорошо
– зачтены все работы, кроме одной;Удовлетворительно
– зачтены все работы, кроме двух;Неудовлетворительно
— в остальных случаях.
Что нужно знать, чтобы слушать курс
Предполагается, что слушатели курса уже прослушали курс теории вероятностей.
Литература
- C. Bishop Pattern Recognition and Machine Learning.
- James, Witten, Hastie, Tibshirani. An Introduction to Statistical Learning. With Applications in R.
- Hastie, Tibshirani, Friedman. The Elements of Statistical Learning_Data Mining, Inference, and Prediction 2+ed
- M. Crawley. The R Book.
- R. Kabacoff R in Action. Data analysis and graphics with R.
Преподаватели
Список лекций
- Построение графиков и диаграмм средствами Base R.
- Описательные статистики в R.
- Квантили.
- Среднее, медиана, мода.
- Дисперсия, IQR.
- Выбор описательных статистик в конкретной задаче.
- Иерархический кластерный анализ. Метод к-средних.
- Метод к-медоидов.
- A/B тестирование: Тест для пропорций
- Сравнение типичных значений выборок: Критерии Стьюдента, Критерий Ливиня, Критерии Уилкоксона-Манна-Уитни
Тестовая информация