Занятие 11. Случайные леса. Gradient boosting machine.
Анализ данных на R в примерах и задачах, часть 1


Что: Лекция
Когда: Среда, 20 апреля 2016, 18:30–21:20
Где: Таймс, ауд. с белыми досками
Слайды: data_mining_r_problems_lecture_200416.odp

Описание

Приемы объединения классификаторов: Stacking, bagging и boosting.

Случайные леса. Bagging. Библиотека RandomForest. Ключевые параметры модели. Out-of-bag error. Информативность переменных (Importance). Анализ несбалансированных выборок. Определение числа деревьев.

Gradient boosting machine. Boosting. Библиотека gbm. gbm и TreeNet. Ключевые параметры модели.

Видео

Материалы

Приложенные файлы