Рекомендательные системы на практике
Санкт-Петербург, осень 2021
Описание
Старт курса – 15 октября.
Область рекомендательных систем (RecSys) в машинном обучении стоит некоторым особняком: проблемы, которые встречаются здесь, достаточно специфичны и малоизвестны. Цель курса – осветить некоторые теоретические проблемы, важные при построении современных RecSys на практике: contextual/collaborative, exploration/exploitation, counterfactual learning/offline validation. В курсе будет разобрано построение RecSys на примере рекомендации онлайн-рекламы.
От слушателей требуются базовые знания теории вероятностей и линейной алгебры. Желательно знакомство с основными концепциями машинного обучения (как минимум, понимание линейных моделей). Практические задания будут приниматься на Python.
Программа курса
Понятие рекомендательной системы. Примеры. Простые рекомендации. Типы фидбека. Рекомендации в рекламе. Качество рекомендаций.
Рекомендации с помощью линейных моделей. Свойства, плюсы, минусы. Применение в рекламе. Проблема sparse данных.
Exploration/exploitation traidoff. Базовые понятия reinforcement learning. Простой многорукий бандит.
Многорукие бандиты в реальном мире. Контекстуальные бандиты. Линейный бандит.
Collaborative рекомендательные системы. RесSys на основе SVD разложения и эволюция SVD-like рекомендаций.
Factorization machine. Field-aware FM как слияние contextual и collaborative рекомендаций.
Проблема оффлайн валидации. Popularity bias. Элементы counterfactual learning. IPS как оффлайн метрика. Симулятор среды.
Различные практические вопросы:
способы построения сложных, многоэлементных рекомендаций;
соблюдение требований на скорость обновления рекомендаций;
мониторинг RесSys.
Критерий сдачи курса
В курсе предполагается выполнение 4 домашних работ и их защита.
Возможные баллы по задачам:
Первая задача - до 4 баллов включительно;
Вторая задача - до 6;
Третья задача - до 4;
Четвертая задача - до 5.
По оценкам:
с 8 баллов - удовл;
с 11 баллов - хор;
с 15 баллов - отл.
Литература
Линейные модели в рекламе:
Olivier Chapelle, Eren Manavoglu, Romer Rosales, Simple and scalable response prediction for display advertising
https://people.csail.mit.edu/romer/papers/TISTRespPredAds.pdf
Wide & Deep Learning for Recommender Systems https://arxiv.org/pdf/1606.07792.pdf
Многорукие бандиты
Dorota Głowacka (2019), “Bandit Algorithms in Information Retrieval” https://glowacka.org/files/bandit_book.pdf
Daniel J. Russo, Benjamin Van Roy, Abbas Kazerouni, Ian Osband and Zheng, A Tutorial on Thompson Sampling
https://web.stanford.edu/~bvr/pubs/TS_Tutorial.pdf
Olivier Chapelle, Lihong Li, An Empirical Evaluation of Thompson Sampling
https://papers.nips.cc/paper/2011/file/e53a0a2978c28872a4505bdb51db06dc-Paper.pdf
Факторизационные алгоритмы
Yehuda Koren, Robert Bell and Chris Volinsky, Matrix Factorization Techniques for Recommender Systems
https://datajobs.com/data-science-repo/Recommender-Systems-[Netflix].pdf
Steffen Rendle, Factorization Machines
https://www.csie.ntu.edu.tw/~b97053/paper/Rendle2010FM.pdf
Yuchin Juan, Yong Zhuang, Wei-Sheng Chin, Chih-Jen Lin, Field-aware Factorization Machines for CTR Prediction
https://www.csie.ntu.edu.tw/~cjlin/papers/ffm.pdf
Контерфактуальный анализ
Miroslav Dud´ık, Dumitru Erhan, John Langford and Lihong Li, Doubly Robust Policy Evaluation and Optimization
https://arxiv.org/pdf/1503.02834.pdf
Здесь пока нет видео, но обещают скоро выложить.
Yuta Saito, Thorsten Joachims
Counterfactual Learning and Evaluation for Recommender Systems: Foundations, Implementations, and Recent Advances
https://sites.google.com/cornell.edu/recsys2021tutorial

