Рекомендательные системы на практике

Санкт-Петербург, осень 2021

Описание

Старт курса – 15 октября.

Область рекомендательных систем (RecSys) в машинном обучении стоит некоторым особняком: проблемы, которые встречаются здесь, достаточно специфичны и малоизвестны. Цель курса – осветить некоторые теоретические проблемы, важные при построении современных RecSys на практике: contextual/collaborative, exploration/exploitation, counterfactual learning/offline validation. В курсе будет разобрано построение RecSys на примере рекомендации онлайн-рекламы.

От слушателей требуются базовые знания теории вероятностей и линейной алгебры. Желательно знакомство с основными концепциями машинного обучения (как минимум, понимание линейных моделей). Практические задания будут приниматься на Python.

Программа курса

  1. Понятие рекомендательной системы. Примеры. Простые рекомендации. Типы фидбека. Рекомендации в рекламе. Качество рекомендаций.

  2. Рекомендации с помощью линейных моделей. Свойства, плюсы, минусы. Применение в рекламе. Проблема sparse данных.

  3. Exploration/exploitation traidoff. Базовые понятия reinforcement learning. Простой многорукий бандит.

  4. Многорукие бандиты в реальном мире. Контекстуальные бандиты. Линейный бандит.

  5. Collaborative рекомендательные системы. RесSys на основе SVD разложения и эволюция SVD-like рекомендаций.

  6. Factorization machine. Field-aware FM как слияние contextual и collaborative рекомендаций.

  7. Проблема оффлайн валидации. Popularity bias. Элементы counterfactual learning. IPS как оффлайн метрика. Симулятор среды.

  8. Различные практические вопросы:

  • способы построения сложных, многоэлементных рекомендаций;

  • соблюдение требований на скорость обновления рекомендаций;

  • мониторинг RесSys.

Критерий сдачи курса

В курсе предполагается выполнение 4 домашних работ и их защита.

Возможные баллы по задачам:

  • Первая задача - до 4 баллов включительно;

  • Вторая задача - до 6;

  • Третья задача - до 4;

  • Четвертая задача - до 5.

По оценкам:

с 8 баллов - удовл;

с 11 баллов - хор;

с 15 баллов - отл.

Литература

Линейные модели в рекламе:

Olivier Chapelle, Eren Manavoglu, Romer Rosales, Simple and scalable response prediction for display advertising https://people.csail.mit.edu/romer/papers/TISTRespPredAds.pdf

Wide & Deep Learning for Recommender Systems https://arxiv.org/pdf/1606.07792.pdf

Многорукие бандиты

Dorota Głowacka (2019), “Bandit Algorithms in Information Retrieval” https://glowacka.org/files/bandit_book.pdf

Daniel J. Russo, Benjamin Van Roy, Abbas Kazerouni, Ian Osband and Zheng, A Tutorial on Thompson Sampling https://web.stanford.edu/~bvr/pubs/TS_Tutorial.pdf

Olivier Chapelle, Lihong Li, An Empirical Evaluation of Thompson Sampling https://papers.nips.cc/paper/2011/file/e53a0a2978c28872a4505bdb51db06dc-Paper.pdf

Факторизационные алгоритмы

Yehuda Koren, Robert Bell and Chris Volinsky, Matrix Factorization Techniques for Recommender Systems https://datajobs.com/data-science-repo/Recommender-Systems-[Netflix].pdf

Steffen Rendle, Factorization Machines https://www.csie.ntu.edu.tw/~b97053/paper/Rendle2010FM.pdf

Yuchin Juan, Yong Zhuang, Wei-Sheng Chin, Chih-Jen Lin, Field-aware Factorization Machines for CTR Prediction https://www.csie.ntu.edu.tw/~cjlin/papers/ffm.pdf

Контерфактуальный анализ

Miroslav Dud´ık, Dumitru Erhan, John Langford and Lihong Li, Doubly Robust Policy Evaluation and Optimization https://arxiv.org/pdf/1503.02834.pdf

Здесь пока нет видео, но обещают скоро выложить. Yuta Saito, Thorsten Joachims Counterfactual Learning and Evaluation for Recommender Systems: Foundations, Implementations, and Recent Advances https://sites.google.com/cornell.edu/recsys2021tutorial

Преподаватели