Математическая статистика
Санкт-Петербург, весна 2022
Описание
Математическая статистика – это раздел математики, который занимается описанием и анализом данных для построения вероятностных моделей случайных явлений, эти данные породивших. Описанное промежуточное положение между реальными наблюдениями и абстрактными вероятностными моделями делает математическую статистику основным инструментом решения прикладных задач, в которых неопределённость интерпретируется как случайность.
Этот курс является логическим продолжением/обобщением курса Введение в математическую статистику, который был прочитал в CS клубе. Если в том курсе мы в основном разбирались с проблемой диагностики: Чему равна некоторая характеристика нашей модели?
, Насколько качественен имеющийся инструмент?
, Насколько имеющаяся модель соответствует данным?
, – и это нам удавалось сделать чисто прикладными методами, то в этом курсе мы также коснемся теоретической стороны вопроса: Как найти лучшую модель?
, Как найти лучший инструмент?
, Что делать, если прикладные методы неприменимы или затратны?
. Для прохождения этого курса знакомство с тем курсом не обязательно, но его можно использовать в качестве дополнительного материала.
Практические задания упомянутого курса оформлены в виде курса на stepik. Его можно использовать как хорошее приближение того, чем мы будем заниматься в этом курсе на практике.
Практики
Для практик понадобится Jupyter Notebook с установленными модулями numpy
, scipy
, pandas
, matplotlib
, seaborn
, plotly
, statsmodels
и sklearn
.
Оценка за курс
В курсе будет 12 домашних заданий и письменный экзамен в конце. Оценка считается по формуле:
round(0.66 * (средняя оценка за 11 лучших домашек) + 0.33 * (оценка за экзамен))
Пререквизиты
Теория вероятностей: в объеме стандартного вузовского курса (например, этого). Кроме этого понадобятся случайные вектора (совместное и маргинальное распределения, матожидания, матрица ковариации и их свойства), многомерное нормальное распределение и условное матожидание. По последним двум темам можно почитать вот эти пдфки.
Python: в курсе вам придется решать задачи, аналогичные задачам упомянутого выше курса на степике.
Дополнительные материалы
- М.Б. Лагутин, Наглядная математическая статистика – легко читается, много дополнительной информации
- Н.И. Чернова, Математическая статистика – чуть более сухо, но зато короче
- Improving your statistical inferences — короткий и очень полезный курс на курсэре про разные подходы к статистическому выводу
- T. Hesterberg, What Teachers Should Know about the Bootstrap: Resampling in the Undergraduate Statistics Curriculum — хорошее пособие по бутстрапу
- A. Gelman, J. Carlin, H. Stern, D. Dunson, A. Vehtari, and D. Rubin, Bayesian Data Analysis — замечательная книга про байесовские методы
- R. Wilcox, Introduction to Robust Estimation and Hypothesis Testing — учебник по робастным оценкам
- Я.Р. Магнус, П.К. Катышев, А.А. Пересецкий, Эконометрика. Начальный курс — отсюда нам понадобится линейная регрессия со стохастическими регрессорами
- A.W. van der Vaart, Asymptotic statistics — продвинутый учебник по асимптотической статистике