Марковские модели и элементы теории информации

Вторник, 01 октября 2019

Таймс, ауд. 410

Список тем / 23 записи

Введение. Задачи обработки языка в информационном поиске.

Строки, расстояния, регулярные выражения

Нейронные сети - I

Языковое моделирование

Нейронные сети - II. Регуляризация. Методы обучения. Нейронное вероятностное языковое моделирование.

Нейронные сети -- III. Рекуррентные нейронные сети. SimpleRNN, LSTM, AWD-LSTM.

7.

Марковские модели и элементы теории информации

Векторная семантика — I. Sparse vectors: DTM, word-context matrices, HAL.

Векторная семантика — II. Dense vectors: SVD, LSA, word2vec, fastText.

Кластеризация: распространённые методы. Brown clustering.

Обнаружение дубликатов: шинглы, MinHash, LSH

Тематическое моделирование: NMF, pLSA, LDA, ARTM, NTM, ABAE.

Тематическое моделирование

Разметка последовательностей: local classifiers, HMM, Structured Perceptron, CRF

Разметка последовательностей: RNN-based, BiLSTM-CRF

Классификация

Вычислительный синтаксис — I: ГНС (PSG)

Вычислительный синтаксис — II: ГЗ (DG)

Введение в машинный перевод: оценка качества, алгоритмы выравнивания

Классификация — II. Свёрточные нейронные сети

Sequence-to-sequence. Механизм внимания. Закон Ципфа vs NMT

Архитектура "Transformer" для sequence-to-sequence

Слайды с лекции

introduction_nlp_lecture_011019.pdf

Приложенные файлы

kl-divergence-positive.pdf

Описание

Работа, о которой речь идёт перед лекцией: https://openai.com/blog/unsupervised-sentiment-neuron/

Также приложено доказательство неотрицательности дивергенции Кульбака-Лейблера.