Классификация текстов

Понедельник, 03 марта 2014
ФМЛ 239, Актовый зал

Слайды с лекции

nlp_lecture_030314.pdf

Описание

В лекции представлены подходы к категоризации (классификация) текстов, например по их тематике (спорт/экономика/…). Рассмотрены такие аспекты, как подготовка данных, выбор атрибутов (признаков) для классификации, работа методов классификации и оценка качества результатов. Методы классификации, представленные в лекции: к-ближайших соседей, линейная и логистическая регрессии, метод опорных векторов, деревья решений и др. В конце лекции приводится сравнение эффективности различных методов классификации текстов на основе новостного набора данных.