Визуализация данных

Санкт-Петербург [compsciclub.ru], осень 2016

Описание

Мир полон данных самой различной природы: метеорологические, экономические, социологические данные, информация о бизнес-процессах, — всё это доступно сегодня, как никогда. Данных много, но сами по себе они мало кому нужны: людям хочется делать какие-то выводы на основе этих данных. Загружать данные непосредственно в мозг мы, увы, пока не можем, поэтому приходится пользоваться традиционными каналами восприятия, самый мощный из которых — зрительный. Здесь и возникает задача визуализации данных, оказывающаяся подчас далеко не тривиальной. Подзадачи, входящие в эту глобальную задачу, лежат в областях науки самой разной степени «гуманитарности» — от психологии восприятия до математических методов статистики. Мы, конечно, сосредоточимся на информатико-математическом конце шкалы, но немного затронем и нематематический тривиум этой области.

  1. обзор: какие данные приходится визуализировать, как давно это начали делать и что умеют делать сейчас,
  2. что делать, когда измерений у данных много (к примеру, данные — результаты анкетирования населения по анкете со 100 вопросами), а их нужно изобразить на обычном двумерном холсте, — рассмотрим, как минимум, алгоритмы t-SNE и самоорганизующися карты Кохонена,
  3. как изображать данные, естественно представимые в виде графа (например, социальные сети), чтобы были видны «ключевые» вершины, сообщества, пучки связей между группами,
  4. какие чисто инженерные средства есть у современного компьютерно грамотного человека, чтобы эффективно представить данные,
  5. что такое хорошо и что такое плохо в визуализации данных, — поговорим о best practices и, для контраста, worst practices.
Оценка за курс выставляется по результатам выполнения практических заданий, посвященным реализации рассказанных на лекциях алгоритмам и подходам.

Преподаватели