Технологии хранения и обработки больших объёмов данных
Санкт-Петербург / весна 2014, посмотреть все семестры

Курс предназначен программистам, желающим познакомиться с теоретическими и практическими аспектам технологий, связанных с хранением, обработкой, анализом больших объёмов данных и использованием их в приложениях. В основном будут рассматриваться технологии, ставшие массовыми относительно недавно, такие как распределённые файловые системы и NoSQL СУБД, но будут также затронуты возможности, предоставляемые привычными реляционных СУБД.

В материалах курса и домашних заданиях используются языки Python и Java, поэтому от слушателей требуется понимание элементарных конструкций этих языков и способность писать несложные программы, а также знание алгоритмов вообще. Знание реляционных СУБД и языка SQL тоже существенно облегчит восприятие некоторых тем курса.

Email для связи по этому курсу: bigdata@barashev.net

Дата и время Название Место Материалы
10 февраля
20:00–21:20
Распределенные файловые системы, лекция ФМЛ 239, Актовый зал слайды
17 февраля
20:00–21:20
Полнотекстовый поиск, лекция ФМЛ 239, Актовый зал другие
24 февраля
20:00–21:20
Распределенная параллельная обработка данных технологией Map-Reduce, лекция ФМЛ 239, Актовый зал другие
03 марта
20:00–21:20
PageRank и распределенные вычисления на графах, лекция ФМЛ 239, Актовый зал слайды
17 марта
20:00–21:20
NoSQL СУБД. Google Bigtable, лекция ФМЛ 239, Актовый зал другие
24 марта
20:00–21:20
NoSQL и согласованность. Percolator, лекция ФМЛ 239, Актовый зал другие
31 марта
20:00–21:20
Поиск похожих документов, лекция ФМЛ 239, Актовый зал другие
07 апреля
20:00–21:20
Алгоритмы кластеризации, лекция ФМЛ 239, Актовый зал другие
14 апреля
20:00–21:20
Консенсус в распределённой системе, лекция ФМЛ 239, Актовый зал другие
21 апреля
20:00–21:20
Лекция 10, лекция ФМЛ 239, Актовый зал Нет
28 апреля
20:00–21:20
Лекция 11, лекция ФМЛ 239, Актовый зал Нет
19 мая
20:00–21:20
Письменный экзамен, лекция ФМЛ 239, Актовый зал Нет