Анализ изображений и видео, часть 1

Санкт-Петербург, осень 2021

Описание

Курс проходит онлайн, по понедельникам с 18:30

Описание

В курсе по компьютерному зрению вы познакомитесь с тем, как с помощью компьютера можно интерпретировать различные визуальные данные. Мы пройдем полный путь изучения алгоритмов, которые применяются с момента, как на ПЗС матрицу камеры накапливается сигнал, до момента, когда мы, например, сможем найти треки объектов на видео, которое записывает эта камера. Уделим основное внимание тому, как извлечь из изображения семантическую информацию разного уровня сложности. Рассмотрим эвристические алгоритмы, с помощью которых наши деды делали компьютерное зрение можно строить вычислительно эффективные интерпретируемые решения полезные на начальном этапе решения бизнес задач связанных с анализом изображений. Разберемся с самыми разными гистрограммами и поиском ключевых точек. Проложим мостик от классических алгоритмов машинного обучения (Деревья, SVM, Градиентный бустинг) к глубоким нейронным сетям. Применение глубоких сетей в компьютерном зрении – стандарт современной индустрии. Большинство задач поиска, детекции и классификации решается с помощью нейросетей. Мы с вами прорешаем и эти задачи тоже: рассмотрим данные архитектуры и метрики, которые используются.

Пререквизиты

– Программирование на python.

– Машинное обучение.

Где понадобится

В работе на должности Data Scientist, Computer Vision Engineer, Computer Vision Researcher.

Содержание

– Базовая обработка изображений. Работа с цветовыми пространствами.

– Обработка изображений с помощью фильтров. Физический смысл фильтров. Преобразование Фурье.

– Локальные и глобальные эвристические признаки для изображений.

– Параметрические модели: преобразование Хафа, RANSAC.

– Классификация изображений.

– Нейросети для изображений. Базовые слои и архитектуры.

– Детектирование объектов: от Viola Jones до YOLO.

– Сегментация изображений. От GraphСut до Mask-RCNN.

– Генеративные сети для изображений: Style Transfer,CycleGAN etc

– Цифровой фотомонтаж.

– Извлечение фона, оптический поток.

Вы научитесь

– Строить эвристические алгоритмы для простейших бейзлайнов.

– Оценивать, как качество и скорость работы алгоритмов зависит от данных, моделей, фреймворков, вычислительных компонент.

Преподаватели