Видеоданные составляют большую часть от объема всех данных, передаваемых через сеть Интернет в наши дни. В течение всего одного дня на популярные платформы для обмена видео загружается видео, общая продолжительность которого превышает продолжительность человеческой жизни. Сотни тысяч камер видеонаблюдения по всей Москве непрерывно производят потоки видеоданных. Для хранения и анализа таких гигантских объемов видеоданных требуется знакомство как с общими методами обработки и хранения больших данных, так и со специфичными для видеоданных алгоритмами.
Вводная часть курса содержит базовые сведения о способах представления и хранения изображений и видеопоследовательностей в оперативной памяти компьютера. В основной части курса рассматриваются основные задачи обработки видеопоследовательностей (обнаружение точек смены сцены, анализ движения, удаление нежелательных объектов, замена заднего плана, описание видеопоследовательностей, моделирование визуального внимания). Для каждой из задач помимо традиционных подходов к ее решению рассматриваются более современные подходы на основе нейронных сетей. Особое внимание уделяется задаче сжатия видео: рассматриваются алгоритмы, лежащие в основе современных видеокодеков, а также перспективные подходы к повышению степени сжатия путем прогнозирования визуального внимания.
В заключительной части курса рассматриваются новые форматы видео и изображений: стереоскопический, пленоптический, 360/VR. В частности, затрагиваются вопросы получения, оценки качества и обработки контента этих типов.
В ходе лекций студентам демонстрируются примеры работы всех рассматриваемых алгоритмов и проводится их сопоставление с аналогами. Студентам предлагается самостоятельно реализовать и опробовать часть алгоритмов, освещенных в курсе, в рамках самостоятельной домашней работы.