Методы машинно-ориентированной оптимизации нейронных сетей для задачи компрессии видео
Краткое описание
Проведён анализ различных нейросетевых подходов, позволяющих решить задачу эффективного сжатия видео как для человеческого восприятия, так и для машинной аналитики. Рассмотрены три метода сжатия изображений/видео с представленными функциями потерь, решающие поставленную задачу. На основе проведённого сравнения предложена функция потерь для обучения нейросетевого кодека, учитывающая достоинства и недостатки рассмотренных функций, а также предложено дальнейшее развитие на основе полученных результатов.
Ключевые слова
Кодирование видеопотока, Кодирование особенностей изображений, Глубокое обучение, Машинная аналитика, Кодирование видео для машин, Нейросетевые кодеки, Многослойные схемы кодирования, Video stream coding, Image features coding, Deep learning, Machine analytics, Video coding for machines, Neural network codecs, Multilayer coding schemes