Исследование конфигураций нейросетевых кодеков для адаптивной системы сжатия кадров FPV-видеопотока при управлении беспилотными системами. Часть I. Методика

Исследование конфигураций нейросетевых кодеков для адаптивной системы сжатия кадров FPV-видеопотока при управлении беспилотными системами. Часть I. Методика

А.А. Березкин, Санкт-Петербургский государственный университет телекоммуникаций им. проф. М.А. Бонч-Бруевича (СПбГУТ), доцент, к.т.н; berezkin.aa@sut.ru

А.А. Ченский, СПбГУТ, магистрант; chenskii.aa@sut.ru

Р.В. Киричек, СПбГУТ, ректор, профессор, д.т.н.; kirichek@sut.ru

А.А. Захаров, ФГБУ НИИР, заместитель генерального директора по науке, доцент, к.т.н.; a.zaharov@niir.ru

УДК 004.622+004.021

DOI: 10.34832/ELSV.2024.58.9.004

Аннотация. В данной работе исследованы различные конфигурации нейросетевых кодеков, разработанных на основе вариационных автокодировщиков вида VQ и KL (VQ-f4, VQ-f8, VQ-f16, KL-f4, KL-f8, KL-f16, KL-f32) из состава моделей Stable Diffusion на предмет возможности их использования для сжатия кадров видеопотока при FPV-управлении беспилотными системами. В первой части статьи обобщаются результаты исследований сжатия и квантования латентных пространств вариационных автокодировщиков, представляется модификация нейросетевого кодека, наборы данных и рассматривается методика экспериментов.

Ключевые слова: вариационный автокодировщик, квантование, сжатие данных, нейронные сети, латентное пространство признаков, сжатие видеопотока, FPV-управление, БПЛА.

Последние выпуски