Распознавание речи в «VK Видео» улучшилось на 25% благодаря ИИ

17 сентября 2024

Технологии искусственного интеллекта дали возможность платформе «VK Видео» повысить точность анализа и расшифровки речи на 25 %. Новые алгоритмы ИИ внедрены для автоматического распознавания речи и создания субтитров в роликах, шоу, клипах и других типах контента.

Нейросети активно развиваются и адаптируются к человеческой речи. В их словаре уже присутствуют тысячи новых слов, включая мемы, акронимы, имена собственные и профессиональные термины. В ближайшем будущем ИИ научится разделять речь разных спикеров на отдельные реплики, что сделает субтитры еще более понятными.

За последний месяц использование функции субтитров в веб-версии платформы «VK Видео» увеличилось на 28 %. В настоящее время субтитры – важный инструмент для 11 % всей аудитории сервиса. Эта технология особенно полезна для людей с нарушениями слуха и в ситуациях, когда необходимо просматривать видео без звука.

Субтитры формируются автоматически с помощью ML-моделей, которые создают текст, расставляют знаки препинания и синхронизируют его с видео. Аудиопоток обрабатывается в несколько этапов для повышения точности. Сначала нейросеть распознает речь и преобразует её в текст, удаляя посторонние шумы. Затем модели пунктуации и денормализации формируют из распознанных слов читабельный текст. В конце текст синхронизируется с аудиодорожкой, что делает субтитры как для профессиональных, так и для любительских видео удобными и понятными.

Источник: CNews

Другие новости

На дне рождения радио «Восток FM» прозвучали хиты Михаила Гуцериева

В Москве в Live Арене 16 ноября прошёл масштабный концерт «Звёзды Востока», приуроченный к 12-му…

Доказать участие в СВО можно с помощью нотариусов

Военнослужащие содействующих военных компаний для получения удостоверения ветерана боевых действий смогут подтвердить участие в СВО…