3i Technologies разработал облачный сервис для обработки ТВ и радиоконтента

Категория: Новости » Новости радио
Нравится(+) 0 Не нравится(-)

3i Technologies разработал облачный сервис для обработки ТВ и радиоконтентаС помощью облачного сервиса 3i Speech Recognition API, разработанного консорциумом 3i Technologies,стало возможно профессионально обрабатывать речевые данные из медийного контента, с высокой точностью переводить как теле- и радиоэфиры, так и имеющиеся наТВ- и радио станциях медиа-архивы в текстовый формат.

Сервис может работать с видео или аудио файлами любой длительности. Он в несколько раз быстрее реального времени обрабатывает их, выдавая на выходе «стройный» разбитый на предложения текст, в котором проставляются даже знаки препинания. Бета-версия сервиса открыта для публичного тестирования.

Сервис специально рассчитан на обработку радио- или телевизионного контента. Благодаря созданным уникальным моделям достигнута очень высокая точность распознавания. Профессионалам, работающим с медиа-контентом, этот сервис будет особенно полезным. Далее он сможет использоваться и массовым потребителем для перевода каналов с иностранного языка и для субтитрирования в режиме реального времени. «У входящих в состав 3i Technologies имеются все технологии, позволяющие создать такой продукт», - говорит Алексей Любимов, председатель совета директоров консорциума 3i Technologies.

Сервис использовал акустические и языковые модели, основанные на использовании машинного обучения, технологий рекуррентных нейронных сетей (Recurrent Neural Network, RNN) и взвешенных конечных автоматов (Weighted Finite State Transducer, WFST). Инфраструктура вычислений создана с ускорением на GPU, что дает возможность многократно увеличить производительность в сравнении с CPU.

Есть возможность адаптировать языковые модели под узкую область, что улучшит качество распознавания. У сервиса не будет проблем с переводом в текстовый формат передач отраслевого или общеэкономического характера, в которых звучит профессиональная лексика.

В своей бета-версии 3i Speech Recognition поддерживает языки русский и английский. Сервис пригодится разработчикам программного обеспечения, системным интеграторам, специалистам по созданию и обработке медиаконтента (продакшн-студии, теле-радиокомпании, креативные агентства, филансеры и т.д.). Сервис легко может быть интегрирован в приложения и в комплексные решения, созданные другими разработчиками.

Нравится(+) 0 Не нравится(-)
  • Комментарии на сайте
  • ВКонтакте
  • Facebook

Информация

Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.