Соцсеть «ВКонтакте» запустила технологию распознавания аудиосообщений. Об этом команда заявила в своем блоге. За расшифровку аудиозаписей будет отвечать искусственный интеллект. Нейросети смогут перевести русскоязычный сленг, распознать речь при фоновом шуме и расставить запятые.
На данном этапе внедрения технологии расшифровывать можно только относительно короткие сообщения до 30 секунд (однако они составляют 90% от всех голосовых внутри соцсети). Функция, работающая в мобильном приложении, открывается пользователям постепенно и появится у всех в ближайшую неделю. В следующих обновлениях сервиса разработчики хотят внедрить возможность расшифровывать сообщения большего размера и пересланные файлы, а также открыть доступ к функции с компьютера.
Директор по исследованиям в области искусственного интеллекта «ВКонтакте» Павел Калайдин пояснил, что содержание сообщений не будет доступно сотрудникам «ВКонтакте» и любым другим сторонним лицам. При испытании технологии участники программы VK Testers записывали специально подготовленные фразы и давали разработчикам обратную связь. Недавно компания представила и другие продукты с использованием технологий ИИ: сервис коротких клипов в стиле TikTok с жестовым управлением съемкой, а также нейросеть, генерирующую новостные заголовки.