Прорыв OpenAI в клонировании голоса

Прорыв OpenAI в клонировании голоса

Недавно компания OpenAI раскрыла информацию о запуске Voice Engine – новейшей технологии клонирования голоса, способной имитировать голос любого человека всего лишь на основе пятнадцатисекундной звукозаписи. Утверждается, что данная система способна генерировать убедительные эмоционально окрашенные голосовые сообщения. Разработка стала возможной благодаря предшествующему опыту OpenAI в сфере преобразования текста в речь и находится в работе с 2022 года. Примеры уже существующего инструмента можно услышать в официальном блоге компании, где продемонстрированы записи, которые пугающе точно воспроизводят реальные голоса.

OpenAI видит в Voice Engine большой потенциал для помощи людям с нарушениями речи, перевода, а также в качестве ассистента для чтения. В частности, была упомянута успешная инициатива с участием университета Брауна, где технология помогла человеку с речевыми нарушениями. Тем не менее, существует опасность, что нововведение могут использовать в корыстных целях, в частности для создания ложных медиаматериалов. В свете этого и возможных угроз личной жизни, компания заявила о необходимости введения мер безопасности перед полноценным запуском технологии. К таким мерам относятся, например, цифровое отслеживание происхождения голосовых сообщений, а также активный мониторинг использования системы.

Больше статей и видео в нашем Дзен-канале

Более того, испытатели должны согласиться с правилами использования OpenAI, которые запрещают имитацию чужого голоса без разрешения. И обязуются информировать аудиторию о том, что голос создан искусственным интеллектом. В планах компании также наличие списка голосов, которые ИИ не будет копировать без специального разрешения. Когда именно состоится коммерческий релиз технологии, OpenAI не раскрывает. Однако появилась информация, что стоимость его использования будет конкурентоспособной по сравнению с другими предложениями на рынке, такими как ElevenLabs, предположительно составляя $15 за миллион символов речи, что эквивалентно примерно 162 500 словам.

В дополнение к деятельности в области голосового ИИ, OpenAI также объявила о партнерстве с Microsoft в целях создания искусственного интеллекта для суперкомпьютера под названием «Stargate», инвестиции в который, согласно информации от The Information, могут достигнуть поразительных $100 миллиардов.

5 2 голоса
Рейтинг статьи

Подписаться
Уведомить о
guest

0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии
Рекомендуем прочитать
terramaster d6 320