ElevenLabs расширяет глобальное приложение Reader за счет поддержки 32 языков

ElevenLabs расширяет глобальное приложение Reader за счет поддержки 32 языков

Приложение для преобразования текста в речь ElevenLabs', Reader, недавно было запущено во всем мире. Стартап, известный своими решениями на базе искусственного интеллекта для создания и редактирования синтетических голосов, расширил возможности приложения до 32 языков. Первоначально запущенный в июне в США, Великобритании и Канаде, Reader позволяет пользователям загружать текстовый контент, такой как статьи, PDF-файлы или электронные книги, и озвучивать его на различных языках и голосами. Расширенная языковая поддержка теперь включает, среди прочего, португальский, испанский, французский, хинди, немецкий, японский, арабский, корейский, итальянский, тамильский и шведский.

ElevenLabs, компания, которая недавно достигла статуса единорога, получив 80 миллионов долларов от таких инвесторов, как Андреессен Горовиц, предлагает API для различных приложений, таких как дублирование и преобразование текста в речь. Они отвечают за голосовое взаимодействие на Rabbit r1 и предоставление возможностей преобразования текста в речь для платформ, управляемых искусственным интеллектом, включая Perplexity, а также аудиосервисы, такие как Pocket FM и Kuku FM. Reader — первый продукт ElevenLabs, ориентированный на потребителя.

Стартап также расширил свою библиотеку, включив в нее множество новых голосов, адаптированных для разных языков. В ходе недавней разработки ElevenLabs получила лицензии на голоса уважаемых актеров, включая Джуди Гарленд, Джеймса Дина, Берта Рейнольдса и сэра Лоуренса Оливье, для интеграции в приложение.

Расширенные языковые возможности компании основаны на модели Turbo v2.5, которая была представлена ​​в прошлом месяце для уменьшения задержки при преобразовании текста в речь при одновременно улучшая его качество.

Основным конкурентом Reader является Speechify, который предоставляет такие функции, как сканирование текста, интеграцию с Gmail и Canvas, а также предоставляет пользователям доступ к возможностям клонирования голоса для чтения текста. Кроме того, Pocket от Mozilla и аудиоприложение на базе Audm от The New York Times позволяют пользователям потреблять контент посредством прослушивания.

ElevenLabs рассматривает возможность расширения Reader за счет включения дополнительных функций, таких как автономная поддержка и возможность обмениваться аудиофрагментами.

Изображение предоставлено: ElevenLabs

Code Labs Academy © 2025 Все права защищены.