L'application de synthèse vocale d'ElevenLabs', Reader, a récemment été lancée à l'échelle mondiale. La startup, reconnue pour ses solutions basées sur l'IA pour générer et éditer des voix synthétiques, a étendu la portée de l'application pour englober 32 langues. Initialement lancé en juin aux États-Unis, au Royaume-Uni et au Canada, Reader permet aux utilisateurs de télécharger du contenu textuel tel que des articles, des PDF ou des livres électroniques et de le faire raconter dans une sélection de langues et de voix. La prise en charge linguistique étendue inclut désormais le portugais, l'espagnol, le français, l'hindi, l'allemand, le japonais, l'arabe, le coréen, l'italien, le tamoul et le suédois, entre autres.
ElevenLabs, une entreprise qui a récemment obtenu le statut de licorne en levant 80 millions de dollars auprès d'investisseurs comme Andreessen Horowitz, propose une API pour diverses applications telles que le doublage et la synthèse vocale. Ils sont chargés d'alimenter les interactions vocales sur le Rabbit r1 et de fournir des capacités de synthèse vocale pour les plates-formes basées sur l'IA, notamment Perplexity, ainsi que des services audio tels que Pocket FM et Kuku FM. Reader est le premier produit d’ElevenLabs destiné au consommateur.
La startup a également élargi sa bibliothèque en incorporant de nombreuses nouvelles voix, adaptées à différentes langues. Lors d'un développement récent, ElevenLabs a obtenu des licences pour que les voix d'acteurs estimés, notamment Judy Garland, James Dean, Burt Reynolds et Sir Laurence Olivier, soient intégrées dans l'application.
Les capacités linguistiques améliorées de l'entreprise sont alimentées par le modèle Turbo v2.5, qui a été introduit le mois dernier pour réduire la latence de conversion du texte en parole pendant améliorant simultanément sa qualité.
L'un des principaux concurrents de Reader est Speechify, qui fournit des fonctionnalités telles que la numérisation de texte, l'intégration avec Gmail et Canvas, ainsi que la possibilité pour les utilisateurs d'accéder à des capacités de clonage vocal pour lire du texte. De plus, l'application audio basée sur Audm de Mozilla et du New York Times permet aux utilisateurs de consommer du contenu en écoutant.
ElevenLabs envisage d'étendre Reader en incorporant des fonctionnalités supplémentaires telles que la prise en charge hors ligne et la possibilité de partager des extraits audio.