Ứng dụng chuyển văn bản thành giọng nói ElevenLabs', Reader, gần đây đã được ra mắt trên toàn cầu. Công ty khởi nghiệp, được công nhận nhờ các giải pháp hỗ trợ AI để tạo và chỉnh sửa giọng nói tổng hợp, đã mở rộng phạm vi tiếp cận của ứng dụng sang 32 ngôn ngữ. Được ra mắt lần đầu vào tháng 6 tại Hoa Kỳ, Vương quốc Anh và Canada, Reader cho phép người dùng tải lên nội dung dựa trên văn bản như bài báo, tệp PDF hoặc sách điện tử và kể lại nội dung đó bằng nhiều ngôn ngữ và giọng nói chọn lọc. Hỗ trợ ngôn ngữ mở rộng hiện bao gồm tiếng Bồ Đào Nha, tiếng Tây Ban Nha, tiếng Pháp, tiếng Hindi, tiếng Đức, tiếng Nhật, tiếng Ả Rập, tiếng Hàn, tiếng Ý, tiếng Tamil và tiếng Thụy Điển, cùng nhiều ngôn ngữ khác.
ElevenLabs, một công ty gần đây đã đạt được trạng thái kỳ lân bằng cách huy động được 80 triệu đô la từ các nhà đầu tư như Andreessen Horowitz, cung cấp API cho nhiều ứng dụng khác nhau như lồng tiếng và chuyển văn bản thành giọng nói. Họ chịu trách nhiệm hỗ trợ tương tác bằng giọng nói trên Rabbit r1 và cung cấp khả năng chuyển văn bản thành giọng nói cho các nền tảng do AI điều khiển, bao gồm Perplexity, cũng như các dịch vụ âm thanh như Pocket FM và Kuku FM. Reader là sản phẩm hướng đến người tiêu dùng đầu tiên của ElevenLabs.
Công ty khởi nghiệp này cũng đã mở rộng thư viện của mình bằng cách kết hợp nhiều tiếng nói mới, phù hợp với nhiều ngôn ngữ khác nhau. Trong một quá trình phát triển gần đây, ElevenLabs đã nhận được giấy phép lồng tiếng cho các diễn viên đáng kính bao gồm Judy Garland, James Dean, Burt Reynolds và Sir Laurence Olivier để tích hợp vào ứng dụng.
Khả năng ngôn ngữ nâng cao của công ty được hỗ trợ bởi mẫu Turbo v2.5, được giới thiệu vào tháng trước để giảm độ trễ khi chuyển đổi văn bản thành giọng nói trong khi đồng thời nâng cao chất lượng của nó.
Đối thủ cạnh tranh chính của Reader là Speechify, cung cấp các chức năng như quét văn bản, tích hợp với Gmail và Canvas, cũng như cho phép người dùng truy cập vào khả năng nhân bản giọng nói để đọc văn bản. Ngoài ra, ứng dụng âm thanh dựa trên Audm của Mozilla và The New York Times cho phép người dùng xem nội dung thông qua việc nghe.
ElevenLabs đang xem xét mở rộng Reader bằng cách kết hợp các tính năng bổ sung như hỗ trợ ngoại tuyến và khả năng chia sẻ đoạn âm thanh.