Ses mühendisleri sıklıkla arka plandaki gürültü nedeniyle bozulan kayıtlarla uğraşırlar, ancak AI-coustics adlı bir Alman firması, filmlerde konuşma netliğini artırmak için üretken yapay zekayı yeni bir yöntemle kullanarak bu durumu değiştirmeye çalışıyor.
AI-coustics, geleneksel gürültü bastırmanın ötesine geçen bir teknoloji sunarak 1,9 milyon Euro'luk finansmanla ilk kez sahneye çıktı. Kurucu ortak ve CEO Fabian Seipel'e göre teknolojileri, tüm cihazlarda ve hoparlörlerde ses kalitesini artırmak için tasarlandı.
Hedefleri, ister konferans görüşmesi ister sosyal medya videosu olsun, tüm dijital etkileşimleri stüdyo yayınları kadar net hale getirmektir.
AI-coustics, ses mühendisi Seipel ile Berlin Teknik Üniversitesi'ndeki makine öğrenimi öğretim görevlisi Corvin Jaedicke'nin çevrimiçi eğitim içeriğinin düşük ses kalitesi konusunda karşılıklı memnuniyetsizliğinin bir sonucu olarak 2021 yılında kuruldu. Seipel'in müzik prodüksiyonundaki ilk çalışmalarından kaynaklanan işitme kaybıyla yaşadığı mücadele, dijital ses netliğini artırmaya yönelik kişisel misyonunun ardındaki ilham kaynağıdır.
AI-coustics, gürültü azaltma teknolojisi geliştirmeye yönelik yaratıcı yaklaşımıyla, yapay zeka destekli ses iyileştirme ürünlerinin oluşturduğu kalabalık alanda kendisini farklı kılıyor.
İşletmenin, kullanıcıları eğitim veri setlerine ekleme yaptıkları için ödüllendiren algoritması, Berlin stüdyolarında kaydedilen konuşma örneklerine dayanıyor. Daha sonra bu veri kümesini, eğitim süreci sırasında çeşitli ses kusurlarını doğru bir şekilde taklit eden gürültü azaltıcı yapay zekalarını geliştirmek için kullanıyorlar.
Bununla birlikte, katkıda bulunanların tek seferlik ödeme yaklaşımı ve olası konuşma tanıma önyargıları konusunda endişeler mevcuttur. Önyargıları ortadan kaldırmak amacıyla AI-coustics, teknolojinin tüm dilsel bağlamlarda ve demografik bağlamlarda etkinliğini garanti altına almak amacıyla katılımcı tabanını çeşitlendirmeye kendini adamıştır.
Teknolojinin etkinliğini değerlendirmek için AI-coustics platformu aracılığıyla üç farklı video klip oynatıldı. Sonuçlar, arka plan gürültüsünün azaltılmasıyla konuşma netliğinde önemli bir iyileşme olduğunu gösterdi.
AI-coustics, tekniklerini hem önceden kaydedilmiş hem de gerçek zamanlı konuşma güçlendirme için kullanmayı umuyor. Hatta ses kalitesini otomatik olarak artırmak için teknolojisini tüketim mallarına bile dahil edebilir. Şu anda startup, ses ve video son işlemlerini kolaylaştırmak için bir SDK, web uygulaması ve API sağlıyor.
İsteğe bağlı, aboneliğe dayalı ve lisans gelir akışlarının birleşimiyle AI-coustics, hem geniş bir kullanıcı tabanını hem de kurumsal müşterileri kendine çekti. Şirket, yeni finansman ve destek sistemini kullanarak, pazar beklentilerini karşılamak ve risk sermayesi ekosistemini müzakere etmek için iş gücünü büyütmeyi ve konuşma geliştirme stratejisini geliştirmeyi planlıyor.
Yapay zekanın (AI) çalışanların yerini alabileceği endişelerine yanıt olarak Seipel, AI-kustiğin ses üretim sürecini nasıl hızlandırabileceğini, insan mühendislere diğer görevler için yer açarken yüksek kaliteli ses çıkışını garanti edebileceğini vurguluyor. Girişimin teknolojisi, dijital iletişimde yaygın olarak görülen düşük ses kalitesi sorununu çözmeyi amaçlayarak cihazlar ve içerik genelinde geniş uygulanabilirlik vaat ediyor.
Code Labs Academy'da yapay zeka, makine öğrenimi ve veri analitiğini öğrenin ve yalnızca birkaç ay içinde sertifikalı veri bilimcisi olun.