Gli ingegneri del suono spesso hanno difficoltà con le registrazioni contaminate dal rumore di fondo, ma un'azienda tedesca chiamata AI-coustics sta cercando di cambiare la situazione utilizzando l'intelligenza artificiale generativa in un modo nuovo per migliorare la chiarezza del parlato nei film.
AI-coustics ha fatto il suo debutto con un finanziamento di 1,9 milioni di euro, offrendo una tecnologia che va oltre la tradizionale soppressione del rumore. Secondo Fabian Seipel, cofondatore e CEO, la loro tecnologia è progettata per migliorare la qualità audio su tutti i dispositivi e altoparlanti.
Il loro obiettivo è rendere tutte le interazioni digitali chiare quanto le trasmissioni in studio, che si tratti di una teleconferenza o di un video sui social media.
AI-coustics è stata fondata nel 2021 a seguito della reciproca insoddisfazione dell'ingegnere audio Seipel e del docente di machine learning presso l'Università Tecnica di Berlino Corvin Jaedicke, per la scarsa qualità audio dei contenuti educativi online. Le lotte di Seipel contro la perdita dell'udito fin dai suoi primi lavori nella produzione musicale sono l'ispirazione dietro la sua missione personale di migliorare la chiarezza dell'audio digitale.
AI-coustics si distingue nell’affollato campo dei prodotti per il miglioramento vocale abilitati all’intelligenza artificiale con il suo approccio creativo allo sviluppo della tecnologia di riduzione del rumore.
L'algoritmo dell'azienda, che premia gli utenti per l'aggiunta al proprio set di dati di formazione, si basa su campioni vocali catturati nel loro studio di Berlino. Quindi utilizzano questo set di dati per migliorare la loro intelligenza artificiale per la riduzione del rumore, che durante il processo di addestramento imita accuratamente una serie di difetti audio.
Esistono tuttavia preoccupazioni riguardo all'approccio del pagamento una tantum da parte dei contributori e ai possibili errori di riconoscimento vocale. Per contrastare i pregiudizi, AI-coustics si impegna a diversificare la propria base di contributori al fine di garantire l’efficacia della tecnologia in tutti i contesti linguistici e demografici.
Tre diversi videoclip sono stati eseguiti tramite la piattaforma AI-coustics per valutare l'efficacia della tecnologia. I risultati hanno mostrato un miglioramento significativo nella chiarezza del parlato riducendo il rumore di fondo.
AI-coustics spera di utilizzare la propria tecnica per l'aumento del parlato sia preregistrato che in tempo reale. Potrebbe persino incorporare la sua tecnologia nei beni di consumo per migliorare automaticamente la qualità della voce. Al momento, l'avvio fornisce un SDK, un'applicazione web e un'API per semplificare la post-elaborazione audio e video.
Con una combinazione di flussi di reddito on-demand, basati su abbonamento e su licenza, AI-coustics ha attirato sia un'ampia base di utenti che clienti aziendali. Utilizzando il suo recente sistema di finanziamento e supporto, l’azienda intende far crescere la propria forza lavoro e migliorare la propria strategia di miglioramento del parlato al fine di soddisfare le aspettative del mercato e negoziare l’ecosistema del capitale di rischio.
In risposta alle preoccupazioni che l’intelligenza artificiale (AI) possa sostituire i lavoratori, Seipel sottolinea come la acustica basata sull’intelligenza artificiale possa accelerare il processo di produzione audio, liberando gli ingegneri umani per altri compiti e garantendo allo stesso tempo un output vocale di alta qualità. La tecnologia della startup promette un'ampia applicabilità su tutti i dispositivi e contenuti, con l'obiettivo di risolvere il diffuso problema della scarsa qualità audio nella comunicazione digitale.
Impara l'intelligenza artificiale, l'apprendimento automatico e l'analisi dei dati presso Code Labs Academy e diventa un data scientist certificato in pochi mesi.