Madalas na nahihirapan ang mga audio engineer sa mga recording na may bahid ng ingay sa background, ngunit sinusubukan ng isang German firm na tinatawag na AI-coustics na baguhin ito sa pamamagitan ng paggamit ng generative AI sa isang bagong paraan upang mapabuti ang kalinawan ng pagsasalita sa mga pelikula.
Nagsimula ang AI-coustics sa pagpopondo na €1.9 milyon, na nag-aalok ng teknolohiyang higit pa sa tradisyonal na pagsugpo ng ingay. Ayon kay Fabian Seipel, co-founder at CEO, ang kanilang teknolohiya ay ginawa upang mapabuti ang kalidad ng audio sa lahat ng device at speaker.
Ang kanilang layunin ay gawing malinaw ang lahat ng mga digital na pakikipag-ugnayan gaya ng mga broadcast sa studio, ito man ay isang conference call o isang social media video.
Itinatag ang AI-coustics noong 2021 bilang resulta ng kapwa hindi kasiyahan ng audio engineer na si Seipel at machine learning lecturer sa Technical University of Berlin Corvin Jaedicke, tungkol sa hindi magandang kalidad ng audio ng online na pang-edukasyon na content. Ang sariling pakikibaka ni Seipel sa pagkawala ng pandinig mula sa kanyang maagang trabaho sa produksyon ng musika ay ang inspirasyon sa likod ng kanyang personal na misyon na pahusayin ang digital audio clarity.
Ibinubukod ng AI-coustics ang sarili nito sa masikip na larangan ng mga produkto ng pagpapahusay ng boses na pinagana ng AI kasama ang malikhaing diskarte nito sa pagbuo ng teknolohiyang pampababa ng ingay.
Ang algorithm ng negosyo, na nagbibigay ng reward sa mga user para sa pagdaragdag sa kanilang dataset ng pagsasanay, ay batay sa mga sample ng pagsasalita na nakuha sa kanilang Berlin studio. Pagkatapos ay ginagamit nila ang dataset na ito upang pahusayin ang kanilang AI sa pagbabawas ng ingay, na sa panahon ng proseso ng pagsasanay nito ay tumpak na ginagaya ang iba't ibang mga bahid ng audio.
Mayroong mga alalahanin, gayunpaman, tungkol sa isang beses na paraan ng pagbabayad ng mga nag-aambag at posibleng mga bias sa pagkilala sa pagsasalita. Upang malabanan ang mga pagkiling, nakatuon ang AI-coustics sa pag-iba-iba ng base ng contributor nito upang magarantiya ang bisa ng teknolohiya sa lahat ng konteksto ng linguistic at demograpikong konteksto.
Tatlong magkakaibang video clip ang pinatakbo sa pamamagitan ng platform ng AI-coustics upang suriin ang bisa ng teknolohiya. Ang mga resulta ay nagpakita ng isang makabuluhang pagpapabuti sa kalinawan ng pagsasalita sa pamamagitan ng pagpapababa ng ingay sa background.
Umaasa ang AI-coustics na gamitin ang kanilang diskarte para sa parehong pre-recorded at real-time na speech augmentation. Maaari pa nga nitong isama ang teknolohiya nito sa mga consumer goods para awtomatikong mapataas ang kalidad ng boses. Sa ngayon, nagbibigay ang startup ng SDK, web application, at API para gawing mas madali ang post-processing ng audio at video.
Sa kumbinasyon ng on-demand, batay sa subscription, at mga stream ng kita sa lisensya, ang AI-coustics ay nakakuha ng parehong malaking user base at mga kliyente ng enterprise. Gamit ang kamakailang sistema ng pagpopondo at suporta nito, nilalayon ng kumpanya na palakihin ang workforce nito at pagbutihin ang diskarte nito sa pagpapahusay ng pagsasalita upang matugunan ang mga inaasahan sa merkado at makipag-ayos sa venture capital ecosystem.
Bilang tugon sa mga alalahanin na maaaring palitan ng artificial intelligence (AI) ang mga manggagawa, binibigyang-diin ni Seipel kung paano maaaring mapabilis ng AI-coustics ang proseso ng paggawa ng audio, na nagpapalaya sa mga inhinyero ng tao para sa iba pang mga tungkulin habang ginagarantiyahan ang mataas na kalidad na output ng boses. Ang teknolohiya ng startup ay nangangako ng malawak na kakayahang magamit sa mga device at content, na naglalayong lutasin ang malawakang problema ng mahinang kalidad ng audio sa digital na komunikasyon.