S-ADAPT: Najbolji projekti srpskih naučnika iz oblasti veštačke inteligencije

Fond za nauku Republike Srbije i National Geographic predstavljaju vam najuspešnijie srpske naučnike i njihove projekte iz oblasti veštačke inteligencije.

S-ADAPT: Najbolji projekti srpskih naučnika iz oblasti veštačke inteligencije Foto: Fond za nauku

U okviru Programa za razvoj projekata iz oblasti veštačke inteligencije koji finansira Fond za nauku, među 12 najboljih, našao se i projekat S-ADAPT, kojim rukovodi dr Vlado Delić, redovni profesor na Fakultetu tehničkih nauka Univerziteta u Novom Sadu

Projekat pod nazivom S-ADAPT ("Adaptacija govornika i stila govora digitalnih govornih asistenata zasnovana na metodama za obradu slike"), bio je i deo izložbe koja je bila organizovana na Kalemegdanu tokom oktobra 2020. godine. Ovaj projekat će se realizovati u naredne dve godine.

Šta je S-ADAPT?

Na tržištu se pojavljuje sve više pametnih uređaja koji pomažu korisnicima da pokrenu automatizovanu uslugu ili proces zadavanjem glasovne komande. Govorna komunikacija između čoveka i mašine zasnovana je na tehnologijama automatskog prepoznavanja govora u jednom smeru, i sinteze govora na osnovu teksta u drugom smeru. Ovakva komunikacija nije podjednako fleksibilna niti podjednako prirodna kao govorna komunikacija između ljudi, tako da, primera radi, ne može dovoljno brzo i tačno da funkcioniše u uslovima različite ambijentalne buke, ali ni različitih glasova govornika i načina i stila govora.

Projekat S-ADAPT ("Adaptacija govornika i stila govora digitalnih govornih asistenata zasnovana na metodama za obradu slike") iskoristiće napredne metode veštačke inteligencije da unapredi pomenute aspekte govorne komunikacije čoveka i mašine – da s jedne strane poveća jačinu prepoznavanja govora u smislu prilagođavanja specifičnostima govornika i akustičkog ambijenta, a da s druge unapredi sintezu govora u pogledu mogućnosti promene govornog stila ili identiteta govornika. Rezultati istraživanja biće verifikovani kroz ugradnju u postojeću aplikaciju digitalnog govornog asistenta za mobilne telefone.

U najširem smislu, projekat S-ADAPT zasnivaće se na tehnologijama veštačke inteligencije, konceptima mašinskog učenja i algoritmima zasnovanim na dubokim neuronskim mrežama, posebno konvolucionim neuronskim mrežama. Mnogi algoritmi koji će biti korišćeni pripadaju takozvanom učenju sa nagrađivanjem, čiji je cilj da model postigne kompromis između dolaženja do novih znanja i korišćenja postojećih, maksimizujući odgovarajuću kumulativnu funkciju nagrade. Ovaj projekat će koristiti različite arhitekture dubokih neuronskih mreža, a posebno će istražiti mogućnost upotrebe tzv. generativnih konfliktnih mreža, formiranih od po dve mreže koje se nadmeću jedna s drugom, i to tako što prva mreža pokušava da generiše nove podatke, statistički bliske skupu podataka za obuku, dok druga simultano uči kako da raspozna generisane podatke od originalnog skupa podataka. Prednost pomenutih metoda je u tome što zahtevaju malo podataka za obradu, te su veoma efikasne u realnim scenarijima.

najbolji-projeksti-srpskih-naucnika
Foto: Fond za nauku

Adaptacijom odabranih algoritama za obradu slike na obradu govora očekuje se unapređenje fleksibilnosti govornih tehnologija i upotrebljivosti digitalnih govornih asistenata, robota, pametnih kuća, kancelarija i automobila. Tehnologija automatskog prepoznavanja govora biće tačnija i robusnija jer će se adaptirati na pol i starost govornika, njegov način govora, kao i specifičnosti uslova snimanja. Tehnologija sinteze govora biće fleksibilnija u pogledu glasa govornika i njegovog govornog stila, i to uz relativno malu količinu podataka za adaptaciju, što je veoma važno jer je u realnim scenarijima na raspolaganju obično mala količina govornog materijala. Obe tehnologije biće prilagodljive i trenutnoj fazi dijaloga u skladu sa odgovarajućom dijaloškom strategijom. Očekivani rezultati biće dobijeni na osnovu govorne baze prethodno snimljene preko mobilne telekomunikacione mreže, kroz odgovarajuću aplikaciju koju projektni tim na početku projekta razvija. Kako su javno dostupne baze emotivnog govora izuzetno retke, posebno za jezike kao što je srpski, već i ova baza sama po sebi predstavljaće značajan rezultat projekta. Takođe, algoritmi za adaptaciju na govornika I stil razvijeni tokom projekta biće implementirani u već postojećeg govornog asistenta na srpskom jeziku, što će biti primarni tehnološki rezultat projekta.

Kao direktan rezultat projekta, širokom krugu korisnika u Srbiji i drugim zemljama biće omogućeno da fleksibilno komuniciraju sa svojim mobilnim telefonom, a kasnije i drugim uređajima na svom maternjem jeziku. Kako su govorne tehnologije, prepoznavanje govora i sinteza govora, izuzetno zavisne od jezika, unapređenje kvaliteta i upotrebljivosti govornih tehnologija za srpski jezik predstavlja cilj od nacionalnog značaja u uslovima izuzetno brzog tehnološkog razvoja i sve šire primene digitalnih uređaja. Prepoznavanje značaja ovakvih projekata samim tim predstavlja direktan doprinos opstanku srpskog jezika u digitalnom dobu, i njegovo dovođenje u rang najvećih svetskih jezika po pitanju kvaliteta komunikacije čoveka i mašine. S druge strane, rezultati projekta, iako će biti implementirani u aplikaciju govornog asistenta na srpskom jeziku radi verifikacije, u suštini su jezički nezavisni, tako da će projekat imati i jasan efekat na međunarodnom nivou. Naime, rezultati projekta moći će da se implementiraju i u sisteme koji podržavaju govornu komunikaciju na različitim jezicima i namenjeni su krajnjim korisnicima širom sveta. To će, s jedne strane, pomoći vidljivosti istraživačkog tima, rezultata projekta, pa i srpske naučne zajednice na svetskom nivou, ali će, s druge strane, imati i sasvim konkretne ekonomske efekte.

Projektni tim većinom obuhvata istraživače čije primarno polje ekspertize su govorne tehnologije, posebno govorne tehnologije na bazi mašinskog učenja i veštačke inteligencije. Rukovodilac projekta prof. dr Vlado Delić i vodeći istraživači iz Laboratorije za akustiku i govorne tehnologije Fakulteta tehničkih nauka Univerziteta u Novom Sadu, prof. dr Milan Sečujski i viši naučni saradnik dr Branislav Popović, ustanovili su i učvrstili položaj ove istraživačke grupe kao vodeće u razvoju i primeni govornih tehnologija u regionu. Važan deo tima čine i eksperti iz matematike, kao i oblasti primene matematičkih modela i metoda veštačke inteligencije u obradi slike – doc. dr Lidija Krstanović sa FTN-a i viši naučni saradnik dr Marko Janev sa Matematički institut SANU. Tim je pojačan izuzetno kvalitetnim mladim istraživačima – dr Sinišom Suzićem i dr Nikolom Simićem, kao i ambicioznim doktorantkinjama Tijanom Nosek i Ninom Maljković, članovima jedinog akreditovanog centra izuzetnih vrednosti na FTN. Izuzetno važnu podršku iz dijaspore predstavlja prof. dr Aleksandra Pižurica, vodeći stručnjak iz oblasti veštačke inteligencije sa Univerziteta u Gentu.

 

Možda će vas zanimati i:



ostavite komentar
Inicijalizacija u toku...
U prodaji je martovsko izdanje časopisa National Geographic Srbija.