NAJBOLJI PROJEKTI SRPSKIH NAUČNIKA: AVANTES - spoj softverskog inženjerstva i lingvistike

Fond za nauku Republike Srbije i National Geographic predstavljaju vam najuspešnijie srpske naučnike i njihove projekte iz oblasti veštačke inteligencije.

NAJBOLJI PROJEKTI SRPSKIH NAUČNIKA: AVANTES - spoj softverskog inženjerstva i lingvistike Foto: Privatna arhiva

U okviru Programa za razvoj projekata iz oblasti veštačke inteligencije finansira Fond za nauku, među 12 najbiljih, našao se i projekat dr Boška Nikolića, redovnog profesora na Elektrotehničkom fakultetu Univerziteta u Beogradu.

Njegov projekat pod nazivom AVANTES bio je i deo izložbe koja je bila organizovana na Kalemegdanu tokom oktobra 2020. godine. Ovaj projekat će se realizovati u naredne dve godine.

Šta je AVANTES?

Projekat AVANTES spaja teme iz oblasti softverskog inženjerstva i lingvistike. U okviru projekta realizovaće se svi delovi nekog softevrskog sistema, napisanih u različitim programskim jezicima, i tekstualnih komentara koji se koriste unutar samog softvera, kako bi se utvrdilo da li stepen sličnosti u komentarima odgovara stepenu sličnosti u realizaciji. Širi cilj je da se ispita odnos između strukture programskih jezika, softverskog modela i baze podataka i onoga što je napisano na prirodnim jezicima. Naglasak za prirodne jezike je na srpskom i engleskom, ali će rezultati imati i moguću širu primenu. Tokom projekta će biti izrađen inteligentni sistem koji će na osnovu podataka o utvrđenim sličnostima između onoga što je napisano u okviru softverskog sistema i prirodnih jezika moći da prepoznaje duplikate dela softvera, ali i da omogući pretragu koda putem upita na prirodnom jeziku.

U okviru projekta će se realizovati nove metode za analizu programskog koda upotrebom tehnika mašinskog učenja i veštačke inteligencije. Ove tehnike će se primeniti u okviru analize različitih faza izvršavanja nekog softverskog sistema (sam statički kod, dinamički kod, analiza izvršavanja, kao i pristupa memoriji). Analiziraće se prepoznavanje semantičke sličnosti komentara delova softvera, a posebna pažnja će se usmeriti na rešavanje problema sličnosti dva teksta različiih dužina (cross-level semantic similarity) i to posebno za srpski jezik, uz upoređivanje sa rezultatima dobijenim za engleski jezik. Izvršiće se integracija realizovanih metoda za prepoznavanje semantičke sličnosti programskog koda i prepoznavanje semantičke sličnosti komentara. U poslednjoj fazi projekta će se razmatrati semantička pretraga koda (Semantic Code Search), kada će se realizovati algoritmi za pretragu repozitorijuma sa softverskim projektima pomožu upita na prirodnim jezicima, i to na srpskom i engleskom.

avantes_1
Foto: Privatna arhiva

Glavni rezultati projekta AVANTES biće: novi alat za utvrđivanje sličnosti softvera na osnovu kombinovanog ispitivanja sličnosti delova softvera i sličnosti komentara; novi algoritam za pretragu koda prema značenju, odnosno putem upita na prirodnom jeziku; skupovi podataka i modeli za automatsku obradu srpskog jezika.

Interdisciplinarni tim koji se okupio na projektu AVANTES čine istraživači sa Elektrotehničkog fakulteta Univerziteta u Beogradu, iz Inovacionog centra Elektrotehničkog fakulteta, sa Filološkog fakulteta Univerziteta u Beogradu i sa Univerziteta u Cirihu - softverski inženjeri i lingvisti. Iako naizgled imaju različita interesovanja, članovi tima suštinski se svi zanimaju za jezike - programske, prirodne ili i jedne i druge, za njihovu analizu i automatsku obradu. U pogledu iskustva, tim pokriva raspon od mladih istraživača čija karijera tek počinje, do onih koji se temama povezanim sa projektom bave već duži niz godina.

Jedna velika novina je bliska saradnja istraživača iz naizgled udaljenih naučnih oblasti, koji se obično jezikom ili jezicima bave iz dosta drugačijih perspektiva. U lingvističkom delu projekta donekle je nov pristup analizi jezika, koja se inače često sprovodi sa ciljem formulisanja i provere lingvističkih teorija, dok u ovom projektu treba da ima direktnu primenu u računarskim zadacima. U delu projekta vezanom za softversko inženjerstvo predviđeni su rezultati vezani za automatsku obradu srpksog jezika, posebno u određivanju semantičke sličnosti različitih sličnosti, kao i u razvoju algoritama prepoznavanja sličnosti dva programska koda, softverska modela ili baze podataka.

Projekat će biti značajan za Srbiju iz razloga izrade kompleksnih skupova podataka i unošenje inovacija u postojeće tehnologije za automatsku obradu srpskog jezika, za koji je trenutno dostupno daleko manje resursa nego za veće jezike poput engleskog. Planirani skupovi podataka će umnogome pomoći istraživačima našeg jezika.

 

Možda će vas zanimati i:



bonus video
ostavite komentar
Inicijalizacija u toku...
U prodaji je oktobarsko izdanje časopisa National Geographic Srbija.