Dragi Kocev
Jožef Stefan Institute, Slovenia
Biografija: Dr. Dragi Kocev je raziskovalec na raziskovalnem odseku Tehnologije znanja na Inštitutu Jožef Stefan. Doktorski študij na Mednarodni podiplomski šoli Jožef Stefan je zaključil leta 2011 z disertacijo o skupinah učnih modelov za napovedovanje strukturnih izsledkov. V akademskem letu 2014/2015 je bil tudi raziskovalni sodelavec Univerze v Bariju (Italija). Raziskovalno delo se osredotoča na podatkovno rudarjenje in vključuje preučevanje, razvoj in uporabo algoritmov podatkovnega rudarjenja. Trenutno cilja na nadaljnji razvoj učinkovitih metod učenja iz podatkov s strukturnimi izsledki (npr. večciljno napovedovanje, hierarhična razporeditev več oznak) in na njihovo uporabo v strojni vid, naravoslovje in ekološko načrtovanje. Sodeloval je pri številnih državnih projektih in projektih EU, kot sta IQ in PHAGOSYS, vključen pa je bil tudi v Human Brain Project. Bil je tudi eden izmed koordinatorjev FP7 FET projekta MAESTRA.
Delno nadzorovano večciljno napovedovanje za analizo podatkov presejalnih testov
Napovedno delovanje tradicionalnih metod nadzora močno pogojuje količina označenih podatkov. Vendar pa je pridobivanje oznak v številnih resničnih opravilih, kot je testiranje spojin in odkrivanje biomarkerjev, zapleten postopek. Navadno je za učenje z modeli na voljo zgolj malo označenih podatkov. Zaradi tega je bil zasnovan koncept delno nadzorovanega učenja. Tovrstne metode uporabljajo za označene in neoznačene podatke, z njimi pa želijo izboljšati učinkovitost nadzorovanih metod.
Še težje pa je pridobiti označene podatke za težave, ki pri podatkovnem rudarjenju nastanejo s strukturnimi izsledki, saj je treba številne oznake opredeliti za vsak primer ločeno. Večciljno napovedovanje (MTP) predstavlja eno od težav napovedovanja s strukturnimi izsledki, pri kateri moramo istočasno napovedati več spremenljivk. Kljub navidezni potrebi po delno nadzorovanih metodah, ki bi zagotovila večciljno napovedovanje, je na voljo zgolj peščica teh metod; njihova dejanska uporaba je zahtevna, prednosti v primerjavi z nadzorovanimi metodami za MTP pa še niso jasne.
Predstavil bom algoritem za učenje napovednih modelov za omejeno količino označenih podatkov, s katerim lahko neoznačene podatke izkoristimo za pripravo modelov z boljšimi napovedmi. Poleg tega bom pokazal določene referenčne poskuse, s katerimi lahko ocenimo njihove napovedi. Na koncu bom razpravljal še o njihovi uporabi za analiziranje obsežnih presejalnih testov.