Panče Panov
Jožef Stefan Institute, Slovenia
Biografija: Dr. Panče Panov je podoktorski raziskovalec odseka Tehnologije znanja na Inštitutu Jožef Stefan. Poleg tega je tudi asistent na Mednarodni podiplomski šoli Jožef Stefan v Ljubljani in Fakulteti za informacijske študije v Novem mestu. Doktorski študij na Mednarodni podiplomski šoli Jožef Stefan je zaključil leta 2011 z disertacijo na temo ontologije za podatkovno rudarjenje. V svojem raziskovalnem delu se osredotoča na podatkovno rudarjenje, strojno učenje in predstavitve znanja v različnih področjih s pomočjo ontologije. Trenutno je usmerjen v nadaljnji razvoj ontoloških modelov in virov za opisovanje predmetov in procesov na področju podatkovnega rudarjenja in strojnega učenja. Sodeloval je pri številnih državnih projektih in projektih EU, kot so FP6 FET IQ, FP7 FET projekta MAESTRA, vključen pa je bil tudi v Human Brain Project. Je koordinator državnega projekta IMPERATRIX, ki se ukvarja s ponovljivostjo eksperimentov in večkratno uporabo raziskovalnih izsledkov pri analizi kompleksnih podatkov.
Izboljšanje ponovljivosti eksperimentov in večkratne uporabe raziskovalnih izsledkov pri analizi kompleksnih podatkov
Napredek v znanosti se povečini opira na tezo zanesljivega znanstvenega odkritja, pri čemer mora biti izpolnjen pogoj, da je izvedba neke raziskave pravilna in da jo lahko ponovijo drugi znanstveniki. Da bi povečali ponovno uporabnost raziskovalnih izsledkov, kot so razviti modeli in pridobljeni podatki, morajo biti ti najdeni, dostopni, interoperabilni in ponovno uporabni. Bistvo FAIR načel je v tem, da zagotavljajo ponovno uporabnost izsledkov – s ponovno uporabo pridobijo na ugledu. Če želijo slediti FAIR načelom, morajo biti izsledki raziskave predstavljeni na splošno priznanem modelu, ki ga lahko strojno preberemo. Med trenutno najbolj priljubljenimi rešitvami izmenjave podatkov, ki sledijo zahtevam FAIR, so tehnologije semantičnega spleta in ontologija.
Metode analize kompleksnih podatkov, ki izvirajo iz strojnega učenja ali podatkovnega rudarjenja, se vse pogosteje uporabljajo v različnih znanstvenih domenah (denimo naravoslovju, raziskavah vesolja ipd.). Z namenom zagotavljanja ponovljivosti eksperimentov in ponovne uporabe raziskovalnih izsledkov moramo formalno opisati vse entitete, ki so vključene v proces analize, in jih skupaj z opisi shraniti kot digitalne objekte v strukturo, kakršna je podatkovna baza. Posedovanje “semantično ozaveščenih” skladov entitet, namenjenih analizi kompleksnih podatkov, ki so izboljšane z zmožnostjo avtomatiziranega sklepanja, se lahko izkaže za veliko prednost pri izboljšanju ponovljivosti eksperimentov ter ponovne uporabe izsledkov, na ta način pa se tudi močno približamo FAIR načelom.
V prispevku bom spregovoril o najnovejših dosežkih na področju izboljšanja ponovljivosti eksperimentov in večkratne uporabe raziskovalnih izsledkov pri analizi kompleksnih podatkov.