Larisa Soldatova

Goldsmiths, Univerza v Londonu, Velika Britanija

Speaker 1

Biografija: Dr. Larisa Soldatova je docentka podatkovnih znanosti Univerze Goldsmiths v Londonu in predstojnica spletnega magistrskega programa podatkovnih znanosti. Je mednarodno priznana strokovnjakinja na področju predstavitve znanj, semantičnih tehnologij, analize podatkov in njihove uporabe v naravoslovju. Sodeluje na številnih mednarodnih projektih s področja razvoja semantičnih standardov, kot so denimo Ontologija za biomedicinske raziskave (OBI), ontologija za podatkovno rudarjenje, sheme SU, SBOL (synthetic biology open language) ‒ visual, laboratorijske protokole EXACT. Izbor nagrad: nagrada BCS Machine Intelligence (2006), nominacija za World Technology Award (Software) (2006), RCUK Fellowship (2007-2012), štipendija Meta-QSAR (EPSRC) (2012-2014), štipendija AdaLab (EPSRC) (2014-2018), štipendija Big Mechanism Grant (DARPA) (2014-2018), štipendija ACTION on cancer (EPSRC) (2018-2022).

Meta-QSAR in hkratno učenje QSAR

Predavateljica bo predstavila rezultate projekta o meta-QSAR, ki ga je financiral britanski Odbor za raziskave na področju inženirstva in fizike EPSRC (»kako načrtovati zdravilo« EP/K030469/1, EP/K030582/1). Kljub temu da smo v QSAR vključili skoraj vse vrste metod strojnega učenja, še vedno ni edine najboljše poti, prek katere bi spoznali QSAR. Na projektu je delovala skupina raziskovalcev, ki je opravila najobsežnejšo primerjavo metod strojnega učenja za učenje QSAR: 18 regresijskih metod, 6 sestav molekul, ki smo jih uporabili na več kot 2.700 problemov QSAR. Nato smo raziskovali uporabnost izbranega algoritma za probleme QSAR. Ugotovili smo, da je tovrstni pristop do meta-učenja v povprečju za do 13 % boljši od najboljše metode učenja posameznega QSAR (npr. naključni gozdovi s prstnimi odtisi molekule). S tem smo dokazali boljšo splošno učinkovitost meta učenja v primerjavi z osnovnim.
Delovna skupina projekta meta-QSAR je uporabila tudi hkratno učenje (HU), da bi izkoristila skupne lastnosti tarč učinkovin in testov. Analizirali smo več kot tisoč testov, ki nam jih je posredoval ChEMBL. Pri napovedovanju delovanja učinkovine je bil na osnovi značilnosti in primerov opravljen HU, poleg tega pa je bil vzpostavljen tudi naravni sistem merjenja evolucijske razdalje med tarčami učinkovin kot merilo povezanosti nalog. Rezultate študij HU smo primerjali z rezultati učenja ene naloge, naključnega gozda kot najuspešnejšega učenca QSAR. Prišli smo do zaključka, da je HU na osnovi primerov občutno boljši tako od tistega na podlagi značilnosti kot od osnovne učne metode. Z vključevanje evolucijske razdalje med tarčami se znatno izboljša tudi HU.
Dosežki projekta meta-QSAR so javnosti na voljo prek platforme OpenML.