Panče Panov
Jožef Stefan Institute, Slovenia
Biografia: Oltre ad essere ricercatore post-doc del Dipartimento delle tecnologie della conoscenza presso l’Istituto Jožef Stefan di Lubiana, Panče Panov è anche assistente presso la Scuola internazionale post-laurea Jožef Stefan di Lubiana e la Facoltà di informatica di Novo mesto. Nel 2011 ha ottenuto il dottorato di ricerca presso la Scuola internazionale post-laurea Jožef Stefan di Lubiana con una tesi sull’ontologia per l’estrazione dei dati. Le sue ricerche si concentrano sul data mining, sull’apprendimento automatico e sulla rappresentazione delle conoscenze nei vari ambiti di applicazione dell’ontologia. Attualmente sta sviluppando ulteriori risorse e modelli ontologici con cui descrivere gli oggetti ed i processi nel campo dell’estrazione dei dati e dell’apprendimento automatico. Ha collaborato a numerosi progetti nazionali e comunitari, quali FP6 FET IQ, FP7 FET Open project MAESTRA, ed ha partecipato al progetto Human Brain Project. Al momento è coordinatore del progetto nazionale IMPERATRIX che si occupa di riproducibilità degli esperimenti ed il riuso dei risultati di ricerca nell’analisi dei dati.
Migliorare la riproducibilità degli esperimenti ed il riuso dei risultati di ricerca in complesse analisi dei dati
Lo sviluppo della scienza si basa essenzialmente sul presupposto dell’affidabilità delle scoperte, che devono essere il risultato di processi eseguiti correttamente e riproducibili da altri scienziati. Al fine di aumentarne la riusabilità, i risultati della ricerca, i modelli sviluppati ed i dati generati dovrebbero essere individuabili, accessibili, interoperabili e riutilizzabili (dovrebbero, quindi, rispettare i cosiddetti principi FAIR). Il punto fondamentale dei principi FAIR è quello di garantire che i risultati della ricerca siano riutilizzabili e vengano effettivamente utilizzati da altri, cosa che aumenta il loro valore. I risultati delle ricerche che vogliono soddisfare i principi FAIR devono essere rappresentati con un ampio framework leggibile da macchine. Attualmente, una soluzione popolare per la condivisione dei dati che soddisfa i requisiti FAIR è l'uso di tecnologie e ontologie semantiche su web.
I metodi complessi di analisi dei dati derivanti dall'apprendimento automatico e dal data mining sono sempre più spesso applicati a vari settori scientifici (ad esempio, alle scienze naturali, alla ricerca spaziale, ecc.). Per garantire la riproducibilità degli esperimenti (es. l’esecuzione di un metodo) ed il riuso dei risultati di ricerca (ad esempio i modelli predittivi), è necessario descrivere formalmente le entità coinvolte nel processo di analisi e archiviarle insieme alle loro descrizioni (ad es. i metadati) come oggetti digitali in una struttura simile al database. Avere un archivio di entità "semanticamente consapevoli" per complesse analisi di dati potenziate con funzionalità di ragionamento automatico sarebbe utile per migliorare la riproducibilità degli esperimenti ed il riuso dei risultati di ricerca. In tal modo, saremmo più vicini ad un processo di analisi dei dati che rispettasse i principi FAIR.
Nel mio contributo discuterò e presenterò gli ultimi sviluppi per una migliore riproducibilità degli esperimenti ed il riuso dei risultati di ricerca in complesse analisi dei dati.