Dragi Kocev
Jožef Stefan Institute, Slovenia
Biografia: Dragi Kocev è ricercatore post-doc del Dipartimento delle tecnologie della conoscenza presso l’Istituto Jožef Stefan di Lubiana. Nel 2011 ottenute il dottorato di ricerca presso la Scuola internazionale post-laurea Jožef Stefan di Lubiana con una tesi sui gruppi di modelli di apprendimento per la predizione dei risultati strutturati. Nell’anno accademico 2014-2015 è stato anche assegnista di ricerca dell’Università di Bari. La sua ricerca è incentrata sul data mining e comprende lo studio, lo sviluppo e l'applicazione di algoritmi di estrazione dei dati. La ricerca attuale è finalizzata all'ulteriore sviluppo di metodi efficaci per l'apprendimento da dati con output strutturati (ad esempio, previsione di bersagli multipli, classificazione gerarchica multi-etichetta ...) e le loro applicazioni nel campo della visione artificiale, delle scienze naturali e della modellazione ecologica. Ha collaborato a numerosi progetti nazionali e comunitari, quali IQ e PHAGOSYS, oltre a partecipare al progetto Human Brain Project. Era anche coordinatore del FP7 FET Open project MAESTRA.
Previsione multi-target semi-supervisionata per l'analisi dei dati di screening
Le prestazioni predittive dei metodi tradizionali supervisionati dipendono fortemente dalla quantità di dati etichettati. Tuttavia, ottenere le etichette è un processo impegnativo in molte attività nella vita reale, inclusi lo screening dei composti, le scoperte di biomarcatori, ecc. Solitamente è disponibile una scarsa quantità di dati etichettati per l'apprendimento del modello. Per questo motivo è stato sviluppato il concetto dell’apprendimento semi-supervisionato. I metodi semi-supervisionati utilizzano dati etichettati e non per migliorare le prestazioni dei metodi supervisionati.
È ancora più difficile ottenere dati etichettati per problemi di data mining con output strutturati, poiché ogni esempio necessita molteplici etichettature. La previsione multi-target (MTP) è una tipologia di problema di previsione dell'output strutturato in cui è necessario prevedere simultaneamente più variabili. Nonostante l'apparente necessità di metodi semi-supervisionati in grado di trattare con MTP, solo alcuni di questi metodi sono disponibili, ma anche questi sono difficili da applicare e il loro vantaggi rispetto ai metodi supervisionati per MTP non sono ancora del tutto chiari.
Il contributo presenta un algoritmo per l'apprendimento di modelli predittivi da una quantità limitata di dati etichettati che possono sfruttare quelli non etichettati disponibili in modo da ottenere modelli con prestazioni predittive migliori. Inoltre, mostrerò alcuni degli esperimenti di riferimento con cui valutare le performance predittive. L’intervento di concluderà con la dimostrazione a la discussione della loro applicazione per l’analisi dei high-content screening.