Noé Sturm
IMED Biotech Unit, AstraZeneca, Göteborg, Svezia
Biografia: Noé Strum ha ottenuto il dottorato di chimica con specializzazione in chemioinformatica presso l’Università di Strasburgo (Francia) in collaborazione con la Griffith University di Brisbane, Australia. Come dottorando ha studiato la relazione strutturale tra gli enzimi biosintetici del prodotto naturale e le proteine bersaglio del farmaco nel campo della farmacognosia. Dopo essere stato ricercatore post-dottorato all’Università di Modena e Reggio Emilia, dove si era concentrato sullo sviluppo dell'inibitore allosterico dell'EGFR con metodi computerizzati, è entrato a far parte di Astrazeneca nell'ambito del progetto europeo ExCAPE. Il suo ruolo consisteva nell'applicare tecnologie di apprendimento automatico dell’ultima generazione, quali l’apprendimento profondo e la fattorizzazione di matrice a dataset chemogenomici di grandi dimensioni, per generare modelli di predizione della bioattività su scala larga. Dal 1o gennaio 2019 fa parte del gruppo ricerca per la scienza dei dati e dell’intelligenza artificiale presso la società AstraZeneca e sta lavorando nel campo della sicurezza dei farmaci.
Costruire modelli chemogenomici da dataset pubblici a scala larga ed applicarli a quelli industriali
ExCAPE era un progetto finanziato dall’Unione europea che puntava a raccogliere le capacità di supercomputer per velocizzare la scoperta dei farmaci (http://excape-h2020.eu/). Il team che ha lavorato al progetto ha avuto l'incredibile opportunità di costruire modelli di apprendimento automatico a scala larga per modelli previsionali, attingendo aa database pubblici ed applicandoli a quelli industriali. Nel contributo verranno presentate le procedure di raccolta dati chemiogenomici ottenuti da risorse pubbliche per creare il dataset di riferimento. Inoltre, saranno spiegati i processi di realizzazione e valutazione delle performance dei modelli creati attraverso l’apprendimento profondo con multi-task e gli algoritmi di fattorizzazione di matrici. Infine saranno illustrate anche le modalità di applicazione di tali modelli su dataset industriali.