Giorgio Pedrazzi attualmente lavora come Data Scientist presso Cineca nel dipartimento HPC High Performance Computing. In BBS coordina il modulo Big Data Laboratory nel Master in Data Science and Business Analytics. Le sue aree di interesse principali sono l’analisi dati, il machine learning e il deep learning. Nell’ambito del dipartimento HPC collabora a diversi progetti europei quali ad esempio AIDA (Artificial Intelligence Data Analysis) per l’analisi dei dati elio fisici e EUHUBS4DATA per la creazione di una federazione di Data Innovation HUBs al fine di fornire servizi alle piccole e medie imprese, alle start-up e ai web entrepeneur. Nel 1995 ha conseguito il Dottorato in Metodologia Statistica per la Ricerca Scientifica presso la Facoltà di Scienze Statistiche dell’Università di Bologna.
Le attività del laboratorio prevedono di affrontare il processo completo di Data Analytics partendo dalla fase di lettura dei dati mediante diversi approcci, l’elaborazione dei modelli di analisi e la visualizzazione dei risultati. In particolare saranno approfonditi linguaggi di programmazione come R, Python e TensorFlow con particolare riferimento alla loro esecuzione in ambiente di Calcolo ad Alte Prestazioni (HPC). In questo contesto saranno utilizzate librerie per il calcolo parallelo (H2O) e il Deep Learning (Keras).
Verranno trattati anche programmi per la creazione di Workflow grafici per il Data Analytics come Knime ed Orange. Al termine verrà realizzato un progetto pratico partecipando ad una Kaggle competition.
Corso tenuto dallo staff CINECA (Dipartimento Super Calcolo, Applicazioni e Innovazione
e Laboratorio Big Data e Analytics), coordinamento di Giorgio Pedrazzi.