2. Il compito del gruppo di lavoro
• mappare, in chiave anche comparata a livello europeo e
internazionale, i principali centri, universitari e non, che operano
nel settore dei “Big Data” con riferimento alla formazione e
costruzione di competenze;
• identificare le possibili misure che il sistema formativo italiano
dovrebbe adottare per essere in linea con le migliori prassi
internazionali valorizzando le proprie specificità e, ove possibile,
assumere un ruolo guida in questo settore in rapida evoluzione;
• effettuare la ricognizione delle banche dati del Ministero,
relative al settore dell’istruzione scolastica, dell’università e
dell’alta formazione artistica e musicale, nonché della ricerca
scientifica, e proporre azioni che il Ministero potrebbe
intraprendere per valorizzare le stesse e renderle strumento utile
all’elaborazione di scelte di policy strategiche.
3. I componenti del gruppo
Fabio BELTRAM SNS
Sabrina BONO MIUR
Francesco CASTANÒ ISTAT
Davide D’AMICO MIUR
Luca DE BIASE Nòva24
Letizia MELINA MIUR
Donatella SOLDA MIUR
Roberto TORRINI Banca d’Italia
4. La modalità di lavoro
• ascolto della comunità nazionale con inviti diretti e
autosegnalazioni;
• tre incontri con gruppi di esperti nel campo della formazione e
della ricerca;
• richiesti contributi specifici da parte di esperti;
• analizzata la struttura delle basi di dati del MIUR;
• analizzate le policy europee e internazionali;
• beneficiato del contributo continuo di altri sia interni sia esterni al
MIUR.
14. Competenze e dati
economia matematica informatica statistica
rischio di
credito
teoria delle
reti
text mining
sentiment analysis
significatività
bilanci
default
mercato
social
network
machine learning
rete di pagamenti
rete di ownership
CORPORATE
RATING
visione sistemica
18. La formazione e i big data
ANALISI
PROPOSTE
• Sviluppo di competenze digitali nella scuola
• Modifiche al sistema formativo, valutativo, di monitoraggio
• Alta formazione: laurea, laurea magistrale, PhD, master
19. Censimento dell’offerta
Università L LM Master
Offerta in
altri cdl
Bologna I L, LM
Firenze I, II L, LM
Genova ⚫ ⚫¹ D
L'Aquila ⚫¹
MI Bicocca I
MI Bocconi ⚫¹
PoliMI ⚫¹
Molise I
Padova ⚫²
Pisa ⚫ II
Università L LM Master
Offerta in
altri cdl
Luiss I
Roma -
Sapienza
⚫ II L, LM
Roma –
Tor Vergata
⚫¹ II
Siena ⚫¹²
Torino ⚫ II
PoliTO II³ LM
Trieste -
SISSA
II
Venezia ⚫¹ ⚫¹
20. Università
Bolzano LM
Cassino LM
Ferrara L, LM, D
Insubria D
Lucca – IMT D
Messina L, LM
Milano - Statale LM, D
Napoli – Federico II LM
Università
Padova L, LM
Palermo LM
Pavia LM
Politecnico delle Marche LM
Roma TRE LM
Salerno LM
Trento LM
Censimento dell’offerta
21. La formazione universitaria è il livello ottimale per fornire gli
strumenti richiesti dal fenomeno emergente dei Big Data.
Inserire moduli di data science in tutti i corsi di studio, a
partire dalle lauree triennali, per esporre gli studenti al cambio
di paradigma che investe tutte le discipline spingendo verso un
approccio scientifico data driven, con la scoperta di che
emergono dalle grandi masse di dati disponibili: esperimenti sui
dati visti non solo come validazione di teorie e modelli, ma anche
come scoperta di pattern emergenti che suggeriscono agli
scienziati nuove teorie e nuovi modelli, in grado di spiegare più a
fondo la complessità dei fenomeni sociali, economici, biologici,
tecnologici, culturali
Alta formazione:
laurea, laurea magistrale, PhD, Master
22. • Inserire moduli di data science in tutti i corsi di studio
• aggiornamento paradigmi formativi e della distribuzione dei
crediti
• finanziamento di progetti comuni tra data scientists ed esperti di
settore (sanità, economia, scienze sociali e umane…)
• programma di reclutamento dei docenti
• centri di ateneo capaci di fornire i crediti in ambito big data
CORSI DI LAUREA (TRIENNALI)
Alta formazione:
laurea, laurea magistrale, PhD, Master
23. Servizi 27,01%
Informatica 18,80%
Manifattura
12,79%
Grande distribuzione
9,57%
Rifiuti
8,16%
Finanza e
Assicurazioni 8,09%
Vendita all'ingrosso
5,67%
Educazione 3,03%
Altri servizi (no PA)
1,70%
Turismo 1,21%
Sanità 1,04%
Immobiliare 0,76%
Edilizia 0,62%
Trasporti 0,46%
PA 0,42%
Management 0,28%
Arte e Cultura 0,18%
Estrazione materie prime
0,11%
Utenze 0,11%
Altro %
La richiesta di competenze BD nel
mercato del lavoro (USA, 2014)
24. LAUREA MAGISTRALE
Elementi di data science sono necessari all’interno dell’offerta di
tutti i percorsi, ma qui si colloca il livello ideale per la
formazione di specialisti in data science.
Aspetto centrale della programmazione di questi percorsi di
laurea è la necessità di renderli adatti ad accogliere laureati
provenienti da background diversi per formare degli specialisti di
settore capaci di utilizzare in maniera avanzata e indipendente i
nuovi strumenti del mondo dei Big Data in specifici settori
scientifici e professionali.
Alta formazione:
laurea, laurea magistrale, PhD, Master
25. LAUREA MAGISTRALE
• Inserire moduli di data science in tutti i corsi di studio
• percorsi di laurea magistrale focalizzati potrebbero in molti
casi essere inseriti in una varietà di classi disciplinari distinte a
seconda dello specifico settore nel quale il data scientist
svolgerà la sua attività (ad es. settore biomedico, scienze
sociali e umane)
• La collocazione in diverse classi disciplinari a seconda dello
specifico settore è utile a evitare ostacoli in ingresso e
barriere disciplinari per il prosieguo della vita
accademica/professionale degli studenti.
Alta formazione:
laurea, laurea magistrale, PhD, Master
26. PhD
Considerazioni simili alle LM, rafforzate, si applicano alla
possibilità di attivare percorsi di formazione dottorale, inoltre:
• necessità di una documentata capacità di ricerca
dell’ateneo ospite
• nuovi dottorati potrebbero gemmare da esperienze di successo
in dottorati esistenti attraverso il coinvolgimento di competenze
delle nuove metodologie
• specifico piano di finanziamento di borse dottorali
• limitato numero di dottorati focalizzati sulla figura del data
scientist, ma spazio anche a borse riservate a candidati con un
background specifico da inserire all’interno di percorsi più
“convenzionali” (economia, farmacologia, etc.).
Alta formazione:
laurea, laurea magistrale, PhD, Master
27. MASTER
Offerta esiste, ma è poco omogenea. Opportuno introdurre
processi di accreditamento.
• Finalità principale di questi percorsi professionalizzanti
dovrebbero essere formazione continua e aggiornamento
professionale, anche in collaborazione con le imprese
• Si raccomanda l’introduzione di percorsi intensivi sull’utilizzo
delle nuove metodologie riservati agli esperti di determinati
settori disciplinari/professionali. Esempi: master aperti a
economisti, scienziati politici, farmacologi, epidemiologi...
Alta formazione:
laurea, laurea magistrale, PhD, Master
28. Scuola: sviluppo delle competenze
digitali, aggiornamento dell’approccio
formativo
• raccordo con il Piano Nazionale per la Scuola Digitale per
trasformare i digital native da consumatori a consumatori
critici e produttori di contenuti digitali
Il PNSD, lanciato nell’Ottobre 2015, è il documento strategico con cui il MIUR
ha definito il posizionamento del sistema scolastico nell’era digitale
• formazione al “valore del dato” come parte di un processo di
alfabetizzazione digitale
29. Scuola: sviluppo delle competenze
digitali, aggiornamento dell’approccio
formativo
UN’ESPERIENZA BIG DATA PER OGNI STUDENTE/SSA
Tra le azioni del PNSD più direttamente riferibili al tema dei
Big Data:
Azione #15: dal prossimo anno scolastico, il MIUR
finanzierà 25 curricula didattici applicabili a tutta la scuola,
con due specifici percorsi dedicati ai dati (Big e Open Data);
Azione #20: Girls in Tech & Science, per orientare,
rafforzare e accelerare le competenze delle ragazze
30. • Big data sono stimolo per l’adozione di metodologie
didattiche innovative basate su ambienti digitali
• questi metodi rendono possibile il riuso dei materiali per
valutazione (a tutti i livelli e in tempo quasi reale),
monitoraggio e ricerca didattica
• questi processi devono essere trasparenti: il personale della
scuola, gli studenti e i loro genitori, tutti gli utilizzatori delle
piattaforme di apprendimento devono essere consapevoli
dell’uso che viene fatto dei dati generati dalle interazioni sulle
piattaforme didattiche digitali
Scuola: sviluppo delle competenze
digitali, aggiornamento dell’approccio
formativo
31. TITOLO
• Il rapporto ha mappato il sistema informativo del MIUR,
organizzato nei tre sottosistemi dell’ISTRUZIONE
dell’UNIVERSITÀ e della RICERCA, le loro macro-aree e i
processi e dati connessi.
• Il patrimonio di informazioni del MIUR può essere classificato
sulla base dei soggetti a cui le stesse si riferiscono. Si possono
individuare tre principali categorie:
1. singole istituzioni (scuole, università, enti di ricerca e altre istituzioni di alta
formazione): informazioni sulle strutture, sull’offerta formativa, sulle risorse economiche e
umane, sulla produzione scientifica e quelle derivanti dalle attività di autovalutazione e
valutazione;
2. studenti: informazioni relative al percorso formativo e ai principali eventi nella carriera
scolastica e universitaria;
3. personale docente e amministrativo: informazioni sul percorso professionale e sul
trattamento economico, ma anche, in maniera eterogenea per le diverse carriere, sulla
produzione scientifica, sugli incarichi ricoperti e la formazione.
Struttura e fruibilità dei dati MIUR
32. TITOLO
L’autonomia che contraddistingue i diversi comparti ha contribuito
allo sviluppo di distinte modalità di gestione delle informazioni,
generando un’eterogeneità di repository poco comunicanti tra
loro.
Le informazioni sono già oggi utilizzate per la formulazione delle
politiche e per l’analisi dei sistemi scolastico, universitario e della
ricerca. Sono anche in parte a disposizione delle singole istituzioni
per le loro scelte gestionali e al più ampio pubblico attraverso dei
portali dedicati.
Il Ministero è però oggi nelle condizioni di compiere un salto
qualitativo in ottica Big Data e implementare una strategia di
sistematica valorizzazione e integrazione del proprio
patrimonio informativo
Struttura e fruibilità dei dati MIUR
33. Una strategia Big Data per il MIUR
• Aumentare la capacità di governare, sia dal punto di vista
gestionale sia analitico, queste immense moli di informazioni
implementare un ambiente ministeriale (virtualmente) centralizzato di
data e content management
garantire la interoperabilità dei diversi data base, indipendentemente dai
processi amministrativi da cui originano, delle amministrazioni a cui si
riferiscono, dei sistemi gestionali adottati
consolidare i dati ed eliminare le ridondanze
• Integrare/arricchire le informazioni con dati provenienti da
altre amministrazioni (Ministero del Lavoro, Istat, Inail, etc.)
• Integrare/arricchire le informazioni sfruttando in una logica Big
Data anche le informazioni liberamente ricavabili dal web e
dai social network
• Diffondere in formato aperto i dati, ferma restando l’esigenza
di assicurare i necessari profili di privacy
34. Approccio bottom-up che garantisca risultati a breve termine,
rilasciati con continuità e frequenza, convergendo allo stesso
tempo su una visione integrata di lungo termine
A breve termine:
• Interventi di adeguamento di qualità sulle basi di dati esistenti e definizione
delle politiche di manutenzione e aggiornamento.
• Ricognizione dei dati di altri enti e statistiche internazionali e progetto delle
modalità di raccordo e integrazione con le basi dati MIUR.
• Definire l’architettura tecnologica e progettare le modalità tecniche di
integrazione a livello dati e applicazioni.
A medio termine:
• Creare un livello semantico di ontologie per integrare tutte le informazioni, sia
presenti nelle basi dati ministeriali che ottenute dalle fonti esterne.
• Integrare tutti gli archivi integrati e le fonti dati ausiliarie
• Valorizzare e connettere le strutture preposte alla gestione e all’analisi dei dati
Una strategia Big Data per il MIUR
35. TITOLO
Sulla base delle diverse esigenze conoscitive si possono individuare diversi
destinatari:
• il decisore politico, nello specifico il Ministero e gli organismi preposti alla
valutazione, direttamente coinvolti nella gestione, nella formulazione delle
politiche e nella valutazione degli esiti;
• le singole amministrazioni governate dal Ministero (le scuole, le università,
gli enti di ricerca), che dalla disponibilità di dati sulla propria e sulle altre
strutture possono trarre le necessarie indicazioni per le scelte gestionali e di
orientamento dell’attività didattica e di ricerca;
• il Sistema Statistico Nazionale che utilizza le informazioni statistiche
prodotte dalle amministrazioni sui diversi ambiti della società e dell’economia;
• il mondo della ricerca, che in maniera indipendente è interessato all’analisi
dei percorsi di studio e professionali degli studenti, e all’analisi della
governance del sistema scolastico universitario e della ricerca;
• i singoli cittadini e le famiglie che hanno interesse ad acquisire informazioni
sul sistema scolastico e universitario;
• il mondo degli sviluppatori di applicazioni, piattaforme e servizi a contenuto
informativo, che possono costruire a partire dalle informazioni pubbliche del
Ministero nuove soluzioni a carattere sociale e commerciale.
A chi interessano i dati del MIUR?
36. TITOLOLa piattaforma Scuola in Chiaro assieme alle informazioni diffuse tramite
il sito Universitaly renderanno fruibili le informazioni attraverso
piattaforme che permettano il pieno accesso ai dati pubblici, con modalità
specifiche in relazione ai profili dell’utenza (pubblico non specialista,
utenti che intendano riutilizzare i dati per scopi di ricerca o commerciali).
Raccomandazioni: il MIUR
• si faccia promotore della pubblicazione dei propri dati,
adeguatamente documentati e tecnicamente disponibili
adottando le più moderne soluzioni,
• si coordini con altre basi e flussi di dati pubblici,
• attivi politiche di interazione, analisi e partenariato con il settore
privato per generare prodotti e servizi ad alta intensità
informativa.
Il portale unico dei dati della Scuola
e Universitaly
37. TITOLO
La disseminazione dei risultati della ricerca migliora le relazioni
fra scienza (accademia e ricerca) e società, accrescendo da un
lato l’impatto e i benefici della R&S sulla società stessa e
dall’altro aumentando consapevolezza e fiducia dei cittadini.
Viene così massimizzato il ritorno dell’investimento pubblico in
ricerca, in piena ottica di responsabilità sociale della Ricerca e
dell’innovazione, rinforzando la relazione tra scienza e società.
La circolazione dei risultati della ricerca, permettendone il loro
successivo riuso, fa in modo che questi abbiano maggiore
impatto
I dati della ricerca: l’Open Science
38. TITOLO
Il gruppo raccomanda:
• incentivi per i ricercatori, a partire dalle procedure di
valutazione MIUR sulla produttività dei ricercatori (VQR), in
modo che sia premiato il riutilizzo e la citazione dei dati da loro
messi a disposizione;
• emanazione di bandi competitivi per il finanziamento di
progetti di ricerca che abbiano i Big Data sia come metodo, sia
come oggetto di studio;
• un piano di sensibilizzazione sul valore della condivisione
dei dati da parte dei ricercatori con modalità che tutelino la
proprietà intellettuale;
• sviluppo di infrastrutture elettroniche di ricerca che siano
capaci di ospitare grandi moli di dati per la loro condivisione e
conservazione nel tempo.
I dati della ricerca: l’Open Science
39. Conclusioni
• Big data sono campo emergente di cui vediamo già le prime
ricadute a livello globale, ma soprattutto vediamo il potenziale per
un impatto di straordinario rilievo e grandissima pervasività;
• l’Italia è nelle condizioni di assumere un ruolo competitivo nello
scenario internazionale, ma i diversi attori pubblici e privati
devono agire con tempestività;
• l’attuazione delle proposte qui delineate consentirà al MIUR non
solo di beneficiare degli sviluppi offerti dalla Data Science nello
svolgimento delle proprie funzioni, ma anche di proporre un
modello di best practice che potrà avere un prezioso effetto
traino su altri settori della pubblica amministrazione,