SlideShare une entreprise Scribd logo
1  sur  28
COMPRENDERE E RAFFINARE I DATI
COMPRENDERE I DATI PER USARLI AL MEGLIO
COMPRENDERE I DATI
I dati che avete a
disposizione potrebbero
dirvi tante cose del
fenomeno che state
osservando.
COMPRENDERE I DATI
Per farli “parlare”, cercate di capirli a pieno.
Fatevi queste domande:
● Che tipo di informazioni definiscono?
● Quali sono le loro caratteristiche principali?
● Che impatto hanno sulla realtà?
COMPRENDERE I DATI
E’ importante:
● capire bene la natura dei dati
● capire come analizzarli
attraverso alcune semplici
operazioni
LE CARATTERISTICHE DEI VOSTRI DATI:
GEOGRAFICHE, TEMPORALI, DESCRITTIVE
DATI GEOGRAFICI
I dati che state utilizzando per i
vostri lavori potrebbero
contenere informazioni di tipo
geografico.
Dirvi, cioè, qual è la misura di un
fenomeno su un determinato
territorio.
DATI GEOGRAFICI
○ A quale territorio sono riferiti? Nazionale,
regionale, provinciale o comunale?
○ Qual è il nesso tra questo territorio e il progetto
da voi scelto su OpenCoesione e che state
approfondendo?
○ Quali informazioni aggiuntive potreste
raccogliere analizzando le informazioni
geografiche dei vostri dati?
SERIE STORICHE
I dati possono permettere di
analizzare l’andamento di un
fenomeno nel tempo e misurarne
le variazioni (per esempio da un
mese all’altro o da un anno
all’altro).
SERIE STORICHE: ESEMPI
La raccolta differenziata
dei rifiuti è aumentata,
diminuita o rimasta
stabile?
Il numero di turisti sul
un territorio è costante
di anno o anno o ci
sono delle variazioni?
Il fenomeno in
esame è in crescita o
in descrescita (per
esempio, di mese in
mese)?
Per capire quanto possano
essere importanti le
informazioni contenute
nelle serie storiche, andate
anche a curiosare nelle
banche dati Istat…
SERIE STORICHE: ESEMPI (ISTAT)
DATI QUALITATIVI
Si tratta di dati che
definiscono le qualità e
le caratteristiche
intrinseche di uno o più
oggetti.
DATI QUALITATIVI: ESEMPIO
Un esempio: i prodotti tipici trentini (da OpenData Trentino,
http://dati.trentino.it/dataset/prodotti-tradizionali-trentini).
Ciascun prodotto viene definito per tipologia, luogo di
produzione, link di approfondimento. Si tratta di qualità
aggiuntive del dato disponibili per il fruitore.
Quindi chiedetevi:
quali caratteristiche hanno i dati
che avete raccolto o state
raccogliendo?
Quali sono quelle che possono
interessarvi di più?
PULIRE I DATI
PULIRE I DATI
Prima di analizzare i dati è necessario
fare alcune verifiche per renderli
coerenti e sfruttarne al meglio tutte le
caratteristiche.
Esistono metodi specifici anche in
questo caso.
Vediamo quali…
PULIRE I DATI
La pulizia dei dati è fondamentale per
assicurarsi che siano strutturati bene
all’interno delle righe e delle colonne e che i
valori inseriti siano coerenti.
Analizzare i dati senza fare un attento data
cleaning potrebbe portare successivamente a
gravi errori o a difficoltà ingestibili.
Esistono alcuni strumenti che aiutano la
pulizia dei dati, come Open Refine
(http://openrefine.org)
PULIRE I DATI
1
Controllate che gli stessi valori
siano scritti allo stesso modo.
Per esempio, se il valore “Ambiente”
è scritto anche “ambiente” e
“AMBIENTE”, allora è un errore,
perché i valori devono essere scritti
tutti in maniera analoga.
PULIRE I DATI
2
Controllate le date (se presenti): anche
queste devono essere scritte in maniera
omogenea.
È un errore se alcune date sono inserite in
formato numerico (esempio: “01/03/2015”) e
altre in formato alfanumerico (esempio: “10
marzo 2015”). È necessario avere le date in
un solo formato: verificatelo andando su
“Formato celle”.
PULIRE I DATI
3
Verificate la numerazione.
Quella italiana è diversa da quella anglosassone: in
Italia i punti (“.”) indicano le migliaia, le virgole (“,”)
indicano i decimali, mentre per gli anglosassoni è
il contrario.
Assicuratevi che i numeri siano rappresentati
correttamente.
Verificate il sistema di numerazione su
“Impostazioni foglio di lavoro”.
ARRICCHIRE I DATI
DIVIDERE
I dati devono essere “granulari”, come se fossero degli atomi.
Per esempio: se i vostri dati hanno una colonna di luoghi e all’interno hanno
un valore come questo: “Cologno Monzese, provincia di Milano (Lombardia)” ,
è meglio dividere la colonna in altre tre colonne (Comune + Provincia +
Regione). Così potete analizzarli per Comune, Provincia, Regione.
AGGIUNGERE
Non è detto che il vostro dataset vi
fornisca tutte le informazioni
necessarie. In certi casi potreste essere
voi ad arricchirlo, aggiungendo nuove
colonne con specifiche informazioni.
In parte potreste averlo già fatto,
seguendo le indicazioni precedenti,
ma possono esserci altri modi per
arricchire un dataset…
GEOCODING
Latitudine Longitudine
Usando lo stesso esempio, dopo aver diviso
la colonna “Luogo” in tre colonne (Comune,
Provincia, Regione), è utile inserire
“Latitudine” e “Longitudine” per costruire
una mappa.
Per farlo, inserirete due nuove colonne
(Latitudine e Longitudine) e risalirete alle
coordinate geografiche attraverso il luogo
di riferimento.
LongitudineLatitudine
GEOCODING
Potete ricavare online le coordinate geografiche.
In rete ci sono tanti tool per farlo: cercateli!
Assicuratevi sempre che i dati siano riusabili (con OpenStreetMap
si può, con GoogleMap con limiti).
COMPRENDERE E RAFFINARE I DATI
2.4 DATI: Comprendere e Raffinare

Contenu connexe

Similaire à 2.4 DATI: Comprendere e Raffinare

Formez Opendata Inps - webinar 29 marzo 2012
Formez Opendata Inps - webinar 29 marzo 2012Formez Opendata Inps - webinar 29 marzo 2012
Formez Opendata Inps - webinar 29 marzo 2012
INPSDG
 
(Ebook ita - inform - access) guida al database access (doc)
(Ebook   ita - inform - access) guida al database access (doc)(Ebook   ita - inform - access) guida al database access (doc)
(Ebook ita - inform - access) guida al database access (doc)
UltraUploader
 

Similaire à 2.4 DATI: Comprendere e Raffinare (20)

Medie2223_Comprendere i dati_raffinare
Medie2223_Comprendere i dati_raffinareMedie2223_Comprendere i dati_raffinare
Medie2223_Comprendere i dati_raffinare
 
3.4 Osserva i tuoi dati - raffina
3.4 Osserva i tuoi dati - raffina3.4 Osserva i tuoi dati - raffina
3.4 Osserva i tuoi dati - raffina
 
Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno...
Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno...Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno...
Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno...
 
3.5 Osserva i tuoi dati - Analizza
3.5 Osserva i tuoi dati - Analizza3.5 Osserva i tuoi dati - Analizza
3.5 Osserva i tuoi dati - Analizza
 
Medie2223_Comprendere i dati_analizzare
Medie2223_Comprendere i dati_analizzareMedie2223_Comprendere i dati_analizzare
Medie2223_Comprendere i dati_analizzare
 
Opendata inps
Opendata inps Opendata inps
Opendata inps
 
Open data INPS
Open data INPS Open data INPS
Open data INPS
 
Data Journalism: strumenti operativi | Bologna, 9 giugno 2014
Data Journalism: strumenti operativi | Bologna, 9 giugno 2014Data Journalism: strumenti operativi | Bologna, 9 giugno 2014
Data Journalism: strumenti operativi | Bologna, 9 giugno 2014
 
Big data-simonetta
Big data-simonettaBig data-simonetta
Big data-simonetta
 
ML.NET al Visual Studio Saturday 2018
ML.NET al Visual Studio Saturday 2018ML.NET al Visual Studio Saturday 2018
ML.NET al Visual Studio Saturday 2018
 
Formez Opendata Inps - webinar 29 marzo 2012
Formez Opendata Inps - webinar 29 marzo 2012Formez Opendata Inps - webinar 29 marzo 2012
Formez Opendata Inps - webinar 29 marzo 2012
 
Festival del Controllo di Gestione
Festival del Controllo di GestioneFestival del Controllo di Gestione
Festival del Controllo di Gestione
 
Modulo5
Modulo5Modulo5
Modulo5
 
Strutture dati 00-corso2018
Strutture dati 00-corso2018Strutture dati 00-corso2018
Strutture dati 00-corso2018
 
Le percentuali non bastano
Le percentuali non bastanoLe percentuali non bastano
Le percentuali non bastano
 
Le percentuali non bastano
Le percentuali non bastanoLe percentuali non bastano
Le percentuali non bastano
 
Dataset prodotti "manualmente"
Dataset prodotti "manualmente"Dataset prodotti "manualmente"
Dataset prodotti "manualmente"
 
(Ebook ita - inform - access) guida al database access (doc)
(Ebook   ita - inform - access) guida al database access (doc)(Ebook   ita - inform - access) guida al database access (doc)
(Ebook ita - inform - access) guida al database access (doc)
 
2014 ottobre Big Data per Madee 6
2014 ottobre Big Data per Madee 62014 ottobre Big Data per Madee 6
2014 ottobre Big Data per Madee 6
 
Linked data parliamo di semantica del web - v2
Linked data   parliamo di semantica del web - v2Linked data   parliamo di semantica del web - v2
Linked data parliamo di semantica del web - v2
 

Plus de A Scuola di OpenCoesione

Plus de A Scuola di OpenCoesione (20)

ASOC2324_In-Class Exercise_Creative formats
ASOC2324_In-Class Exercise_Creative formatsASOC2324_In-Class Exercise_Creative formats
ASOC2324_In-Class Exercise_Creative formats
 
ASOC2324_Creative formats and presentation
ASOC2324_Creative formats and presentationASOC2324_Creative formats and presentation
ASOC2324_Creative formats and presentation
 
Esercitazione (LEZIONE 4) - I format creativi
Esercitazione (LEZIONE 4) - I format creativiEsercitazione (LEZIONE 4) - I format creativi
Esercitazione (LEZIONE 4) - I format creativi
 
ASOC2324_TUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHON_MEDIE_
ASOC2324_TUTORIAL PER L’UTILIZZO  DELLA PIATTAFORMA MONITHON_MEDIE_ASOC2324_TUTORIAL PER L’UTILIZZO  DELLA PIATTAFORMA MONITHON_MEDIE_
ASOC2324_TUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHON_MEDIE_
 
ASOC2324_TUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHON
ASOC2324_TUTORIAL PER L’UTILIZZO  DELLA PIATTAFORMA MONITHONASOC2324_TUTORIAL PER L’UTILIZZO  DELLA PIATTAFORMA MONITHON
ASOC2324_TUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHON
 
Tutorial for using the Monithon Platform - ASOC2324 EN
Tutorial for using the Monithon Platform  - ASOC2324 ENTutorial for using the Monithon Platform  - ASOC2324 EN
Tutorial for using the Monithon Platform - ASOC2324 EN
 
ASOC2324 EN - Planning the Monitoring Visit
ASOC2324 EN - Planning the Monitoring VisitASOC2324 EN - Planning the Monitoring Visit
ASOC2324 EN - Planning the Monitoring Visit
 
ASOC2324_TUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHON
ASOC2324_TUTORIAL PER L’UTILIZZO  DELLA PIATTAFORMA MONITHONASOC2324_TUTORIAL PER L’UTILIZZO  DELLA PIATTAFORMA MONITHON
ASOC2324_TUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHON
 
TUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHON
TUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHONTUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHON
TUTORIAL PER L’UTILIZZO DELLA PIATTAFORMA MONITHON
 
Medie_Lezione 2_Esercitazione in classe con esperto/a
Medie_Lezione 2_Esercitazione in classe con esperto/aMedie_Lezione 2_Esercitazione in classe con esperto/a
Medie_Lezione 2_Esercitazione in classe con esperto/a
 
ASOC Medie_Guida agli Open Data di OpenCoesione
ASOC Medie_Guida agli Open Data di OpenCoesioneASOC Medie_Guida agli Open Data di OpenCoesione
ASOC Medie_Guida agli Open Data di OpenCoesione
 
Esercitazione in classe con l'esperto/a Istat
Esercitazione in classe con l'esperto/a IstatEsercitazione in classe con l'esperto/a Istat
Esercitazione in classe con l'esperto/a Istat
 
Comprendere i dati: strumenti principali
Comprendere i dati: strumenti principaliComprendere i dati: strumenti principali
Comprendere i dati: strumenti principali
 
Guida agli Open Data di OpenCoesione.pdf
Guida agli Open Data di OpenCoesione.pdfGuida agli Open Data di OpenCoesione.pdf
Guida agli Open Data di OpenCoesione.pdf
 
TIPS: How To Write An Article - ASOC2324 EN
TIPS: How To Write An Article - ASOC2324 ENTIPS: How To Write An Article - ASOC2324 EN
TIPS: How To Write An Article - ASOC2324 EN
 
Data expedition_Scuole medie
Data expedition_Scuole medieData expedition_Scuole medie
Data expedition_Scuole medie
 
Data expedition
Data expeditionData expedition
Data expedition
 
Le ricerche di ASOC
Le ricerche di ASOCLe ricerche di ASOC
Le ricerche di ASOC
 
Dossier di Ricerca - ASOC2324
Dossier di Ricerca - ASOC2324Dossier di Ricerca - ASOC2324
Dossier di Ricerca - ASOC2324
 
Data expedition - ASOC2324
Data expedition - ASOC2324Data expedition - ASOC2324
Data expedition - ASOC2324
 

Dernier

Presentazione tre geni della tecnologia informatica
Presentazione tre geni della tecnologia informaticaPresentazione tre geni della tecnologia informatica
Presentazione tre geni della tecnologia informatica
nico07fusco
 
presentazione varietà allotropiche del carbonio.pptx
presentazione varietà allotropiche del carbonio.pptxpresentazione varietà allotropiche del carbonio.pptx
presentazione varietà allotropiche del carbonio.pptx
michelacaporale12345
 
Adducchio.Samuel-Steve_Jobs.ppppppppppptx
Adducchio.Samuel-Steve_Jobs.ppppppppppptxAdducchio.Samuel-Steve_Jobs.ppppppppppptx
Adducchio.Samuel-Steve_Jobs.ppppppppppptx
sasaselvatico
 

Dernier (20)

Palestini Aurora-Steve Jobs,Olivetti e Gates.pptx
Palestini Aurora-Steve Jobs,Olivetti e Gates.pptxPalestini Aurora-Steve Jobs,Olivetti e Gates.pptx
Palestini Aurora-Steve Jobs,Olivetti e Gates.pptx
 
Presentazione tre geni della tecnologia informatica
Presentazione tre geni della tecnologia informaticaPresentazione tre geni della tecnologia informatica
Presentazione tre geni della tecnologia informatica
 
presentazione varietà allotropiche del carbonio.pptx
presentazione varietà allotropiche del carbonio.pptxpresentazione varietà allotropiche del carbonio.pptx
presentazione varietà allotropiche del carbonio.pptx
 
Piccole Personetestoitaliano-AuroraPalestini.docx
Piccole Personetestoitaliano-AuroraPalestini.docxPiccole Personetestoitaliano-AuroraPalestini.docx
Piccole Personetestoitaliano-AuroraPalestini.docx
 
Educazione civica-Asia Pancia powerpoint
Educazione civica-Asia Pancia powerpointEducazione civica-Asia Pancia powerpoint
Educazione civica-Asia Pancia powerpoint
 
Esame di Stato 2024 - Materiale conferenza online 09 aprile 2024
Esame di Stato 2024 - Materiale conferenza online 09 aprile 2024Esame di Stato 2024 - Materiale conferenza online 09 aprile 2024
Esame di Stato 2024 - Materiale conferenza online 09 aprile 2024
 
CHIẾN THẮNG KÌ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN - PHAN THẾ HOÀI (36...
CHIẾN THẮNG KÌ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN - PHAN THẾ HOÀI (36...CHIẾN THẮNG KÌ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN - PHAN THẾ HOÀI (36...
CHIẾN THẮNG KÌ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN - PHAN THẾ HOÀI (36...
 
TeccarelliLorenzo-Mitodella.cavernaa.pdf
TeccarelliLorenzo-Mitodella.cavernaa.pdfTeccarelliLorenzo-Mitodella.cavernaa.pdf
TeccarelliLorenzo-Mitodella.cavernaa.pdf
 
Gli isotopi scienze naturale seconda pres
Gli isotopi scienze naturale seconda presGli isotopi scienze naturale seconda pres
Gli isotopi scienze naturale seconda pres
 
a scuola di biblioVerifica: come utilizzare il test TRAAP
a scuola di biblioVerifica: come utilizzare il test TRAAPa scuola di biblioVerifica: come utilizzare il test TRAAP
a scuola di biblioVerifica: come utilizzare il test TRAAP
 
Le forme allotropiche del C-Palestini e Pancia.docx
Le forme allotropiche del C-Palestini e Pancia.docxLe forme allotropiche del C-Palestini e Pancia.docx
Le forme allotropiche del C-Palestini e Pancia.docx
 
magia, stregoneria, inquisizione e medicina.pptx
magia, stregoneria, inquisizione e medicina.pptxmagia, stregoneria, inquisizione e medicina.pptx
magia, stregoneria, inquisizione e medicina.pptx
 
Adducchio.Samuel-Steve_Jobs.ppppppppppptx
Adducchio.Samuel-Steve_Jobs.ppppppppppptxAdducchio.Samuel-Steve_Jobs.ppppppppppptx
Adducchio.Samuel-Steve_Jobs.ppppppppppptx
 
Una breve introduzione ad Elsa Morante, vita e opere
Una breve introduzione ad Elsa Morante, vita e opereUna breve introduzione ad Elsa Morante, vita e opere
Una breve introduzione ad Elsa Morante, vita e opere
 
Pancia Asia-Pelusi Sara-La pittura romana - Copia (1).pptx
Pancia Asia-Pelusi Sara-La pittura romana - Copia (1).pptxPancia Asia-Pelusi Sara-La pittura romana - Copia (1).pptx
Pancia Asia-Pelusi Sara-La pittura romana - Copia (1).pptx
 
magia, stregoneria, inquisizione e medicina.pptx
magia, stregoneria, inquisizione e medicina.pptxmagia, stregoneria, inquisizione e medicina.pptx
magia, stregoneria, inquisizione e medicina.pptx
 
Pancia Asia-La vita di Steve Jobs-Adriano Olivetti-Bill Gates.pptx
Pancia Asia-La vita di Steve Jobs-Adriano Olivetti-Bill Gates.pptxPancia Asia-La vita di Steve Jobs-Adriano Olivetti-Bill Gates.pptx
Pancia Asia-La vita di Steve Jobs-Adriano Olivetti-Bill Gates.pptx
 
PalestiniAurora-la conoscenzatestoita.docx
PalestiniAurora-la conoscenzatestoita.docxPalestiniAurora-la conoscenzatestoita.docx
PalestiniAurora-la conoscenzatestoita.docx
 
TeccarelliLorenzo-i4stilidellapitturaromana.docx
TeccarelliLorenzo-i4stilidellapitturaromana.docxTeccarelliLorenzo-i4stilidellapitturaromana.docx
TeccarelliLorenzo-i4stilidellapitturaromana.docx
 
Pancia Asia_relazione laboratorio(forza d'attrito).docx
Pancia Asia_relazione laboratorio(forza d'attrito).docxPancia Asia_relazione laboratorio(forza d'attrito).docx
Pancia Asia_relazione laboratorio(forza d'attrito).docx
 

2.4 DATI: Comprendere e Raffinare

  • 1.
  • 3. COMPRENDERE I DATI PER USARLI AL MEGLIO
  • 4. COMPRENDERE I DATI I dati che avete a disposizione potrebbero dirvi tante cose del fenomeno che state osservando.
  • 5. COMPRENDERE I DATI Per farli “parlare”, cercate di capirli a pieno. Fatevi queste domande: ● Che tipo di informazioni definiscono? ● Quali sono le loro caratteristiche principali? ● Che impatto hanno sulla realtà?
  • 6. COMPRENDERE I DATI E’ importante: ● capire bene la natura dei dati ● capire come analizzarli attraverso alcune semplici operazioni
  • 7. LE CARATTERISTICHE DEI VOSTRI DATI: GEOGRAFICHE, TEMPORALI, DESCRITTIVE
  • 8. DATI GEOGRAFICI I dati che state utilizzando per i vostri lavori potrebbero contenere informazioni di tipo geografico. Dirvi, cioè, qual è la misura di un fenomeno su un determinato territorio.
  • 9. DATI GEOGRAFICI ○ A quale territorio sono riferiti? Nazionale, regionale, provinciale o comunale? ○ Qual è il nesso tra questo territorio e il progetto da voi scelto su OpenCoesione e che state approfondendo? ○ Quali informazioni aggiuntive potreste raccogliere analizzando le informazioni geografiche dei vostri dati?
  • 10. SERIE STORICHE I dati possono permettere di analizzare l’andamento di un fenomeno nel tempo e misurarne le variazioni (per esempio da un mese all’altro o da un anno all’altro).
  • 11. SERIE STORICHE: ESEMPI La raccolta differenziata dei rifiuti è aumentata, diminuita o rimasta stabile? Il numero di turisti sul un territorio è costante di anno o anno o ci sono delle variazioni? Il fenomeno in esame è in crescita o in descrescita (per esempio, di mese in mese)?
  • 12. Per capire quanto possano essere importanti le informazioni contenute nelle serie storiche, andate anche a curiosare nelle banche dati Istat… SERIE STORICHE: ESEMPI (ISTAT)
  • 13. DATI QUALITATIVI Si tratta di dati che definiscono le qualità e le caratteristiche intrinseche di uno o più oggetti.
  • 14. DATI QUALITATIVI: ESEMPIO Un esempio: i prodotti tipici trentini (da OpenData Trentino, http://dati.trentino.it/dataset/prodotti-tradizionali-trentini). Ciascun prodotto viene definito per tipologia, luogo di produzione, link di approfondimento. Si tratta di qualità aggiuntive del dato disponibili per il fruitore.
  • 15. Quindi chiedetevi: quali caratteristiche hanno i dati che avete raccolto o state raccogliendo? Quali sono quelle che possono interessarvi di più?
  • 17. PULIRE I DATI Prima di analizzare i dati è necessario fare alcune verifiche per renderli coerenti e sfruttarne al meglio tutte le caratteristiche. Esistono metodi specifici anche in questo caso. Vediamo quali…
  • 18. PULIRE I DATI La pulizia dei dati è fondamentale per assicurarsi che siano strutturati bene all’interno delle righe e delle colonne e che i valori inseriti siano coerenti. Analizzare i dati senza fare un attento data cleaning potrebbe portare successivamente a gravi errori o a difficoltà ingestibili. Esistono alcuni strumenti che aiutano la pulizia dei dati, come Open Refine (http://openrefine.org)
  • 19. PULIRE I DATI 1 Controllate che gli stessi valori siano scritti allo stesso modo. Per esempio, se il valore “Ambiente” è scritto anche “ambiente” e “AMBIENTE”, allora è un errore, perché i valori devono essere scritti tutti in maniera analoga.
  • 20. PULIRE I DATI 2 Controllate le date (se presenti): anche queste devono essere scritte in maniera omogenea. È un errore se alcune date sono inserite in formato numerico (esempio: “01/03/2015”) e altre in formato alfanumerico (esempio: “10 marzo 2015”). È necessario avere le date in un solo formato: verificatelo andando su “Formato celle”.
  • 21. PULIRE I DATI 3 Verificate la numerazione. Quella italiana è diversa da quella anglosassone: in Italia i punti (“.”) indicano le migliaia, le virgole (“,”) indicano i decimali, mentre per gli anglosassoni è il contrario. Assicuratevi che i numeri siano rappresentati correttamente. Verificate il sistema di numerazione su “Impostazioni foglio di lavoro”.
  • 23. DIVIDERE I dati devono essere “granulari”, come se fossero degli atomi. Per esempio: se i vostri dati hanno una colonna di luoghi e all’interno hanno un valore come questo: “Cologno Monzese, provincia di Milano (Lombardia)” , è meglio dividere la colonna in altre tre colonne (Comune + Provincia + Regione). Così potete analizzarli per Comune, Provincia, Regione.
  • 24. AGGIUNGERE Non è detto che il vostro dataset vi fornisca tutte le informazioni necessarie. In certi casi potreste essere voi ad arricchirlo, aggiungendo nuove colonne con specifiche informazioni. In parte potreste averlo già fatto, seguendo le indicazioni precedenti, ma possono esserci altri modi per arricchire un dataset…
  • 25. GEOCODING Latitudine Longitudine Usando lo stesso esempio, dopo aver diviso la colonna “Luogo” in tre colonne (Comune, Provincia, Regione), è utile inserire “Latitudine” e “Longitudine” per costruire una mappa. Per farlo, inserirete due nuove colonne (Latitudine e Longitudine) e risalirete alle coordinate geografiche attraverso il luogo di riferimento. LongitudineLatitudine
  • 26. GEOCODING Potete ricavare online le coordinate geografiche. In rete ci sono tanti tool per farlo: cercateli! Assicuratevi sempre che i dati siano riusabili (con OpenStreetMap si può, con GoogleMap con limiti).