SlideShare une entreprise Scribd logo
1  sur  480
Télécharger pour lire hors ligne
1
Introduzione alla statistica
(Parte Prima)
Argomenti
• Nella presente lezione verranno trattati i seguenti
argomenti:
– che cosa è la statistica;
– la storia della statistica;
– la nomenclatura statistica.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
2
Obiettivi
• Con questa lezione ci si propone di raggiungere i seguenti
obiettivi:
– conoscere il significato di statistica;
– conoscere le origine della statistica;
– apprendere i principali termini del linguaggio statistico.
Che cosa è la statistica
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
3
Che cosa è la statistica
• La statistica è la tecnica che ha come scopo la
conoscenza quantitativa dei fenomeni collettivi
(G. Leti 1983).
• I fenomeni collettivi (o di massa), sono tutti quei
fenomeni che non possono essere appresi con una sola
osservazione da parte dell’essere umano, ma hanno
bisogno di essere ‘sintetizzati’ prima di avvicinarsi alla
loro conoscenza.
Che cosa è la statistica
• I fenomeni oggetto di studio possono essere naturali,
sociali, economici, demografici e vengono misurati con
opportune metodologie scientifiche.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
4
In cosa consiste lo studio statistico
di un fenomeno?
Definizione
Misura
Elaborazione
Interpretazione
In cosa consiste lo studio statistico
di un fenomeno?
• La prima operazione è dunque la definizione del
fenomeno, che si basa una esigenza conoscitiva dovuta a
situazioni emergenti o vuoti informativi.
• Una volta definito il fenomeno, si passa alla misurazione
del fenomeno, tramite una fase iniziale di ‘conteggio’; il
conteggio, funzionale alla determinazione della numerosità
di un insieme, è una operazione semplice quando la
collettività è piccola; se la collettività di riferimento è
grande, il conteggio diventa una operazione molto
complessa che richiede tecniche specifiche senza le quali
non si può ottenere la numerosità di un insieme.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
5
• L’elaborazione dei dati avviene attraverso tecniche
specifiche e consiste nel sintetizzare il fenomeno attraverso
indicatori, tavole, grafici, in grado di rendere un fenomeno
interpretabile e confrontabile.
• Lo studio dei fenomeni collettivi è preceduto da una
schematizzazione che consiste nella definizione del
fenomeno stesso, nella definizione del collettivo di
riferimento e nella scelta dei caratteri attraverso i quali
vogliamo studiare il fenomeno stesso.
In cosa consiste lo studio statistico
di un fenomeno?
• Dopo la schematizzazione seguono due possibili casi:
• Dopo la schematizzazione segue
l’osservazione (raccolta, ordinamento e
classificazione del materiale) e,
attraverso misure di sintesi operate con
diversi procedimenti, si passa alla
descrizione del fenomeno oggetto.
La collettività è
interamente da
osservare
•Dopo la schematizzazione segue una
formulazione di ipotesi sul collettivo totale
(universo) e di definizione di un modello
statistico. Segue poi l’osservazione del
collettivo ridotto (campione) e per
concludere l’inferenza (o induzione) che
consiste nel far risalire il collettivo ridotto a
quello totale, e seguente verifica delle
ipotesi formulate.
Della collettività
viene osservata
solo una parte
In cosa consiste lo studio statistico
di un fenomeno?
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
6
Le origine della statistica
Le origini della statistica
• Come molte altre scienze la Statistica ha avuto due fasi
successive:
Attività
pratica
Fase
metodologica
Soluzione dei problemi
pratici della vita
Teorizzazione e
determinazione di norme
generali
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
7
Le origini della statistica come
attività pratica
• Si ipotizza che già dall’Era
primitiva, ancor prima
dell’avvento della scrittura,
l’uomo avesse innato il
pensiero di affidare i
risultati della caccia, della
pesca, dell’agricoltura, ecc.
non solo alla memoria ma
sentisse il bisogno di
enumerarli facendo incisioni
su legno, grotte, ecc. (es.
nuraghi della Sardegna).
Le origini della statistica come
attività pratica
• Nelle società primitive si
faceva pressante inoltre la
necessità di enumerare la
popolazione, visto che
occorreva una grande
quantità di uomini per
guerre e per le ricostruzioni
(lavori pubblici).
• Nacque così l’esigenza di
fare politiche volte a
incrementare la popolazione
e la necessità di conoscere
e monitorare con costanza
l’ammontare della
popolazione.
Le origini della statistica
hanno una connotazione
prevalentemente
demografica
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
8
Le origini della statistica come
attività pratica
• Le principali rilevazioni statistiche:
•Nella Mesopotamia (IV-II millennio a.C.)
•Ritrovamenti presso i Sumeri di tavole di argilla con
riportate liste di uomini e beni.
• In Assiria, nella biblioteca del re Assurbanipal, sono stati
conservati documenti statistici sulle gerarchie degli ufficiali
amministrativi, sulle province dell’impero e sulle loro
produzioni.
•Antico Egitto (3000 a.C. – 1200 .C.)
•Autori greci e latini raccontano che in Egitto, già a partire
dal 3000 a.C., si realizzarono Censimenti della popolazione
con finalità fiscali, militari, e necessità di manodopera a
disposizione del Faraone (costruzioni piramidi).
• Dal 1200 a.C. cominciano le prime enumerazioni delle
abitazioni e dei suoi abitanti (nominative).
Le origini della statistica come
attività pratica
• Le principali rilevazioni statistiche:
• Popolo d’Israele (1720 a.C. – 1000 a.C.)
•Nella Bibbia sono presenti numerose citazioni a
sostegno di una politica demografica Crescete e
moltiplicatevi (comandato da Dio a Noè),
Moltiplicherò la tua stirpe, Farò che la tua stirpe
sia numerosa come le stelle del cielo o la sabbia
del mare (benedizione di Dio per Abramo, Isacco
e Giacobbe).
Il primo Censimento d’Israele (ordinato da Dio)
risale al 1720 a.C. nel deserto del Sinai da Mosè;
la rilevazione è interamente descritta nel libro
della Bibbia I numeri, il cui nome è dato appunto
dal Censimento.
•La Bibbia racconta poi anche del Censimento
voluto dal re David (II Libro dei Re) per misurare
la propria potenza. Tuttavia, la pestilenza che
seguì venne interpretata come una maledizione
verso le rilevazioni statistiche non comandate da
Dio ma attuate per brama di potere.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
9
Le origini della statistica come
attività pratica
• Le principali rilevazioni statistiche:
•Cina (2200 a.C.-1300 a.C.)
•Nel 2200 a.C., dopo una grave
inondazione, il ministro dell’imperatore
Yao, per conoscere i confini dell’impero
ordina un Censimento della popolazione e
delle terre
• All’epoca dei Ming (1368-1644 d.C) si
realizzavano Censimenti con cadenza
decennale in cui venivano rilevati dati per
età, sesso, identificativo della popolazione
e professione.
•Antica Grecia
•Censimento di Solone (finalità fiscali).
• Primi calcoli delle medie aritmetiche per
sintetizzare i dati.
Le origini della statistica come
attività pratica
• Le principali rilevazioni statistiche:
•Antica Roma, caduta dell’Impero e fine primo millennio
•Secondo Tito Livio il primo Censimento fu ordinato dal Re Servio
Tullio (578-534 a.C) sulla rilevazione congiunta dei cittadini e dei
loro beni e ogni cittadino doveva dichiarare il proprio nome, quello
del padre, quello della moglie e dei figli e l’ammontare dei suoi
beni.
• Per attuare tale dichiarazione il cittadino doveva censere i propri
beni che venivano così valutati e registrati (censiti)
dall’Amministrazione statale.
• I romani venivano così registrati congiuntamente ai loro beni dai
censores (i più alti magistrati romani) nel census, che dà il nome
al “Censimento”.
• Tali registri, tenuti con rigorosa attenzione, avevano finalità
fiscali.
• Dal VI secolo a.C. i Censimenti si ripetono ogni 5 anni.
• Quando l’Impero romano subì le invasioni barbariche con
conseguente scomposizione del territorio in feudi le rilevazioni
statistiche persero importanza fino a cessare, fino a riprendere
moti anni dopo, alla fine del VIII secolo con i Carolingi, con fini
amministrativi e fiscali (Pipino il Breve e Carlo Magno).
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
10
Le origini della statistica come
attività pratica
• Le principali rilevazioni statistiche:
•Dal Medioevo al Rinascimento
•Venne organizzato un “registro dei beni”
presso Abbazie e Monasteri comprendente il
numero degli abitanti e dei terreni ad essi
soggetti, per ricavarne le decime.
• In Inghilterra il re normanno Guglielmo il
Conquistatore (o il bastardo) organizzò il
Catasto dei terreni e costituisce il Doomsday-
Book (1083-86 d.C.) che significa Libro del
Giudizio Finale in quanto legalizzava le
espropriazioni che subivano ad opera dei
normanni.
• La Repubblica Veneta ha una posizione di
eccellenza nell’organizzazione dei Censimenti
grazie alla loro organizzazione, e nel 978
venne stilato un elenco delle persone soggette
al pagamento delle tasse e nel 1171 quella dei
creditori verso lo stato.
Le origini della statistica come
attività pratica
• Le principali rilevazioni statistiche:
•Dal Medioevo al Rinascimento
•Nel 1311 venne istituita la prima Anagrafe in
qualità di rilevazione diretta, nominativa e
universale.
• Nel 1440 il Consiglio dei Dieci istituisce un
piano di rilevazione che può essere considerato
il primo censimento “moderno” della
popolazione che viene distinta per età, sesso,
professione, condizione sociale e nazionalità.
• Nello Stato Pontificio si ha notizia di una prima
rilevazione dei fuochi nel 1092. Vi sono poi
altre enumerazioni dal XV al XVII secolo ma
carenti in quanto a simultaneità e individualità
della rilevazione. I Censimenti pontifici sono il
frutto delle elaborazione degli Stati delle anime
(battesimi, morti) che venivano compilati dai
parroci in maniera obbligatoria a partire dal
1614 con Papa Paolo V.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
11
Le origini della statistica come
attività pratica
• Le principali rilevazioni statistiche:
•Dal Medioevo al Rinascimento
•Sul finire del 1400 si cominciò a seguire l’uso
di conservare tavole in cui venivano iscritti i
nomi di tutti i battezzati, dei loro genitori e dei
padrini sia in Italia sia in Francia; furono pure
introdotti i “registri mortuari” nei quali
venivano registrate le persone decedute.
• Il Concilio di Trento (1565 d.C.) accoglie
questa abitudine ed obbliga i parroci alla
tenuta dei registri dei battesimi, dei matrimoni
e delle morti.
• Ai primi del Cinquecento iniziò in Sicilia la
rilevazione dei beni e delle anime.
• A Napoli il sistema fiscale fu basato sulla
rilevazione dei fuochi dal 1443 con Censimenti
attuati mediamente ogni 15 anni.
Le origini della statistica come
attività pratica
• Le principali rilevazioni statistiche:
•Dal 1600
•Dopo Galileo Galilei (1564-1642 d.C.) l’attività
di semplice conteggio (enumerazione) viene
affiancata dal calcolo di medie con lo scopo di
sintetizzare dei dati, abbandonando
l’aritmetica e indirizzandosi verso la Statistica
vera e propria. In particolare cominciarono le
prime operazioni volte a:
•1) sintetizzare, attraverso varie medie, i dati a
disposizione;
•2) analizzare la variabilità degli stessi;
•3) studiare la dipendenza o indipendenza di
due caratteri.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
12
Le origini della statistica metodologica
• Molti attribuiscono a John Graunt la nascita della nuova
scienza (aritmetica politica) facente parte dell’approccio
metodologico della statistica.
• John Graunt (Londra, 24 aprile 1620
– Londra, 18 aprile 1674) è stato uno
statistico britannico.
– Era un funzionario di quelli che
chiameremmo ufficiale di Stato civile.
– Visse un periodo in cui l’Inghilterra
era colpita da numerose epidemie di
peste, e fu incaricato di tenere i
cosiddetti “bollettini di mortalità ”.
– All’epoca la causa di morte che
veniva indicata nella quasi totalità
dei casi era “peste”.
Le origini della statistica metodologica
Frontespizio delle
Observations on the Bills of
Mortality (1662)
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
13
• Nel 1662 egli condusse delle indagini, che solo oggi
chiameremmo ‘demografiche’, sulla popolazione
londinese, valutandone la mortalità, la natalità e la
distinzione dei sessi.
• Iniziò, infatti, per sua iniziativa ad analizzare le
caratteristiche dei deceduti: età, sesso, lavoro, e, tra
le caratteristiche più importanti per l’epoca, il tipo di area
(urbana o rurale).
• Contribuì alla raccolta sistematica di dati e alla loro
elaborazione.
Le origini della statistica metodologica
Per queste ragioni e viene considerato un
importante precursore della statistica
moderna e uno dei padri fondatori della
demografia (a livello micro)
• Egli inventò, senza saperlo, l’embrione delle tavole di
mortalità, poiché considerando un’unica causa di morte,
cominciò a calcolare la probabilità di morire a seconda
delle caratteristiche della popolazione deceduta.
• Inventò quella parte di demografia che noi chiamiamo
“antropologica”, “medica”, “biologica”, “biometrica”.
• Fu membro della Società Reale di Londra e scrisse
Observations on the Bills of Mortality.
Le origini della statistica metodologica
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
14
Nomenclatura statistica
Nomenclatura statistica
Unità statistica: è l’elemento di base della popolazione sul quale viene
effettuata la rilevazione o la misurazione di uno o più fenomeni oggetto
dell'indagine; è l’oggetto dell’osservazione di ogni fenomeno individuale che
costituisce il fenomeno collettivo
Popolazione statistica (o universo, o collettivo statistico): è
qualsiasi insieme di elementi, reale o ipotetico, presente o futuro, che forma
oggetto di uno studio statistico
Rilevazione statistica: è il complesso di operazioni rivolte ad acquisire
una o più informazioni su un insieme di elementi oggetto di studio
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
15
Nomenclatura statistica
Carattere (o variabile): è la caratteristica che ci permette di analizzare il
fenomeno oggetto di studio, rilevato o misurato sulle unità statistiche
Modalità: è l’espressione concreta del carattere nelle unità statistiche, cioè
il numero (per caratteri quantitativi) o l'attributo (per caratteri qualitativi)
che l'unità statistica manifesta
Frequenza: è il numero di volte che una determinata modalità si verifica
nel collettivo di riferimento
• I caratteri possono essere classificati:
In base al TEMPO
Sempre invariabili
Sono sempre posseduti dall’unità
con la stessa modalità (es. sesso,
data di nascita, ordine di nascita,
ecc.)
Variabili
Cambiano nel corso del tempo
di stato
La modalità è individuata in un
istante di tempo (es. età, peso,
altezza, ecc.)
di movimento
La modalità è individuata in un
intervallo di tempo (es. consumi,
spese, ecc.)
Definitivamente invariabili
Sono presenti in ciascuna unità da
un certo punto in poi (es. anno di
matrimonio, ecc.)
Nomenclatura statistica
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
16
Nomenclatura statistica
• I caratteri possono essere classificati:
In base alla NATURA
Quantitativi
Sono espressi da numeri, sono
misurabili e si possono fare operazioni
di somma e sottrazione
Qualitativi
Sono espressi da attributi qualitativi
Sconnessi
La modalità non sono ordinabili
attraverso una gerarchia (es. sesso,
cittadinanza, ecc.) e si possono fare
solo operazioni di uguaglianza o
disuguaglianza
Ordinati o ordinabili
La modalità sono ordinabili attraverso
una gerarchia (es. livello di istruzione,
professione, ecc.) e si possono fare
operazioni di uguaglianza o
disuguaglianza e ordinamento
Nomenclatura statistica
• I caratteri quantitativi possono essere classificati:
In base alla NATURA
Continui
Se comunque vengono fissati due valori tra le
modalità, tutti i valori intermedi possono essere
assunti come modalità del carattere (es. peso,
statura, età, ecc.)
Discontinui
Se comunque fissati due valori tra le modalità, non
tutti i valori intermedi possono essere assunti come
modalità del carattere.
Discreti
Se comunque viene fissata una modalità esiste
tutto un intervallo, di cui la modalità è il centro, in
cui all’infuori di essa nessun altro valore può essere
espressa come modalità del carattere (numero figli,
numero stanze)
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
17
Conclusioni
• La statistica è la tecnica che ha come scopo la conoscenza
quantitativa dei fenomeni collettivi.
• Sin dalle società primitive si faceva pressante l’esigienza di
non affidare alla memoria il risultato delle attività funzionali
alla sopravvivenza e venivano messe in atto quelle che oggi
chiameremmo politiche demografiche.
• Attraverso la scelta dei caratteri (o variabili) è possibile
analizzare un fenomeno oggetto di studio; i caratteri hanno
diversi modi di essere classificati.
• Le modalità sono l’espressione concreta del carattere nelle
unità statistiche.
Bibliografia
• M. P. Perelli D’Argenzio, Storia della statistica – I momenti
decisivi, L’INSEGNAMENTO DELLA MATEMATICA E DELLE SCIENZE
INTEGRATE, VOL.25A-B N.6 Novembre – Dicembre 2002
• G. Leti, Statistica descrittiva, Soc. Ed. Il Mulino, 1983
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
18
Copyright
AVVISO - Ai sensi dell'art. 1, comma 1 del decreto-legge 22 marzo 2004, n. 72, come modificato
dalla legge di conversione 21 maggio 2004 n. 128, le opere presenti su questo sito hanno assolto
gli obblighi derivanti dalla normativa sul diritto d'autore e sui diritti connessi. Tutti i
contenuti sono proprietà letteraria riservata e protetti dal diritto di autore della Università degli
Studi Guglielmo Marconi.
Si ricorda che il materiale didattico fornito è per uso personale degli studenti, al solo scopo
didattico. Per ogni diverso utilizzo saranno applicate le sanzioni previste dalla legge 22 aprile
1941, n. 633.
Copyright©UNIMARCONI
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
1
Introduzione alla statistica
(Parte Seconda)
Argomenti
• Nella presente lezione verranno trattati i seguenti
argomenti:
– la statistica ufficiale;
– l’informazione statistica;
– la qualità dell’informazione statistica;
– il Sistan;
– l’Istat;
– la tutela della riservatezza dei dati in ambito statistico.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
2
Obiettivi
• Con questa lezione ci si propone di raggiungere i seguenti
obiettivi:
– comprendere cosa si intende per ‘statistica ufficiale’;
– conoscere i requisiti che rendono una statistica ‘ufficiale’;
– capire il significato di ‘informazione statistica’;
– definire il concetto di qualità nel passato e nel presente
attraverso le sue caratteristiche;
– descrivere cosa sono e quali sono le principali funzioni del
Sistan e dell’Istat;
– conoscere le principali norme di tutela della riservatezza
dei dati in ambito statistico.
La statistica ufficiale
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
3
La statistica ufficiale
• La statistica è la scienza che ha per oggetto lo studio
dei fenomeni collettivi suscettibili di misurazione e di
descrizione quantitativa.
• Essa fa riferimento ai soggetti che la producono e la
diffondono.
• Le statistiche ufficiali sono poste al servizio delle
istituzioni, degli operatori economici e del pubblico
ai quali forniscono dati sulla situazione economica,
demografica, sociale e ambientale, e costituiscono un
elemento indispensabile nel sistema informativo di una
società democratica.
La statistica ufficiale
Si parla di statistica pubblica poiché le attività (raccogliere
i dati, elaborarli, diffonderli) sono al servizio dei cittadini e i
prodotti e i servizi hanno la natura di bene pubblico.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
4
Requisiti della statistica ufficiale
• Imparzialità
– libera da pressioni di qualsiasi tipo;
– orientata esclusivamente agli obiettivi perseguiti;
– disponibile a tutti gli utenti (Governo, altre
amministrazioni, operatori economici e sociali, università
ed enti di ricerca, cittadini) contemporaneamente.
• Affidabilità
– il dato prodotto deve essere il più aderente possibile alla
realtà;
– i ‘metadati’ contribuiscono a migliorare l’affidabilità;
– le modalità con cui il sistema statistico pubblico opera
sono di pubblico dominio.
Requisiti della statistica ufficiale
• Pertinenza
– la produzione deve essere guidata da obiettivi e
programmi chiaramente definiti a livello nazionale
(Programma Statistico Nazionale) e/o internazionale
(Programma Statistico dell’Unione Europea).
• Economicità
– uso ottimale delle risorse umane e finanziarie a
disposizione;
– minimizzazione del disturbo statistico.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
5
Requisiti della statistica ufficiale
• Riservatezza
– tutela della privacy e diffusione dei dati solo in forma
aggregata.
• Trasparenza
– tutela dei rispondenti (informazione sullo scopo della
rilevazione, sull’obbligo di risposta, sulle leggi che
garantiscono il rispetto della privacy);
– per facilitare una corretta interpretazione, il dato deve
essere accompagnato da tutte le informazioni riguardanti
le modalità di acquisizione (metodologia, tecnica di
indagine, fonte, ecc.), le definizioni, classificazioni, ecc..
Requisiti della statistica ufficiale
• Le statistiche forniscono al Governo e alle pubbliche
amministrazioni uno strumento per la formulazione e la
valutazione delle politiche e per la gestione dei servizi e
delle funzioni pubbliche.
• Le statistiche forniscono ai cittadini uno strumento di
valutazione sull’azione dell’amministrazione pubblica e
sui risultati da essa conseguiti.
• Salvaguardare l’affidabilità delle statistiche pubbliche e
la fiducia dei cittadini è responsabilità di primaria
importanza.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
6
L’informazione statistica
Caratteristiche dell’informazione
statistica ufficiale
MICRODATI dati rilevati sulla singola unità
MACRODATI
risultato di una funzione dei
dati elementari
METADATI
informazioni di carattere
qualitativo e/o quantitativo
riguardanti le operazioni
effettuate per ottenere il ‘dato’
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
7
Caratteristiche dell’informazione
statistica ufficiale
• I dati utilizzati a fini statistici possono derivare da ogni
tipo di fonte, sia essa una rilevazione statistica o una
documentazione amministrativa.
• Le rilevazioni sono realizzate solo se i dati amministrativi
non sono disponibili o sono insufficienti.
• Le leggi, i regolamenti e i metodi di misura in base ai
quali operano i sistemi statistici debbono essere resi
pubblici.
• L’uso di concetti, classificazioni e metodi concordati a
livello internazionale promuove la coerenza, la
comparabilità e l’efficienza dei sistemi statistici nazionali.
Caratteristiche dell’informazione
statistica ufficiale
• Le istituzioni statistiche debbono poter scegliere la fonte
più appropriata in relazione a:
Qualità
• capacità della
informazione
statistica di
soddisfare le
esigenze
conoscitive
dell’utente
Tempestività
• riduzione del
tempo
intercorrente
tra
l’acquisizione
del dato e la
sua diffusione
Costi
• i costi della
produzione
statistica
pubblica (in
termini
finanziari e di
uso delle
risorse
umane)
devono essere
valutati in
termini di costi
e di benefici
Disturbo
statistico
• le rilevazioni
sono condotte
in modo da
ridurre al
minimo l'onere
dei rispondenti
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
8
Dato, informazione e conoscenza
Dato
•La rappresentazione quantitativa di un fenomeno nel
momento in cui accade o è prodotto
Informazione
•La comprensione e interpretazione del dato, quale
emerge dall’interazione tra soggetti sociali e
nell’attribuzione di significato da parte del destinatario
Conoscenza
•L’attribuzione di valore all’informazione, in funzione
del soddisfacimento di un bisogno dell’utente e
dell’uso nell’assunzione di una decisione
La qualità dell’informazione
statistica
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
9
Qualità dell’informazione statistica
• Oggi è universalmente intesa come un concetto
multidimensionale e dinamico, che coinvolge
numerosi aspetti di natura differente e esigenze
conoscitive degli utenti sempre più diverse.
• Gli strumenti a disposizione della statistica ufficiale per
migliorare la qualità di prodotto e di processo si sono
arricchiti e perfezionati grazie alla disponibilità e alla
diffusione di tecnologie di supporto sempre più evolute.
Qualità dell’informazione statistica
Questo sviluppo ha portato ad una moltiplicazione dei
“soggetti attivi” (soggetti produttivi nel mondo
dell’informazione statistica), portando ad una necessità
crescente di momenti di formazione e armonizzazione degli
strumenti e metodologie in uso.
• Qualità = accuratezza
(vicinanza tra la stima prodotta e
il valore della stessa)
In passato
• Qualità = capacità di soddisfare
gli utenti di informazione
statistica
Oggi
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
10
Componenti della qualità
• Rilevanza
– capacità di soddisfare le reali esigenze degli utenti
ed è valutata a livello di Programma Statistico Nazionale.
• Accuratezza
– riduzione dell’errore ‘non campionario’, nella sua
componente sistematica (distorsioni) e nella sua
componente casuale.
• Tempestività
– riduzione del periodo intercorrente tra il riferimento
temporale del dato e il momento in cui l’informazione è
resa disponibile.
Componenti della qualità
• Accessibilità
– facilità con cui gli utenti possono apprendere
l’informazione, localizzarla e trasferirla.
• Comparabilità e coerenza
– confrontabilità nello spazio e nel tempo;
– confrontabilità delle statistiche tra stessa fonte,
attraverso possibilità di rielaborare i dati in modo
attendibile, e tra fonti diverse attraverso definizioni e
classificazioni standard.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
11
Errore e fasi dell’indagine
Errore
Campionario
Deriva dalla scelta di osservare
non l’intera popolazione ma un
sottoinsieme.
Tali errori sono ‘programmabili’
e si stimano dai ‘dati osservati’,
o ‘totali noti’.
Non
campionario
Possono sorgere in ogni fase
dell’indagine ‘trasmettendosi da
una all’altra, sommandosi,
combinandosi, elidendosi’
L’errore è la differenza tra
la stima prodotta e il valore ‘vero’ della stessa
La statistica ufficiale in Italia – le date cruciali
1861
Divisione Generale della Statistica all’interno del Ministero
dell’Agricoltura, Industria e Commercio Interno
1926
Istituto Centrale di Statistica del Regno d’Italia
1989
Decreto Legislativo 322
Sistema Statistico Nazionale - Sistan
Istituto Nazionale di Statistica - Istat
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
12
Il Sistan
• Rete di soggetti, pubblici e privati, che fornisce
l’informazione statistica ufficiale
• I Soggetti che ne fanno parte:
– Istat
– Enti ed organismi pubblici di informazione statistica (Isae, Inea,
Isfol)
– Uffici di statistica delle amministrazioni ed enti pubblici
– Uffici di statistica degli Uffici territoriali del Governo
– Uffici di statistica degli enti territoriali (regioni, province, comuni,
aziende sanitarie locali, camere di commercio)
– Uffici di statistica di soggetti privati che svolgono funzioni di
interesse pubblico
Il Sistema Statistico Nazionale: che cosa è
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
13
Il Sistan è stato istituito con il decreto legislativo 6
settembre 1989, n. 322, emanato in attuazione della delega
contenuta nell'articolo 24 della legge 400/88, che ha dettato i
principi ed i criteri direttivi per la riforma della statistica pubblica.
Il decreto ha avviato una gestione radicalmente diversa
dell'attività statistica nazionale, aumentando le capacità di
risposta alle esigenze informative del Paese, e, al tempo stesso,
riducendo le ridondanze causate principalmente dalla mancanza
di coordinamento fra i diversi produttori.
Il Sistema Statistico Nazionale: le norme
Obiettivo primario del Sistan è quello di fornire al Paese
e agli organismi internazionali una informazione
statistica ufficiale che soddisfi i seguenti principi:
affidabilità, imparzialità, pertinenza, tempestività, tutela
della riservatezza, trasparenza, minimo carico sui
rispondenti, efficienza. Sul piano organizzativo, il Sistema si
basa sui principi di autonomia, differenziazione, adeguatezza e
sussidiarietà.
Il Sistema Statistico Nazionale: gli obiettivi
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
14
Il Comitato di indirizzo e coordinamento dell’informazione
statistica è l'organo di governo del Sistema statistico nazionale,
esercita funzioni direttive nei confronti degli uffici di statistica e
delibera il Programma statistico nazionale.
Il Comitato dura in carica quattro anni e i suoi membri possono essere
riconfermati per non più di due volte.
Come stabilito dal dpr 166/2010 il Comitato è composto da 15
membri: dal presidente dell’Istituto, che lo presiede; da due membri in
rappresentanza del Ministero dell’economia e delle finanze e da
quattro membri in rappresentanza di altre amministrazioni statali,
individuate dal Presidente del Consiglio dei Ministri, sentito il
presidente dell’Istat; da tre rappresentanti delle regioni e degli enti
locali; da un rappresentante designato dal presidente di Unioncamere;
da due rappresentanti di enti pubblici tra quelli dotati dei più complessi
sistemi d’informazione; da due esperti scelti tra i professori ordinari di
ruolo di prima fascia in materie statistiche, economiche e affini.
Il Sistema Statistico Nazionale: il governo
del sistema
La vigilanza sulle attività del Sistan è affidata alla
Commissione per la garanzia dell'informazione
statistica che è un organo esterno, autonomo e indipendente.
In particolare, la Commissione vigila su: imparzialità e
completezza dell'informazione statistica; qualità delle
metodologie; conformità delle rilevazioni alle direttive degli
organismi internazionali e comunitari.
La Commissione, istituita presso la Presidenza del Consiglio dei
Ministri, è composta da sei professori ordinari o direttori di
Istituti di statistica o di ricerca statistica non facenti parte del
Sistan e da tre alti dirigenti di enti e amministrazioni pubbliche
non preposti ad uffici facenti parte del Sistan.
Il Sistema Statistico Nazionale: la vigilanza
del sistema
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
15
La programmazione dell'attività statistica di interesse pubblico
affidata al Sistan avviene attraverso il Programma statistico
nazionale (Psn), che ha valenza triennale ed è aggiornato ogni
anno. Il Psn individua le rilevazioni, le elaborazioni, gli studi
progettuali e i sistemi informativi statistici che uffici, enti e
organismi del Sistan sono chiamati a realizzare per soddisfare il
fabbisogno informativo del Paese. Di grande importanza nella
definizione del Programma è l'armonizzazione con i programmi di
altri organismi internazionali, specialmente con quello dell'Unione
Europea. Il Psn è il risultato di una articolata procedura, che
garantisce l'autonomia scientifica delle rilevazioni, la
partecipazione di tutti i soggetti responsabili della produzione di
statistiche pubbliche, la tutela della privacy di cittadini e imprese.
Il Sistema Statistico Nazionale: il PSN
• Il Sistema statistico europeo (ESS) ha per finalità quella di fornire
alle istituzioni comunitarie informazioni statistiche affidabili e
comparabili.
• È formato da:
• Eurostat, l’Ufficio Statistico delle Comunità Europee;
• Istituti Nazionali di statistica dei Paesi della Comunità;
• Ministeri, Agenzie, Banche centrali che producono statistiche ufficiali nei
Paesi membri della Comunità.
• Funziona come una rete coordinata da Eurostat che ha il compito di
condurre, in stretta collaborazione con le Autorità statistiche
nazionali, ad una progressiva armonizzazione delle statistiche
prodotte dai Paesi.
• L’armonizzazione è prioritariamente rivolta alle aree di intervento
delle politiche europee e, gradualmente, si sta estendendo a tutti i
campi.
Il Sistema Statistico Nazionale è parte del
Sistema Statistico Europeo
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
16
• Istituita nel 1953 per rispondere alle esigenze informative
della Comunità del carbone e dell’acciaio.
• Alla fondazione della Comunità Europea, nel 1958, diventa
una DG della Commissione Europea
• Missione:
– elaborare e pubblicare informazioni statistiche comparabili
a livello europeo;
– mettere a punto un linguaggio statistico comune
(definizioni, classificazioni e metodi comuni).
Non raccoglie direttamente dati, ma utilizza dati
raccolti dalle autorità statistiche degli stati membri.
Eurostat
L’Istat
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
17
L’Istituto Nazionale di Statistica (Istat)
• istituito con legge n. 1162/1926.
E’ persona giuridica di diritto pubblico ed ha ordinamento
autonomo.
Sono organi dell'Istituto:
• il presidente;
• il comitato per l'indirizzo e il coordinamento dell'informazione
statistica;
• il consiglio;
• il collegio dei revisori dei conti.
L'Istat è sottoposto alla vigilanza del Presidente del Consiglio dei
ministri tramite la Commissione per la garanzia dell’informazione
statistica.
L’Istituto Nazionale di Statistica (Istat): che cosa è
Principali compiti dell’Istat:
• predisposizione del Programma Statistico Nazionale;
• esecuzione dei censimenti e delle altre rilevazioni statistiche
previste dal programma statistico nazionale ed affidate all’esecuzione
dell'Istituto;
• indirizzo e coordinamento delle attività statistiche degli enti ed
uffici facenti parte del Sistema statistico nazionale;
• predisposizione delle nomenclature e metodologie di base per
la classificazione e la rilevazione dei fenomeni di carattere
demografico, economico e sociale;
• promozione e sviluppo informatico a fini statistici degli archivi
gestionali e delle raccolte di dati amministrativi;
• svolgimento di attività di formazione e di qualificazione
professionale per gli addetti al Sistema statistico nazionale;
• rapporti con enti ed uffici internazionali operanti nel settore
dell'informazione statistica.
L’Istituto Nazionale di Statistica (Istat):
i compiti
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
18
La tutela della riservatezza dei
dati in ambito statistico
La riservatezza dei dati personali in campo statistico era tutelata dal d.lgs n.
322/ 89 che conteneva disposizioni sul segreto d’ufficio (art.8) e sul segreto
statistico (art. 9).
La legge 675/1996 disciplina condizioni, modalità e garanzie relativamente a
tutti i trattamenti di dati personali, compresi quelli effettuati in ambito statistico.
Con la legge 676/1996 il Parlamento delega il Governo ad emanare decreti
legislativi in materia di tutela della riservatezza per i trattamenti di dati personali
effettuati per finalità storiche, statistiche e di ricerca scientifica.
In attuazione della delega, il Governo emana il decreto legislativo n. 281/1999,
che integra e modifica sia il d.lgs n. 322/89 sia la legge n. 675/1996.
Il 29 luglio 2003 viene emanato il testo unico che rivede e organizza tutte le
disposizioni in merito : Codice in materia di protezione dei dati personali
che è entrato in vigore il 1.1.2004, Decreto legislativo 30 giugno
2003, n. 196.
Tutela della riservatezza dei dati in ambito
statistico: la privacy
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
19
Art. 1 (Diritto alla protezione dei dati personali)
Chiunque ha diritto alla protezione dei dati personali che lo riguardano.
Art. 3 (Principio di necessità nel trattamento dei dati)
I sistemi informativi e i programmi informatici sono configurati
riducendo al minimo l’utilizzazione di dati personali e di dati identificativi
se ne deve escludere il trattamento quando le finalità perseguite
possono essere realizzate mediante:
- dati anonimi;
- modalità di trattamento che permettano di identificare
l’interessato solo in caso di necessità.
Tutela della riservatezza dei dati in ambito
statistico: il codice in materia di protezione
dei dati personali
Dati sensibili
•i dati personali idonei
a rivelare l'origine
razziale ed etnica, le
convinzioni religiose,
filosofiche o di altro
genere, le opinioni
politiche, l'adesione a
partiti, sindacati,
associazioni od
organizzazioni a
carattere religioso,
filosofico, politico o
sindacale, nonché i
dati personali idonei a
rivelare lo stato di
salute e la vita
sessuale
Dati anonimi
•il dato che in origine,
o a seguito di
trattamento, non può
essere associato ad un
interessato identificato
o identificabile
Dati
identificativi
•i dati personali che
permettono
l’identificazione
diretta
dell’interessato
Dati
personali
•informazione relativa
a persona fisica,
persona giuridica,
ente od associazione,
identificati o
identificabili, anche
indirettamente,
mediante riferimento
a qualsiasi altra
informazione, ivi
compreso un numero
di identificazione
personale
Tutela della riservatezza dei dati in ambito
statistico: il codice in materia di protezione
dei dati personali
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
20
Interessato
•la persona fisica cui si
riferiscono i dati
personali
Incaricato
•le persone fisiche
autorizzate a compiere
operazioni di
trattamento dal titolare
o dal responsabile
Responsabile
•la persona fisica, la
persona giuridica, la
pubblica
amministrazione e
qualsiasi altro ente,
associazione od
organismo preposti
dal titolare al
trattamento di dati
personali
Titolare
•la persona fisica, la
persona giuridica, la
pubblica
amministrazione e
qualsiasi altro ente,
associazione od
organismo cui
competono, anche
unitamente ad altro
titolare, le decisioni in
ordine alle finalità,
alle modalità del
trattamento di dati
personali e agli
strumenti utilizzati, ivi
compreso il profilo
della sicurezza
Tutela della riservatezza dei dati in ambito
statistico: il codice in materia di protezione
dei dati personali
Regolamentato dal d.lgs. 6 settembre 1989, n. 322 e successive
modifiche introdotte dal d.lgs. 30 luglio 1999, n. 281.
.
Nasce con l’obiettivo di migliorare la qualità dell'informazione
statistica scoraggiando i soggetti fornitori del dato, a rilasciare
informazioni errate a scopi opportunistici.
In base al decreto i dati raccolti nell'ambito di rilevazioni statistiche
comprese nel programma statistico nazionale, possono essere utilizzati
esclusivamente a fini statistici e non possono essere comunicati ad
alcun soggetto - pubblico o privato - estraneo al Sistema statistico
nazionale, né essere diffusi, se non in forma aggregata e secondo
modalità che rendano non identificabili i soggetti interessati.
Tutela della riservatezza dei dati in ambito
statistico: il segreto statistico
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
21
Per garantire la tutela del segreto statistico e la protezione dei
dati personali l’Istat e tutti gli organi del Sistan sono tenuti ad
adottare opportune misure organizzative, logistiche,
informatiche, metodologiche e statistiche, secondo gli standard
definiti a livello internazionale.
Tutela della riservatezza dei dati in ambito
statistico: il segreto statistico
Conclusioni
• La statistica ufficiale deve rispondere a specifici requisiti.
• L’informazione statistica comprende microdati, macrodati
e metadati.
• La qualità è un requisito fondamentale dell’informazione
statistica.
• Fornire l’informazione statistica ‘ufficiale’ è compito del
Sistan di cui L’Istat è parte integrante.
• L’Istat e tutti gli organi del Sistan, sono tenuti per legge a
garantire il diritto alla riservatezza e all'identità personale.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
22
• http://www.garanteprivacy.it
• http://www.sistan.it
• http://www.istat.it
Sitografia
Copyright
AVVISO - Ai sensi dell'art. 1, comma 1 del decreto-legge 22 marzo 2004, n. 72, come modificato
dalla legge di conversione 21 maggio 2004 n. 128, le opere presenti su questo sito hanno assolto
gli obblighi derivanti dalla normativa sul diritto d'autore e sui diritti connessi. Tutti i
contenuti sono proprietà letteraria riservata e protetti dal diritto di autore della Università degli
Studi Guglielmo Marconi.
Si ricorda che il materiale didattico fornito è per uso personale degli studenti, al solo scopo
didattico. Per ogni diverso utilizzo saranno applicate le sanzioni previste dalla legge 22 aprile
1941, n. 633.
Copyright©UNIMARCONI
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
1
La rilevazione statistica
(Parte Prima)
Argomenti
• Nella presente lezione verranno trattati i seguenti
argomenti:
– tipologie di rilevazioni statistiche;
– l’indagine statistica;
– le fasi di un’indagine statistica;
– gli errori non campionari.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
2
Obiettivi
• Con questa lezione ci si propone di raggiungere i
seguenti obiettivi:
– comprendere cos’è un’indagine statistica;
– capire le differenze tra le principali tipologie di
rilevazioni statistiche;
– seguire il percorso che porta allo svolgimento di
un’indagine statistica attraverso le sue fasi;
– definire il concetto di accuratezza del dato rilevato
attraverso la descrizione dell’errore.
L’indagine statistica
L'indagine statistica è lo strumento statistico mediante il
quale si acquisiscono informazioni su uno o più fenomeni
attinenti ad una popolazione.
Scopo dell’indagine è quello di produrre informazioni
statistiche, ovvero descrizioni riassuntive di carattere
quantitativo, riguardanti un collettivo di interesse.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
3
• nasce per scopi puramente statistici con
l’obiettivo di analizzare uno o più
fenomeni relativi ad un collettivo di
interesse
Indagine
statistica
classica
• si utilizzano dati già raccolti a fini
amministrativi (fini che comunque non
sono di carattere statistico)
Indagine da
fonte
amministrativa
• si elaborano dati (micro e/o macro)
provenienti da altre rilevazioni
Elaborazioni (o
studi secondari)
Tipologie di indagini statistiche
Implica la raccolta di informazioni su tutte le unità
statistiche appartenenti al collettivo di interesse.
La sua realizzazione richiede costi molto elevati ed una
struttura organizzativa complessa; per queste ragioni,
nell’ambito della statistica ufficiale, questa tipologia
d’indagine viene adottata in casi di eccezionale
importanza come il più noto “Censimento (generale
della popolazione)”.
Oltre al Censimento generale della popolazione, si ricorre ad
indagini esaustive ogni qual volta il collettivo di interesse
è costituito da poche unità (ad esempio il fatturato delle
grandi imprese); in questo caso l’omissione di anche una
sola di esse comporterebbe una distorsione tale da
inficiare la qualità delle stime prodotte.
Indagine statistica classica - censuaria
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
4
Si abbandona l’opzione censuaria per ripiegarsi su
osservazioni e quantificazioni del fenomeno di interesse
che riguardano solo una parte (campione) del collettivo
(universo di riferimento); il fenomeno misurato deve
mantenere le caratteristiche che presenta nell’universo.
L’indagine condotta su un sub-universo consente di ridurre l’onere
della rilevazione (in termini di tempestività ed economicità) e di
destinare maggiore attenzione a tutte le attività connesse al
controllo della qualità dei dati raccolti; tuttavia la qualità dei dati
è fortemente legata alla rappresentatività del campione
selezionato per il quale si fa uno studio accurato del disegno
campionario in base alle caratteristiche dell’indagine.
La selezione di un campione implica una minore attendibilità
delle stime riferite ai parametri di interesse (ERRORE
CAMPIONARIO) rispetto all’osservazione di tutte le unità
presenti nel collettivo.
Indagine statistica classica - campionaria
L’indagine da fonte amministrativa
È una indagine che utilizza dati amministrativi per
finalità di tipo statistico.
I dati amministrativi sono informazioni raccolte e
conservate da istituzioni pubbliche ai fini di controllo o di
intervento nei confronti di singoli individui o entità di altro
tipo (es. persone giuridiche). Il fine, amministrativo, della
raccolta di tali dati ne contraddistingue quindi la natura.
Ad esempio sono dati amministrativi quelli raccolti su
persone ed imprese ai fini fiscali, pensionistici, anagrafici
o giuridici.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
5
Affinché il dato amministrativo possa essere utilizzato a fini
statistici è necessario:
– che le variabili di interesse siano oggetto di
“osservazione” da parte di un processo
amministrativo;
– che il risultato di tale processo sia disponibile e che la
qualità dei dati sia adeguata allo scopo;
– che la popolazione di riferimento sia uguale oppure
contenuta nella popolazione definita dalla norma
generatrice dell’archivio amministrativo.
Può essere necessario procedere all’integrazione di
più archivi amministrativi (linkage) per realizzare
un prodotto statistico.
L’indagine da fonte amministrativa
Elaborazioni (o studi secondari)
Si parla di "elaborazioni" quando la produzione di
informazioni statistiche avviene a seguito del
trattamento di dati statistici già disponibili
(perché derivanti da precedenti rilevazioni,
dall'uso di archivi amministrativi o altre statistiche
derivate).
Si possono elaborare dati provenienti da una o più fonti e
l'acquisizione del dato statistico può avvenire a livello di
microdato o macrodato.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
6
Le fasi di un’indagine statistica
Fasi dell’indagine
Progettazione
Rilevazione
Registrazione
su supporto
informatico
Revisione
Elaborazione
Validazione
Diffusione
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
7
Progettazione
• Si mette a punto il disegno di indagine sulla base di:
1. risorse organizzative e finanziarie;
2. conoscenze a priori del fenomeno oggetto di indagine.
Progettazione
• Operazioni da effettuare:
– definizione obiettivi, contenuti, universo di riferimento,
tecnica di indagine, unità di rilevazione, unità di analisi,
eventuale disegno campionario;
– definizione di un questionario (definizioni, classificazioni,
variabili e modalità di risposta) e di un piano per la
reportistica da inviare ai responsabili dell’indagine;
– previsione lettera da mandare alle unità di rilevazione
contenente le informazioni che riguardano l’indagine e la
normativa sul trattamento dei dati;
– articolazione della rilevazione (briefing e monitoraggio) e
progettazione delle fasi di controllo e correzione dati;
– ipotesi delle modalità di diffusione dei dati.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
8
Progettazione
• In questa fase generalmente si costituisce un ‘gruppo di
progettazione’ che ha lo scopo di:
– definire gli obiettivi conoscitivi dell’indagine;
– adottare definizioni e concetti operativi;
– pianificare gli aspetti operativi del processo di
produzione.
• Tale attività di pianificazione concettuale deve essere
documentata a mezzo di un ‘documento di
progettazione’.
Rilevazione
• Operazioni da effettuare:
– contatti con la ditta aggiudicataria della gara d’appalto o con
gli uffici regionali;
– istruzione ai rilevatori e supervisori attraverso giornate di
briefing di illustrazione dei contenuti e modalità di
svolgimento dell’indagine;
– intervista pilota;
– pubblicizzazione dell’indagine;
– selezione unità campionarie (se si tratta di indagine
campionaria);
– intervista;
– monitoraggio durante le interviste e analisi della
reportistica.
Dati rilevati o grezzi
MICRODATI
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
9
Registrazione su supporto informatico
• Operazione da effettuare:
– controllo degli errori ammissibili e trasferimento su
supporto informatico.
• Nelle indagini telefoniche o faccia a faccia assistite da PC
(indagini C.A.T.I. o C.A.P.I.) questa fase non è presente,
poiché grazie alle procedure informatizzate è possibile
un’acquisizione controllata dove il dato viene registrato
correttamente “alla fonte”.
Revisione del materiale
• Operazione da effettuare:
– verifica qualitativa e quantitativa ed eventuale
correzione dei dati grezzi:
1. materiale cartaceo, controllato manualmente;
2. dati su PC, controllati attraverso procedure
informatizzate.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
10
Elaborazione
• Operazione da effettuare:
– predisposizione tavole, indicatori e analisi
statistiche.
MACRODATI
Validazione
• Operazione da effettuare:
– valutazione della coerenza interna, analisi serie
storiche e confronto con altre fonti.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
11
Diffusione
• Operazione da effettuare:
– diffusione agli utenti finali di macrodati, metadati e,
se previsto, microdati.
Accuratezza del dato statistico
L’Accuratezza, quale requisito della ‘qualità’ in
campo statistico, può essere definita come la
vicinanza tra la stima prodotta per un parametro
(caratteristica della popolazione studiata) e il valore
vero ma ignoto dello stesso.
L’Accuratezza (e, più in generale, la qualità) dei
risultati prodotti al temine di un processo di
produzione di statistiche dipende dagli errori che
possono verificarsi in tutte le fasi che determinano
un’indagine statistica.
L’errore è la differenza tra
la stima prodotta e il valore ‘vero’ della stessa.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
12
Errore della stima
Errore
Campionario
Deriva dalla scelta di osservare
non l’intera popolazione ma un
sottoinsieme.
Tali errori sono ‘programmabili’ e
si stimano dai ‘dati osservati’, o
‘totali noti’.
Non
campionario
Possono sorgere in ogni fase
dell’indagine ‘trasmettendosi da
una all’altra, sommandosi,
combinandosi, elidendosi’.
L’errore non campionario
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
13
• Casuale (determinato dal caso): in un ipotetico
elevato numero di replicazioni della stessa operazione
(es. misurazione), tendono a compensarsi. In tal senso,
la presenza di errori casuali provoca solo un aumento
della variabilità (varianza) delle misurazioni successive
intorno al valore vero che si intende misurare.
• Sistematico: in un ipotetico elevato numero di
replicazioni della stessa operazione tendono a
manifestarsi nella stessa direzione. Gli errori pertanto non
si compensano. L’entità dell’errore prende il nome di
distorsione (bias). Per questo motivo gli errori di natura
non casuale sono quelli che pongono maggiori problemi.
L’errore non campionario
L’errore non campionario
Gli errori non campionari hanno generalmente un impatto
superiore rispetto a quello attribuibile all’errore
campionario, in quanto non sono programmabili.
Si tratta di errori che
possono manifestarsi in
qualsiasi fase dell’indagine
(raccolta dati,
trattamento, …).
NON possono essere
programmati in anticipo ed
è pertanto difficile tenerli
sotto controllo.
La loro ampiezza tende ad
aumentare all’aumentare
del numero di unità da
osservare.
La valutazione del loro
L’impatto sulle stime finali
richiede l’applicazione di
metodi ad hoc o la
conduzione di indagini
aggiuntive (es. indagini di
controllo).
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
14
L’errore non campionario
- copertura
- mancata risposta
- misurazione
- trattamento ed
elaborazione dati
Errori di:
Errori dovuti ad imperfezioni nella corrispondenza fra
la lista utilizzata per selezionare e contattare le unità
statistiche (archivi di base) e la popolazione oggetto
di indagine. Gli errori di copertura possibili sono di
due tipi:
– inclusione nell'indagine di unità non appartenenti
alla popolazione oggetto di interesse
(sovracopertura);
– l'impossibilità di selezionare o coinvolgere
nell'indagine unità appartenenti alla popolazione
oggetto di indagine (sottocopertura).
L’errore non campionario: di copertura
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
15
Errori dovuti al rifiuto o all'impossibilità di
rispondere da parte delle unità statistiche
contattate. Possono essere:
– totali: se l'unità di rilevazione non fornisce
alcuna delle informazioni richieste;
– parziali: quando l'unità non fornisce solo
alcune particolari risposte.
L’errore non campionario: di mancata
risposta
Errori costituiti dalla differenza fra il vero valore della
caratteristica da misurare su una data unità statistica
e il valore effettivamente osservato all'indagine.
Tali differenze possono essere:
– introdotte dal rispondente stesso (per
dimenticanza, imprecisione o dolo);
– introdotte nelle fasi di elaborazione successive
alla raccolta del dato (Esempio: errori introdotti
dalle operazioni di registrazione su supporto
informatico o di codifica dei quesiti aperti).
L’errore non campionario: di misurazione
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
16
Sono errori introdotti nella fase di preparazione ed
elaborazione dei dati raccolti.
L’errore non campionario: di trattamento
ed elaborazione dati
Azioni per ridurre l’errore non campionario
Le azioni di intervento per ridurre l’errore non campionario
si distinguono in:
• preventive: fanno parte di queste azioni tutte quelle accortezze
mirate a prevenire l’insorgenza dell’errore, si concretizzano in una
serie di azioni che attengono prevalentemente alla fase di
progettazione di un’indagine;
• di monitoraggio: permettono di individuare nel corso dell’indagine
eventuali problemi o imperfezioni che possono essere migliorate, ad
esempio analisi della reportistica giornaliera prevista nella fase di
rilevazione (analisi delle durate, delle cadute, dei rifiuti, se necessario
distinta per rilevatore);
• di controllo e correzione: hanno l’obiettivo di individuare e
correggere l’errore (attraverso imputazione delle mancate risposte
con metodo deterministico o probabilistico) e si realizzano
successivamente alla fase di rilevazione (compresa l’eventuale
registrazione su supporto informatico se non assistite da PC).
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
17
Come si misura l’errore?
Misure dirette: si tratta di stime di varianza e/o distorsione
che forniscono una valutazione diretta dell’errore ma
richiedono l’applicazione di metodi ad hoc o indagini
supplementari con conseguente allungamento dei tempi e
dei costi.
Indicatori di qualità: si tratta di una serie di indicatori
relativi al processo di produzione (tassi errori di lista, tasso
di mancate risposte, tasso imputazione, …) e hanno le
seguenti caratteristiche:
– sono più economici delle misure dirette;
– permettono di individuare meglio i punti critici del
processo;
– analizzati congiuntamente permettono un giudizio sul
livello complessivo della qualità di un prodotto;
– non forniscono una misura diretta dell’errore.
Conclusioni
• Le informazioni statistiche possono essere rilevate
attraverso diverse tipologie di indagine, ognuna con
differenti criticità e punti di forza.
• Tra le fasi di un’indagine statistica quella più complessa è
quella della progettazione poiché in essa si gettano le
basi per le fasi successive.
• L’accuratezza è un requisito fondamentale per la qualità
dell’informazione statistica.
• Gli errori ‘non campionari’ possono annidarsi in ognuna
delle fasi che portano ad un’indagine statistica.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
18
Copyright
AVVISO - Ai sensi dell'art. 1, comma 1 del decreto-legge 22 marzo 2004, n. 72, come modificato
dalla legge di conversione 21 maggio 2004 n. 128, le opere presenti su questo sito hanno assolto
gli obblighi derivanti dalla normativa sul diritto d'autore e sui diritti connessi. Tutti i
contenuti sono proprietà letteraria riservata e protetti dal diritto di autore della Università degli
Studi Guglielmo Marconi.
Si ricorda che il materiale didattico fornito è per uso personale degli studenti, al solo scopo
didattico. Per ogni diverso utilizzo saranno applicate le sanzioni previste dalla legge 22 aprile
1941, n. 633.
Copyright©UNIMARCONI
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
1
La rilevazione statistica
(Parte seconda)
Argomenti
• Nella presente lezione verranno trattati i seguenti
argomenti:
– tecniche di indagine;
– costruzione di un questionario;
– strutturazione delle domande e tipologie di quesiti.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
2
Obiettivi
• Con questa lezione ci si propone di raggiungere i seguenti
obiettivi:
– distinguere le diverse tecniche di indagine attraverso un
confronto di vantaggi e svantaggi di ogni singola tecnica;
– comprendere come si costruisce un questionario;
– capire il significato e l’uso di diverse tipologie di quesiti.
Le tecniche di indagine
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
3
Le tecniche di indagine
• Definizione:
– insieme delle modalità di contatto delle unità
statistiche interessate dalla rilevazione (unità di
rilevazione) e di reperimento delle informazioni
oggetto di interesse.
INTERVISTA
DIRETTA
INTERVISTA
TELEFONICA
QUESTIONARIO
AUTOCOMPILATO
Intervista diretta
• Viene condotta da un rilevatore che legge le domande
e le opzioni di risposta (se domanda a risposta
predefinita) nello stesso ordine e linguaggio del
questionario.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
4
Intervista diretta
Vantaggi
• Buona capacità di persuadere il
rispondente
• Identificazione del rispondente
• Istruzione del rispondente
• Interviste più approfondite
Svantaggi
• Costi alti
• Necessaria organizzazione
capillare sul territorio
• Tempi lunghi di raccolta dei
dati
• Rischi di condizionare il
rispondente
• L’intervistatore potrebbe
cambiare la sequenza delle
domande
• L’intervista potrebbe sembrare
un interrogatorio
Intervista telefonica
• Viene condotta da un rilevatore che legge le domande
e le opzioni di risposta (se domanda a risposta
predefinita) nello stesso ordine e linguaggio del
questionario.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
5
Vantaggi
• Bassi costi rispetto al faccia a
faccia
• Velocità nella raccolta
• Non è richiesta una
organizzazione sul territorio
• Migliore la fase di
monitoraggio
• Maggiori possibilità di contatto
in orari non canonici
• Minore condizionamento e
maggiore possibilità di
sottoporre quesiti delicati
Svantaggi
• Selettività del campione
(impossibile contattare famiglie
senza telefono)
• Il rispondente non è
identificato con certezza
• Il questionario deve avere una
durata limitata
Intervista telefonica
Questionario autocompilato
• Il ricevente riceve il questionario a mezzo di un corriere,
lo compila e lo rispedisce indietro o lo riconsegna ad un
addetto.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
6
Vantaggi
• Bassi costi
• Minore organizzazione
• Non c’è condizionamento
• Idoneo per quesiti delicati
• Maggiore disponibilità per
reperire informazioni e
documentazioni, in particolare
per quesiti che riguardano il
passato
Svantaggi
• Tempi lunghi di raccolta
• Impossibile identificare con
certezza il rispondente
• Minore capacità di ottenere
partecipazione all’indagine
• Difficile aiutare il rispondente
nella compilazione
Questionario autocompilato
Il questionario
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
7
Il questionario
• Definizione:
– è lo strumento di rilevazione designato a raccogliere le
informazioni sulle variabili qualitative e quantitative
oggetto di indagine.
Il questionario come strumento di misura e
di comunicazione
• STRUMENTO DI MISURA
Affinché tale strumento sia adeguato a misurare un
fenomeno si impongono due condizioni:
• i quesiti devono essere rivolti a tutti nella stessa forma;
• i quesiti devono avere un significato univoco.
• STRUMENTO DI COMUNICAZIONE
Ha la funzione di trasmettere all’intervistato l’esatto
significato dell’informazione richiesta.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
8
Costruzione dello schema
concettuale del questionario
• È un modello concettuale (insieme di strutture e
rappresentazioni) che consente di raccogliere tutti gli
aspetti della realtà di interesse.
• Operazioni:
– adottare una successione logica di temi;
– evitare condizionamenti nella disposizione del
questionario;
– considerare adeguatamente la difficoltà dell’argomento.
Costruzione dello schema
concettuale del questionario
• È preferibile inserirli a metà del
questionario
Quesiti con sforzo di
memoria
• È preferibile inserirli alla fine del
questionario
Quesiti delicati
• Idonei per saltare sezioni
• Idonei per saltare quesiti
• Fondamentali per evitare
condizionamenti nelle domande
Domande filtro
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
9
Strutturazione delle domande (quesiti)
A risposta aperta
• Quando il fenomeno è
sconosciuto:
– lasciano all’intervistato la
possibilità di esprimersi nella
forma che preferisce.
A risposta predefinita
• Quando è noto il campo di
variazione di un fenomeno:
– prevedono alternative fisse di
risposte predefinite dal
ricercatore.
Domande a risposta aperta
Vantaggi
• Non ci sono condizionamenti
• Idonee per quesiti delicati
• Versatili per tutte le ricerche
Svantaggi
• Alti costi
• Lunghi tempi per decodifica
• Necessità di personale
addestrato
• Sforzo elaborazione
rispondente
• Limite culturale
• Rischio “luoghi comuni”
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
10
Domande a risposta predefinita
Vantaggi
• Riduzione tempi elaborazione e
codifica
• Riduzione errori trascrizione
• Aiuto alla memoria (ottimo per
indagini retrospettive)
• Facilitano il rispondente
Svantaggi
• Se la lista è troppo lunga c’è il
rischio di influenzare gli
intervistati e produrre
concentrazioni artificiose in
corrispondenza di alcune
modalità
• Possono indurre scelte non
ragionate dovute a forme di
acquiescenza in particolar
modo quando le domande
riguardano opinioni,
motivazioni o atteggiamenti
Problematiche relative all’utilizzo di
risposte predefinite e possibili soluzioni
• Non sempre si conoscono tutte le modalità che un
fenomeno può assumere (e anche quando si conoscono è
necessaria una pre-codifica).
• domande aperte funzionali
all’adozione di criteri per elaborare
le modalità per risposte predefinite
Indagine
esplorativa
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
11
• A volte gli item non coprono tutti i casi possibili per
cui è opportuno lasciare una modalità aperta “altro
(specificare)”.
Vantaggio della
modalità “altro”
Consente di raccogliere i
casi rari
In fase di pilota, l’analisi
delle voci consente di
migliorare l’efficienza della
domanda
Se non si prevede la
modalità “altro”
Aumento della frequenza di
alcune modalità
Si gonfia il numero delle
mancate risposte
Problematiche relative all’utilizzo di
risposte predefinite e possibili soluzioni
• A volte è opportuna una domanda strutturata ma
senza leggere le risposte:
– per evitare di influenzare gli intervistati o concentrare
le risposte sui primi o sugli ultimi item.
Limite: rischio di alterare la qualità
delle risposte dovuto alla
discrezionalità dell’intervistatore
Problematiche relative all’utilizzo di
risposte predefinite e possibili soluzioni
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
12
Come strutturare le domande
• Indagine esplorativa
• Ricorso a esperti (in particolare per la terminologia)
• Spunti da altre indagini (rischio di mancata esaustività,
tempi e cultura diversi)
Strutturazione delle domande a risposta
predefinita
Le domande chiuse
• Tra le domande a risposta predefinita le domande
chiuse rappresentano un caso limite e presentano
massimo tre modalità di risposta.
• Generalmente vengono utilizzate per verificare la
presenza-assenza di un fenomeno e spesso sono
utilizzate come domande filtro.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
13
Domanda aperta o predefinita?
• Ogni volta che si aggrega si perdono informazioni
Tipo di variabili (classificazione o studio)
• Per non appesantire il rispondente
Accuratezza
• Se sconosciuto, domanda aperta
Natura del fenomeno
Il problema dei ‘non so’
La possibilità di inserire “non so”
• Dovrebbe significare che il rispondente non ha riflettuto
o è indeciso, ma a volte è indice esclusivamente di
pigrizia.
• si forza il rispondente ad inserire una
modalità a caso
Se non si inserisce:
• potrebbe costituire un ‘escamotage’
per coloro che sono
momentaneamente perplessi o pigri
Se si inserisce in
maniera esplicita:
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
14
Alcune tipologie di quesiti
RETROSPETTIVI DELICATI
I quesiti retrospettivi
• Si usano nelle indagini retrospettive o per indagare alcuni
fenomeni riferiti al passato.
Limiti
• Campione selezionato
• Errori dovuti alla memoria (omissione di
informazioni ed «effetto telescoping»)
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
15
I quesiti retrospettivi
Come si limitano gli errori dovuti alla memoria?
Come si limitano gli errori dovuti alla memoria?
Identificare la
forma più
adeguata con cui
esprimere un
quesito
Individuare la
lunghezza
ottimale sul
periodo di
riferimento
Prevedere
strumenti che
aiutino il ricordo
Inserire
domande
strutturate
I quesiti retrospettivi
Tipi di quesiti retrospettivi
Stesso periodo
di riferimento
per tutti i
rispondenti (es.
anno x)
Periodo di
riferimento
mobile (dalla
data
dell’intervista)
ma di durata
uguale per tutti
(es. ultima
settimana)
Periodo di
riferimento e
durata diversa
per ogni
rispondente
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
16
I quesiti retrospettivi
Quando
sussistono
più periodi di
riferimento:
Limitare la diversificazione temporale
Evitare sforzo di memoria e di calcolo
Come si aiuta
l’intervistato?
Domande strutturate
Fatti documentati
Diari
I quesiti “delicati”
Come somministrarli?
• sottolineare la normalità di certi comportamenti quando
sono conosciuti come “devianti”;
• non essere bruschi e affrettati;
• incorporare la domanda in una breve affermazione per
far vedere il carattere non valutativo dell’indagine;
• ricorrere all’auto-compilazione.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
17
I quesiti “delicati”
Da evitare:
• uso di parole che abbiano una carica emotiva in
positivo o negativo;
• domande che collegano a fatti obiettivamente
positivi o negativi (es. volontariato o guerra);
• domande che danno per scontati alcuni fatti.
La verifica del questionario prima di
passare all’indagine ‘a regime’
• Si usa nella fase preliminare del
questionario per determinare la forma
più adatta alla strutturazione delle
domande
INDAGINE
ESPLORATIVA
• Costituisce il veicolo più utilizzato per
validare internamente il questionario la
cui ‘bozza’ viene testata su un
campione ragionato di unità
PRE-TEST
• Vengono messe a confronto sia
diverse versioni di questionario sia,
eventualmente, diverse tecniche di
indagine
TEST FORMALE
DELLE
ALTERNATIVE
• E’ la ‘prova generale’ del questionario
e serve a valutare sia la bontà dello
strumento in senso stretto sia gli altri
aspetti della ricerca
INDAGINE PILOTA
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
18
Conclusioni
• La scelta della tecnica di indagine varia in funzione di
numerosi aspetti.
• Il questionario è uno strumento di rilevazione che cambia
in base alla tecnica di indagine.
• Le tipologie di quesiti cambiano in base agli obiettivi di
un’indagine e alla conoscenza di un fenomeno.
Copyright
AVVISO - Ai sensi dell'art. 1, comma 1 del decreto-legge 22 marzo 2004, n. 72, come modificato
dalla legge di conversione 21 maggio 2004 n. 128, le opere presenti su questo sito hanno assolto
gli obblighi derivanti dalla normativa sul diritto d'autore e sui diritti connessi. Tutti i
contenuti sono proprietà letteraria riservata e protetti dal diritto di autore della Università degli
Studi Guglielmo Marconi.
Si ricorda che il materiale didattico fornito è per uso personale degli studenti, al solo scopo
didattico. Per ogni diverso utilizzo saranno applicate le sanzioni previste dalla legge 22 aprile
1941, n. 633.
Copyright©UNIMARCONI
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
1
Le distribuzioni statistiche
Argomenti
• Nella presente lezione verranno trattati i seguenti
argomenti:
– la distribuzione statistica;
– la distribuzione statistica unitaria;
– la distribuzione statistica di frequenze;
– la distribuzione statistica di quantità;
– le serie e le seriazioni.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
2
Obiettivi
• Con questa lezione ci si propone di raggiungere i seguenti
obiettivi:
– comprendere cosa è una distribuzione statistica;
– comprendere le differenze tra le diverse distribuzioni;
– comprendere come organizzare i dati statistici relativi
ad un collettivo statistico in forma di distribuzione;
– conoscere le diverse tipologie di serie e seriazioni
statistiche.
La distribuzione statistica
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
3
La distribuzione statistica
• La distribuzione statistica rappresenta il modo in cui le
diverse modalità di un carattere si distribuiscono tra le
unità di un collettivo statistico.
• In base al numero di caratteri cui si riferisce, la
distribuzione si distingue:
• se il carattere secondo cui si distribuisce il
collettivo statistico è unico
Semplice
• se i caratteri secondo cui si distribuisce il
collettivo statistico sono due
Doppia
• se i caratteri secondo cui si distribuisce il
collettivo statistico sono più di due
Multipla
La distribuzione statistica
• In base al modo con cui vengono presentati i dati e al
tipo di carattere si distingue in :
• quando ad ogni unità del collettivo
statistico viene associata la modalità
con la quale si presenta ciascun
carattere
Unitaria
• quando ad ogni modalità di un
carattere viene associato il numero
delle unità statistiche (frequenza
assoluta) che presenta quella modalità.
Di Frequenza
• quando ad ogni modalità di un
carattere viene associata la quantità
che presenta quella modalità (solo per
dati quantitativi).
Di quantità
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
4
La distribuzione unitaria
• Si parla di distribuzione statistica unitaria quando ad
ogni unità del collettivo statistico viene associata la
modalità con la quale si presenta ciascun carattere.
• In generale: date n unità di un collettivo, la distribuzione
unitaria secondo un carattere X (con modalità x1…xk)
è un insieme di n coppie in cui il primo elemento indica
l'unità del collettivo e il secondo indica la modalità del
carattere osservato (xi).
Se abbiamo n caratteri, ad ogni unità del collettivo
corrisponderanno le n modalità corrispondenti
(distribuzione unitaria multipla)
La distribuzione unitaria
• Esempio: consideriamo come si distribuisce un collettivo
di 10 studenti iscritti al 2° anno di Scienze statistiche
secondo il voto ottenuto rispettivamente all’esame di
statistica e matematica (distribuzione unitaria doppia).
Studente Voto in statistica Voto in
matematica
1° 30 27
2° 21 25
3° 26 28
4° 19 21
5° 20 26
6° 30 30
7° 19 23
8° 30 27
9° 23 28
10° 26 28
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
5
La distribuzione di frequenze
• Si parla di distribuzione statistica di frequenza
quando ad ogni modalità di un carattere viene associato il
numero delle unità statistiche (frequenza assoluta) che
presenta quella modalità.
La distribuzione di frequenze
• In generale: dato un carattere X che presenta le modalità x1,
x2,…, xi,…, xk e un collettivo statistico costituito da n unità
statistiche avremo che la distribuzione di frequenze del collettivo
rispetto al carattere X sarà:
dove la generica ni (frequenza assoluta) indica il numero delle
unità statistiche che presentano la modalità xi.
Carattere X Numero di unità statistiche
x1 n1
x2 n2
. .
. .
xi ni
. .
xk nk
Totale n
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
6
La distribuzione di frequenze
• Esempio: trasformiamo la distribuzione unitaria
dell’esempio precedente in una distribuzione di frequenze
considerando un solo carattere: “voto in statistica”.
Voto in statistica xi Numero di studenti ni
18 0
19 2
20 1
21 1
22 0
23 1
24 0
25 0
26 2
27 0
28 0
29 0
30 3
Totale 10
La distribuzione di frequenze doppia
• Dati due caratteri X e Y che presentano rispettivamente le modalità
x1, x2,…, xi,…, xk e y1, y2,…, yj,…, yw e dato un collettivo statistico
costituito da n unità statistiche avremo che la distribuzione di
frequenze del collettivo rispetto ai caratteri X e Y sarà:
dove la generica nij (frequenza assoluta) indica il numero delle unità
statistiche che presentano contemporaneamente la modalità xi del
carattere X e yj del carattere Y .
Carattere X
Carattere Y
y1 y2 . . yj . yw Totale
x1 n11 n12 . . n1j . n1w n10
x2 n21 n22 . . n2j . n2w n20
. . . . . . . . .
. . . . . . . . .
xi ni1 ni2 . . nij . niw nio
. . . . . . . . .
xk nk1 nk2 . . nkj . nkw nk0
Totale n01 n02 . . n0j . n0k n
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
7
La distribuzione di frequenze doppia
• Esempio: trasformiamo la distribuzione unitaria
dell’esempio precedente in una distribuzione di frequenze
considerando entrambi i caratteri : “voto in statistica” e
“voto in matematica”.
Voto in
statistica
Voto in matematica Totale
18 19 20 21 22 23 24 25 26 27 28 29 30
18 0
19 1 1 2
20 1 1
21 1 1
22 0
23 1 1
24 0
25 0
26 2 2
27 0
28 0
29 0
30 2 1 3
Totale 0 0 0 1 0 1 0 1 1 2 3 0 1 10
La distribuzione di frequenze doppia
Nel caso di distribuzione di frequenze doppia si definisce:
– distribuzione marginale di X: la distribuzione della
X, indipendentemente dalle modalità della Y;
Corrisponde alla distribuzione di frequenze semplice del
collettivo statistico rispetto al carattere X.
Carattere X
Carattere Y
y1 y2 . . yj . yw Totale
x1 n11 n12 . . n1j . n1w n10
x2 n21 n22 . . n2j . n2w n20
. . . . . . . . .
. . . . . . . . .
xi ni1 ni2 . . nij . niw nio
. . . . . . . . .
xk nk1 nk2 . . nkj . nkw nk0
Totale n01 n02 . . n0j . n0k n
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
8
La distribuzione di frequenze doppia
Nel caso di distribuzione di frequenze doppia si definisce:
• distribuzione marginale di Y: la distribuzione della Y,
indipendentemente dalle modalità della X;
Corrisponde alla distribuzione di frequenze semplice del
collettivo statistico rispetto al carattere Y.
Carattere X
Carattere Y
y1 y2 . . yj . yw Totale
x1 n11 n12 . . n1j . n1w n10
x2 n21 n22 . . n2j . n2w n20
. . . . . . . . .
. . . . . . . . .
xi ni1 ni2 . . nij . niw nio
. . . . . . . . .
xk nk1 nk2 . . nkj . nkw nk0
Totale n01 n02 . . n0j . n0k n
La distribuzione di frequenze doppia
Nel caso di distribuzione di frequenze doppia si definisce:
– distribuzioni condizionate di X: le distribuzioni della
X, in corrispondenza di ciascuna delle modalità della Y;
Corrisponde alla distribuzione di frequenze del collettivo
statistico rispetto al carattere X dato Y=yj.
Carattere X
Carattere Y
y1 y2 . . yj . yw Totale
x1 n11 n12 . . n1j . n1w n10
x2 n21 n22 . . n2j . n2w n20
. . . . . . . . .
. . . . . . . . .
xi ni1 ni2 . . nij . niw nio
. . . . . . . . .
xk nk1 nk2 . . nkj . nkw nk0
Totale n01 n02 . . n0j . n0k n
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
9
La distribuzione di frequenza doppia
Nel caso di distribuzione di frequenze doppia si definisce:
– distribuzioni condizionate di Y: le distribuzioni della
Y, in corrispondenza di ciascuna modalità della X;
Corrisponde alla distribuzione di frequenze del collettivo
statistico rispetto al carattere Y dato X=xk.
Carattere X
Carattere Y
y1 y2 . . yj . yw Totale
x1 n11 n12 . . n1j . n1w n10
x2 n21 n22 . . n2j . n2w n20
. . . . . . . . .
. . . . . . . . .
xi ni1 ni2 . . nij . niw nio
. . . . . . . . .
xk nk1 nk2 . . nkj . nkw nk0
Totale n01 n02 . . n0j . n0k n
La distribuzione di quantità
• Si parla di distribuzione di quantità quando ad ogni
modalità del carattere X (x1, x2,…, xi,…, xk) si fa
corrispondere la quantità del carattere Q (q1, q2,…qi,qk)
rilevata sulle n unità della popolazione.
Modalità del carattere X Quantità
x1 q1
x2 q2
. .
. .
xi qi
. .
xk qk
Totale q
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
10
La distribuzione di quantità
• Esempio: ammontare dei protesti in euro secondo il tipo
di titolo di credito.
Tipo di titolo di credito
Ammontare dei titoli
protestati
(in migliaia di euro)
Cambiale ordinaria 3.800
Tratta 4.580
Assegno bancario 1.250
Totale 9.630
Serie e seriazioni
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
11
Serie e seriazioni
Se il carattere
secondo cui è
costruita la
distribuzione è
di tipo
qualitativo la
distribuzione è
detta:
SERIE
Se il carattere
secondo cui è
costruita la
distribuzione è
di tipo
quantitativo
la distribuzione
è detta:
SERIAZIONE
Una serie
può essere:
Sconnessa
se il carattere secondo cui
è costruita la distribuzione è di tipo
qualitativo sconnesso (ovvero non
ordinabile secondo una gerarchia)
Ordinata
se il carattere secondo cui è costruita
la distribuzione è di
tipo qualitativo ordinato
Rettilinea
se il carattere secondo cui
è costruita la distribuzione
è di tipo ordinato rettilineo
Ciclica
se il carattere secondo cui
è costruita la distribuzione
è di tipo ordinato ciclico
Serie
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
12
• Caratteri: genere, colore occhi,
colore capelli, cittadinanza, ecc.
Sconnessa
• Caratteri: titolo di studio,
posizione nella professione, ecc.
Ordinata
rettilinea
• Caratteri: giorni della settimana,
stagioni, mesi, ecc.
Ordinata
ciclica
• Esempio:
Serie
• sono distribuzioni di un dato fenomeno rispetto al
tempo. Tipici esempi ne sono i dati statistici relativi
alle produzioni industriali nei vari anni, quelli relativi
alla natalità (o mortalità) distinti per giorni, mesi,
anni, ecc. Le serie storiche possono essere:
• statiche : quando non vi sono variazioni
apprezzabili;
• dinamiche: quando il fenomeno tende a variare.
Serie TEMPORALI
(O STORICHE)
• sono distribuzioni di un dato fenomeno rispetto allo
spazio. Ad esempio, la serie dei nati in Italia in un dato
anno distinti per regione costituisce una serie
territoriale.
Serie DI LUOGO
(O TERRITORIALI)
• Tra le serie più conosciute ed utilizzate abbiamo:
Serie
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
13
Seriazioni
Una seriazione
può essere:
Rettilinea
se il carattere secondo
cui è costruita la distribuzione è di
tipo quantitativo rettilineo
Ciclica
se il carattere secondo
cui è costruita la distribuzione è di
tipo quantitativo ciclico
Seriazioni
Esempio di seriazione rettilinea: distribuzione di frequenze degli
studenti iscritti al corso di statistica secondo l’altezza
Per quanto riguarda le seriazioni cicliche, si tratta di dati che
vengono presi in considerazione molto raramente (es. latitudine
e longitudine).
Statura (in cm) Numero di studenti
meno di 155 3
155-160 2
160-165 36
165-170 78
170-175 99
175-180 71
180-185 21
185-190 7
190 e oltre 1
Totale 318
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
14
Conclusioni
• In base al numero di caratteri cui si riferisce la
distribuzione statistica essa può essere classificata in
semplice, doppia o multipla.
• In base al modo con cui vengono presentati e al tipo di
dati della distribuzione statistica essa può essere
classificata in unitaria, di frequenza o di quantità.
• Se il carattere secondo cui è costruita la distribuzione è di
tipo qualitativo la distribuzione è detta serie, se è di tipo
quantitativo è detta seriazione.
Copyright
AVVISO - Ai sensi dell'art. 1, comma 1 del decreto-legge 22 marzo 2004, n. 72, come modificato
dalla legge di conversione 21 maggio 2004 n. 128, le opere presenti su questo sito hanno assolto
gli obblighi derivanti dalla normativa sul diritto d'autore e sui diritti connessi. Tutti i
contenuti sono proprietà letteraria riservata e protetti dal diritto di autore della Università degli
Studi Guglielmo Marconi.
Si ricorda che il materiale didattico fornito è per uso personale degli studenti, al solo scopo
didattico. Per ogni diverso utilizzo saranno applicate le sanzioni previste dalla legge 22 aprile
1941, n. 633.
Copyright©UNIMARCONI
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
1
Le rappresentazioni grafiche
Argomenti
• Nella presente lezione verranno trattati i seguenti
argomenti:
– la rappresentazione grafica;
– i grafici delle distribuzioni semplici secondo un
carattere qualsiasi;
– i grafici delle distribuzioni semplici secondo un
carattere ordinato;
– i grafici delle distribuzioni semplici secondo un
carattere quantitativo;
– i grafici delle serie territoriali.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
2
Obiettivi
• Con questa lezione ci si propone di raggiungere i seguenti
obiettivi:
– comprendere a cosa serve una rappresentazione
grafica;
– saper rappresentare un grafico per migliorare facilitare
l’interpretazione di un fenomeno;
– comprendere quale tipo di grafico scegliere in base al
tipo di distribuzione che caratterizza un dato fenomeno.
La rappresentazione grafica
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
3
La rappresentazione grafica
• Le rappresentazione grafica è sostanzialmente un
disegno che si ottiene facendo corrispondere ai numeri
di una tabella degli enti geometrici elementari o diverse
intensità di colore o tratteggio.
• Infatti, ciò che in una tabella può dedursi con fatica o
solo se esperti, può essere fornito con immediatezza e
chiarezza a mezzo di una rappresentazione grafica.
Grafici e tabelle
• La rappresentazione grafica ha dunque dei vantaggi
rispetto alla rappresentazione tabellare, in termini di
immediatezza nella comprensione di un fenomeno, ma è
senza dubbio una fonte meno ricca di informazioni.
Le cifre delle
tabelle danno
l’analisi dei
fenomeni
Tabelle
Tabelle Essi forniscono la
sintesi di un
fenomeno e ne
consentono una
chiara percezione
Grafici
Grafici
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
4
Grafici e tabelle
• Talvolta un grafico può sostituire una tabella, ma nella
maggior parte dei casi, in particolare nelle distribuzioni
multiple, grafici e tabelle sono il complemento l’uno
dell’altra.
La rappresentazione grafica deve essere
completamente autonoma dalla tabella che ne ha
dato origine e deve contenere pertanto tutte le
informazioni necessarie per la sua chiara
interpretazione.
Regole da osservare nella compilazione di
un grafico
• Indicare il titolo in cui deve essere specificato
l’oggetto della rappresentazione, il riferimento
temporale e spaziale e la fonte da cui sono stati
ricavati i dati.
• Indicare chiaramente quali sono i caratteri che sono
stati osservati nelle unità.
• Indicare sempre le unità di misura.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
5
Grafici delle distribuzioni semplici
secondo un carattere qualsiasi
Diagrammi simbolici o pictogrammi
• Il pictrogramma, o diagramma simbolico, è un tipo di
rappresentazione grafica prettamente divulgativa ed è
destinata a un pubblico vasto.
• Il pictogramma è costituito da simboli che ricordano
l’oggetto al quale si riferisce il fenomeno rappresentato e
che sono ripetuti tante volte quant’è la frequenza o la
quantità della relativa modalità o situazione o hanno
dimensioni minori o maggiori a seconda di tali frequenze
o quantità.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
6
• Esempio: Consumo medio annuo di birra in Lazio e Lombardia nel
2012 (in litri)
Regioni Consumo medio
annuo di birra
Lazio 60 litri
Lombardia 90 litri
Lazio Lombardia
Attenzione a rispettare la
proporzione corrispondente a
quantità o frequenza
Diagrammi simbolici o pictogrammi
• Le frequenze o le quantità delle modalità
di riferimento sono rappresentate da
rettangoli aventi tutti la stessa altezza
e basi proporzionali alle frequenze o alle
quantità.
Nastri
• Le frequenze o le quantità delle modalità
di riferimento sono rappresentate da
rettangoli aventi tutti la stessa base e
altezze proporzionali alle frequenze o
alle quantità.
Colonne
• I grafici a nastri o colonne possono essere
sostituiti da grafici a barre (orizzontali o
verticali rispettivamente) che hanno
l’aspetto di figure tridimensionali.
Barre
Grafici a nastri, a colonne o a barre
Sono grafici particolarmente indicati a rappresentare distribuzioni
secondo caratteri qualitativi. Se il carattere qualitativo è ordinato i
nastri o le colonne vanno disposti secondo l’ordine cui si
susseguono le modalità.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
7
Grafici a nastri
39,2
21,6
5,0
4,8
5,2
6,5
4,2
13,5
0 20 40 60
Per stare più tempo con i figli
Inconciliabilità lavoro-famiglia
Insoddisfatta dei guadagni
Insoddisfatta della posizione lavorativa
Motivi di salute
Insoddisfatta tipo lavoro
Sede distante
Altri motivi
Valori percentuali
• Esempio: Madri occupate per motivo della difficoltà nel conciliare
famiglia e lavoro, Anno 2005, Italia – valori percentuali
Fonte: Istat, Indagine Campionaria sulle nascite Anno 2005
Grafici a colonne
• Parti per luogo del parto, Vari anni, Italia – valori percentuali
0
10
20
30
40
50
60
70
80
90
100
Abitazione Istituto di cura
pubblico
Casa di cura
privata
Altri luoghi
Valori
percentuali
Luogo del parto
1980
1990
1996
2000/2001
2003
Fonte: Istat, Indagine Campionaria sulle nascite Anno 2005
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
8
Grafici a barre
• Esempio:
0
20
40
Per stare più tempo con i figli
Inconciliabilità lavoro-famiglia
Insoddisfatta dei guadagni
Insoddisfatta della posizione…
Motivi di salute
Insoddisfatta tipo lavoro
Sede distante
Altri motivi
39,2
21,6
5,0
4,8
5,2
6,5
4,2
13,5
Valori percentuali
0
10
20
30
40
50
60
70
80
90
Abitazion
e
Istituto
di
cura…
Casa
di
cura…
Altri
luoghi
Valori
percentuali
Luogo del parto
1980
1990
1996
2000/
2001
2003
Fonte: Istat, Indagine Campionaria sulle nascite Anno 2005
Madri occupate per motivo della difficoltà nel
conciliare famiglia e lavoro, Anno 2005,
Italia – valori percentuali
Parti per luogo del parto, Vari anni,
Italia – valori percentuali
Aereogrammi
• L’aereogramma è un grafico in cui le frequenze o le
quantità di una distribuzione statistica sono rappresentate
da superfici di figure piane poste una accanto all’altra,
oppure, tra i più usati, da parti di un’unica figura.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
9
Aereogrammi
• Esempio: Madri che non lavorano per motivazione, Anno 2005,
Italia – valori percentuali
Perché non
ne avverte
la
necessità
4.0%
Perché non
ha trovato
un lavoro
adatto a lei
7.6%
Perché
vuole
dedicarsi
completam
ente alla
famiglia
69.5%
Perché non
sa a chi
affidare il
bambino;
5.3%
Non riesce
a trovare
un lavoro
10.2%
Altre
motivazioni
3.3%
Fonte: Istat, Indagine Campionaria sulle nascite Anno 2005
Grafici delle distribuzioni semplici
secondo un carattere ordinato
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
10
Rappresentazione grafica delle
distribuzioni secondo un carattere ordinato
(istogramma a basi uguali)
• Le modalità di un carattere ordinato hanno un ordine
e una prima ed una ultima modalità. Le modalità si
rappresentano come segmenti uguali disposti uno accanto
all’altro su una retta seguendo l’ordine in cui si susseguono le
modalità, e le frequenze o quantità corrispondenti con un
rettangolo avente per base (o altezza se a nastri) il segmento
rappresentante la modalità, e come altezza (o base) un
segmento proporzionale alla frequenza o alla quantità.
• Si ottiene così un istogramma a basi uguali.
Ordinato
RETTILINEO
• Se un carattere è ordinato ciclico, le modalità non presentano per
definizione un inizio e fine ‘naturali’, ma, se vengono fissate
convenzionalmente, possono esser assimilabile e dunque
rappresentata come un carattere ordinato rettilineo.
• Se non si vogliono fare convenzioni sulle modalità estreme
bisogna rappresentare le modalità ricorrendo a sezioni di una
circonferenza o di un cerchio.
Ordinato
CICLICO
Rappresentazione grafica delle
distribuzioni secondo un carattere ordinato
rettilineo
• Esempio: Madri al primo figlio per giudizio espresso sul desiderio
di avere altri figli in futuro (dati fittizi), Anno 2011, Italia – valori
percentuali
Fonte: (dati fittizi)
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
11
Grafici delle distribuzioni semplici
secondo un carattere
quantitativo
Rappresentazione grafica delle
distribuzioni semplici secondo un carattere
quantitativo
(diagramma cartesiano)
• Si può rappresentare in un sistema cartesiano ortogonale
ponendo sull’asse delle ascisse le modalità e sull’asse delle
ordinate le frequenze; l’insieme dei punti costituisce la
distribuzione.
• Per aumentare la valenza segnaletica del grafico si possono
congiungere i punti derivanti dalle coordinate (x,y) con l’asse
x, tramite segmenti paralleli all’asse y; si ottiene così il
diagramma cartesiano ad aste.
Quantitativo
DISCRETO
• Anche il carattere quantitativo continuo si usa rappresentare sul
diagramma cartesiano, mettendo sulle ascisse il carattere
continuo, e sulle ordinate la frequenza o la quantità relativa alla
modalità. Le modalità sono equamente distanziate l’una dall’altra,
e il grafico è costituito da un numero finito di punti relativo ad
ogni modalità; se si utilizzasse un registratore a grafico continuo
l’insieme di punti darebbe luogo ad una curva.
Quantitativo
CONTINUO e
SERIE
STORICHE
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
12
Rappresentazione grafica delle
distribuzioni semplici secondo un carattere
quantitativo per serie storiche
(diagramma cartesiano)
• Il diagramma cartesiano (che utilizziamo anche per i
caratteri quantitativi continui) è la rappresentazione
grafica più idonea a rappresentare le serie storiche che
rappresentano l’andamento nel tempo di un collettivo di
stato (stock rilevabile in un istante di tempo) o di un
carattere quantitativo di stato.
• Si usa rappresentare pertanto sulle ascisse il tempo in
modo che ogni punto dell’asse rappresenti l’istante.
Rappresentazione grafica delle
distribuzioni secondo un carattere
quantitativo
discreto
• Esempio: Distribuzione di 49 studenti secondo il voto riportato
all’esame di ragioneria, Anno 2011, Italia (dati fittizi)
Fonte: (dati fittizi)
0
1
2
3
4
5
6
7
8
9
10
18 20 22 24 26 28 30
F
r
e
q
u
e
n
z
a
Voti
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
13
Rappresentazione grafica delle
distribuzioni secondo un carattere
quantitativo
continuo
• Esempio: Numero medio di figli per 1.000 donne in età feconda,
Anni 1936-1996, Italia
Fonte: Istat
Rappresentazione grafica delle serie
storiche di movimento e delle distribuzioni
secondo un carattere quantitativo
rettilineo avente per modalità delle classi
(istogrammi)
• Nel caso di istogramma a intervalli uguali parlare di
“area proporzionale” equivale a parlare di “altezza
proporzionale”; ogni rettangolo deve avere altezza
proporzionale alla frequenza o quantità da
rappresentare
Intervalli
UGUALI
• Nel caso di istogramma a intervalli diversi ogni
rettangolo deve avere un’altezza proporzionale al
rapporto fra il valore da rappresentare e la misura
dell’intervallo di base
Intervalli
DIVERSI
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
14
Rappresentazione grafica delle serie
storiche di movimento e delle distribuzioni
secondo un carattere quantitativo
rettilineo avente per modalità delle classi
(intervalli uguali)
Fonte: (dati fittizi)
• Esempio: distribuzione di 54 studenti iscritti al corso di statistica
per classi d’età di uguale ampiezza
Classi d'età Frequenza
assoluta
19-21 9
22-24 15
25-27 20
28-30 10
Totale 54
0
5
10
15
20
25
19-21 22-24 25-27 28-30
Rappresentazione grafica delle serie
storiche di movimento e delle distribuzioni
secondo un carattere quantitativo
rettilineo avente per modalità delle classi
(intervalli diversi)
• Volendo rappresentare la stessa distribuzione accorpando le classi
d’età nel seguente modo: (19-21;22-30) avremo due rettangoli di
base diversa e di altezza rispettivamente uguale o proporzionale
ai valori 3 e 5.
Fonte: (dati fittizi)
Classi d'età
Ampiezza
della classe
C
Frequenza
assoluta
F
altezza del rettangolo
uguale o proporzionale
a F/C
19-21 3 9 3
22-30 9 45 5
Frequenza (o quantità)=(o proporzionale) all’area e
quindi uguale o proporzionale bxh
h=Area/b=Frequenza (o quantità)/b
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
15
Grafici delle serie territoriali
unidimensionali
Grafici delle serie territoriali
(cartogrammi)
• Tali serie, cioè le distribuzioni secondo soltanto un
carattere geografico, si possono rappresentare con tutti i
grafici che raffigurano le distribuzioni unidimensionali
secondo un carattere di qualsiasi tipo, dunque
pictogrammi, grafici a nastri, colonne, ecc.
• Tuttavia, per mettere in evidenza in maniera immediata la
relazione esistente tra dati del fenomeno e relativo
ambiente geografico si usa ricorrere a carte geografiche.
• I grafici statistici eseguiti su carte geografiche vengono
chiamati cartogrammi.
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
16
Grafici delle serie territoriali
(cartogrammi)
• Il dettaglio territoriale può essere la ripartizione, la regione,
la provincia e il comune.
• L’ambito territoriale viene caratterizzato da colori diversi o
con intensità crescente al crescere del fenomeno da
rappresentare.
• Le modalità del fenomeno vengono raggruppate in classi, se
i dati sono quantitativi, o comunque aggragate in modo che
le modalità non siano troppe (di solito massimo 5), per
rendere il cartogramma facilmente interpretabile.
• L’ampiezza delle classi corrispondente ai livelli dell’intensità
del fenomeno dipende dal fenomeno stesso (possono avere
eguale ampiezza, o ampiezza tale da far ricadere lo stesso
numero di unità territoriali, o quartili, o ampiezza ragionata.
Grafici delle serie territoriali
unidimensionali
(cartogrammi)
• Esempio: tasso di fecondità totale per regione, Anno 2011, Italia
– numeri indice (Italia 2011=100)
Fonte: (dati fittizi)
Regioni Tasso di fecondità
N.I. Italia 2011=100
Piemonte 100,58
Valle d'Aosta/Vallée d'Aoste 112,96
Liguria 92,70
Lombardia 106,08
Bolzano/Bozen 114,43
Trento 114,11
Veneto 103,34
Friuli-Venezia Giulia 99,27
Emilia-Romagna 104,39
Toscana 97,40
Umbria 96,30
Marche 99,77
Lazio 101,12
Abruzzo 93,01
Molise 83,10
Campania 99,87
Puglia 93,16
Basilicata 83,77
Calabria 89,68
Sicilia 99,78
Sardegna 81,61
Italia 100,00
U
n
i
v
e
r
s
i
t
à
d
e
g
l
i
S
t
u
d
i
G
u
g
l
i
e
l
m
o
M
a
r
c
o
n
i
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf
Slide tutte le lezioni.pdf

Contenu connexe

En vedette

How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Applitools
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at WorkGetSmarter
 

En vedette (20)

How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 

Slide tutte le lezioni.pdf

  • 1. 1 Introduzione alla statistica (Parte Prima) Argomenti • Nella presente lezione verranno trattati i seguenti argomenti: – che cosa è la statistica; – la storia della statistica; – la nomenclatura statistica. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 2. 2 Obiettivi • Con questa lezione ci si propone di raggiungere i seguenti obiettivi: – conoscere il significato di statistica; – conoscere le origine della statistica; – apprendere i principali termini del linguaggio statistico. Che cosa è la statistica U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 3. 3 Che cosa è la statistica • La statistica è la tecnica che ha come scopo la conoscenza quantitativa dei fenomeni collettivi (G. Leti 1983). • I fenomeni collettivi (o di massa), sono tutti quei fenomeni che non possono essere appresi con una sola osservazione da parte dell’essere umano, ma hanno bisogno di essere ‘sintetizzati’ prima di avvicinarsi alla loro conoscenza. Che cosa è la statistica • I fenomeni oggetto di studio possono essere naturali, sociali, economici, demografici e vengono misurati con opportune metodologie scientifiche. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 4. 4 In cosa consiste lo studio statistico di un fenomeno? Definizione Misura Elaborazione Interpretazione In cosa consiste lo studio statistico di un fenomeno? • La prima operazione è dunque la definizione del fenomeno, che si basa una esigenza conoscitiva dovuta a situazioni emergenti o vuoti informativi. • Una volta definito il fenomeno, si passa alla misurazione del fenomeno, tramite una fase iniziale di ‘conteggio’; il conteggio, funzionale alla determinazione della numerosità di un insieme, è una operazione semplice quando la collettività è piccola; se la collettività di riferimento è grande, il conteggio diventa una operazione molto complessa che richiede tecniche specifiche senza le quali non si può ottenere la numerosità di un insieme. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 5. 5 • L’elaborazione dei dati avviene attraverso tecniche specifiche e consiste nel sintetizzare il fenomeno attraverso indicatori, tavole, grafici, in grado di rendere un fenomeno interpretabile e confrontabile. • Lo studio dei fenomeni collettivi è preceduto da una schematizzazione che consiste nella definizione del fenomeno stesso, nella definizione del collettivo di riferimento e nella scelta dei caratteri attraverso i quali vogliamo studiare il fenomeno stesso. In cosa consiste lo studio statistico di un fenomeno? • Dopo la schematizzazione seguono due possibili casi: • Dopo la schematizzazione segue l’osservazione (raccolta, ordinamento e classificazione del materiale) e, attraverso misure di sintesi operate con diversi procedimenti, si passa alla descrizione del fenomeno oggetto. La collettività è interamente da osservare •Dopo la schematizzazione segue una formulazione di ipotesi sul collettivo totale (universo) e di definizione di un modello statistico. Segue poi l’osservazione del collettivo ridotto (campione) e per concludere l’inferenza (o induzione) che consiste nel far risalire il collettivo ridotto a quello totale, e seguente verifica delle ipotesi formulate. Della collettività viene osservata solo una parte In cosa consiste lo studio statistico di un fenomeno? U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 6. 6 Le origine della statistica Le origini della statistica • Come molte altre scienze la Statistica ha avuto due fasi successive: Attività pratica Fase metodologica Soluzione dei problemi pratici della vita Teorizzazione e determinazione di norme generali U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 7. 7 Le origini della statistica come attività pratica • Si ipotizza che già dall’Era primitiva, ancor prima dell’avvento della scrittura, l’uomo avesse innato il pensiero di affidare i risultati della caccia, della pesca, dell’agricoltura, ecc. non solo alla memoria ma sentisse il bisogno di enumerarli facendo incisioni su legno, grotte, ecc. (es. nuraghi della Sardegna). Le origini della statistica come attività pratica • Nelle società primitive si faceva pressante inoltre la necessità di enumerare la popolazione, visto che occorreva una grande quantità di uomini per guerre e per le ricostruzioni (lavori pubblici). • Nacque così l’esigenza di fare politiche volte a incrementare la popolazione e la necessità di conoscere e monitorare con costanza l’ammontare della popolazione. Le origini della statistica hanno una connotazione prevalentemente demografica U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 8. 8 Le origini della statistica come attività pratica • Le principali rilevazioni statistiche: •Nella Mesopotamia (IV-II millennio a.C.) •Ritrovamenti presso i Sumeri di tavole di argilla con riportate liste di uomini e beni. • In Assiria, nella biblioteca del re Assurbanipal, sono stati conservati documenti statistici sulle gerarchie degli ufficiali amministrativi, sulle province dell’impero e sulle loro produzioni. •Antico Egitto (3000 a.C. – 1200 .C.) •Autori greci e latini raccontano che in Egitto, già a partire dal 3000 a.C., si realizzarono Censimenti della popolazione con finalità fiscali, militari, e necessità di manodopera a disposizione del Faraone (costruzioni piramidi). • Dal 1200 a.C. cominciano le prime enumerazioni delle abitazioni e dei suoi abitanti (nominative). Le origini della statistica come attività pratica • Le principali rilevazioni statistiche: • Popolo d’Israele (1720 a.C. – 1000 a.C.) •Nella Bibbia sono presenti numerose citazioni a sostegno di una politica demografica Crescete e moltiplicatevi (comandato da Dio a Noè), Moltiplicherò la tua stirpe, Farò che la tua stirpe sia numerosa come le stelle del cielo o la sabbia del mare (benedizione di Dio per Abramo, Isacco e Giacobbe). Il primo Censimento d’Israele (ordinato da Dio) risale al 1720 a.C. nel deserto del Sinai da Mosè; la rilevazione è interamente descritta nel libro della Bibbia I numeri, il cui nome è dato appunto dal Censimento. •La Bibbia racconta poi anche del Censimento voluto dal re David (II Libro dei Re) per misurare la propria potenza. Tuttavia, la pestilenza che seguì venne interpretata come una maledizione verso le rilevazioni statistiche non comandate da Dio ma attuate per brama di potere. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 9. 9 Le origini della statistica come attività pratica • Le principali rilevazioni statistiche: •Cina (2200 a.C.-1300 a.C.) •Nel 2200 a.C., dopo una grave inondazione, il ministro dell’imperatore Yao, per conoscere i confini dell’impero ordina un Censimento della popolazione e delle terre • All’epoca dei Ming (1368-1644 d.C) si realizzavano Censimenti con cadenza decennale in cui venivano rilevati dati per età, sesso, identificativo della popolazione e professione. •Antica Grecia •Censimento di Solone (finalità fiscali). • Primi calcoli delle medie aritmetiche per sintetizzare i dati. Le origini della statistica come attività pratica • Le principali rilevazioni statistiche: •Antica Roma, caduta dell’Impero e fine primo millennio •Secondo Tito Livio il primo Censimento fu ordinato dal Re Servio Tullio (578-534 a.C) sulla rilevazione congiunta dei cittadini e dei loro beni e ogni cittadino doveva dichiarare il proprio nome, quello del padre, quello della moglie e dei figli e l’ammontare dei suoi beni. • Per attuare tale dichiarazione il cittadino doveva censere i propri beni che venivano così valutati e registrati (censiti) dall’Amministrazione statale. • I romani venivano così registrati congiuntamente ai loro beni dai censores (i più alti magistrati romani) nel census, che dà il nome al “Censimento”. • Tali registri, tenuti con rigorosa attenzione, avevano finalità fiscali. • Dal VI secolo a.C. i Censimenti si ripetono ogni 5 anni. • Quando l’Impero romano subì le invasioni barbariche con conseguente scomposizione del territorio in feudi le rilevazioni statistiche persero importanza fino a cessare, fino a riprendere moti anni dopo, alla fine del VIII secolo con i Carolingi, con fini amministrativi e fiscali (Pipino il Breve e Carlo Magno). U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 10. 10 Le origini della statistica come attività pratica • Le principali rilevazioni statistiche: •Dal Medioevo al Rinascimento •Venne organizzato un “registro dei beni” presso Abbazie e Monasteri comprendente il numero degli abitanti e dei terreni ad essi soggetti, per ricavarne le decime. • In Inghilterra il re normanno Guglielmo il Conquistatore (o il bastardo) organizzò il Catasto dei terreni e costituisce il Doomsday- Book (1083-86 d.C.) che significa Libro del Giudizio Finale in quanto legalizzava le espropriazioni che subivano ad opera dei normanni. • La Repubblica Veneta ha una posizione di eccellenza nell’organizzazione dei Censimenti grazie alla loro organizzazione, e nel 978 venne stilato un elenco delle persone soggette al pagamento delle tasse e nel 1171 quella dei creditori verso lo stato. Le origini della statistica come attività pratica • Le principali rilevazioni statistiche: •Dal Medioevo al Rinascimento •Nel 1311 venne istituita la prima Anagrafe in qualità di rilevazione diretta, nominativa e universale. • Nel 1440 il Consiglio dei Dieci istituisce un piano di rilevazione che può essere considerato il primo censimento “moderno” della popolazione che viene distinta per età, sesso, professione, condizione sociale e nazionalità. • Nello Stato Pontificio si ha notizia di una prima rilevazione dei fuochi nel 1092. Vi sono poi altre enumerazioni dal XV al XVII secolo ma carenti in quanto a simultaneità e individualità della rilevazione. I Censimenti pontifici sono il frutto delle elaborazione degli Stati delle anime (battesimi, morti) che venivano compilati dai parroci in maniera obbligatoria a partire dal 1614 con Papa Paolo V. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 11. 11 Le origini della statistica come attività pratica • Le principali rilevazioni statistiche: •Dal Medioevo al Rinascimento •Sul finire del 1400 si cominciò a seguire l’uso di conservare tavole in cui venivano iscritti i nomi di tutti i battezzati, dei loro genitori e dei padrini sia in Italia sia in Francia; furono pure introdotti i “registri mortuari” nei quali venivano registrate le persone decedute. • Il Concilio di Trento (1565 d.C.) accoglie questa abitudine ed obbliga i parroci alla tenuta dei registri dei battesimi, dei matrimoni e delle morti. • Ai primi del Cinquecento iniziò in Sicilia la rilevazione dei beni e delle anime. • A Napoli il sistema fiscale fu basato sulla rilevazione dei fuochi dal 1443 con Censimenti attuati mediamente ogni 15 anni. Le origini della statistica come attività pratica • Le principali rilevazioni statistiche: •Dal 1600 •Dopo Galileo Galilei (1564-1642 d.C.) l’attività di semplice conteggio (enumerazione) viene affiancata dal calcolo di medie con lo scopo di sintetizzare dei dati, abbandonando l’aritmetica e indirizzandosi verso la Statistica vera e propria. In particolare cominciarono le prime operazioni volte a: •1) sintetizzare, attraverso varie medie, i dati a disposizione; •2) analizzare la variabilità degli stessi; •3) studiare la dipendenza o indipendenza di due caratteri. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 12. 12 Le origini della statistica metodologica • Molti attribuiscono a John Graunt la nascita della nuova scienza (aritmetica politica) facente parte dell’approccio metodologico della statistica. • John Graunt (Londra, 24 aprile 1620 – Londra, 18 aprile 1674) è stato uno statistico britannico. – Era un funzionario di quelli che chiameremmo ufficiale di Stato civile. – Visse un periodo in cui l’Inghilterra era colpita da numerose epidemie di peste, e fu incaricato di tenere i cosiddetti “bollettini di mortalità ”. – All’epoca la causa di morte che veniva indicata nella quasi totalità dei casi era “peste”. Le origini della statistica metodologica Frontespizio delle Observations on the Bills of Mortality (1662) U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 13. 13 • Nel 1662 egli condusse delle indagini, che solo oggi chiameremmo ‘demografiche’, sulla popolazione londinese, valutandone la mortalità, la natalità e la distinzione dei sessi. • Iniziò, infatti, per sua iniziativa ad analizzare le caratteristiche dei deceduti: età, sesso, lavoro, e, tra le caratteristiche più importanti per l’epoca, il tipo di area (urbana o rurale). • Contribuì alla raccolta sistematica di dati e alla loro elaborazione. Le origini della statistica metodologica Per queste ragioni e viene considerato un importante precursore della statistica moderna e uno dei padri fondatori della demografia (a livello micro) • Egli inventò, senza saperlo, l’embrione delle tavole di mortalità, poiché considerando un’unica causa di morte, cominciò a calcolare la probabilità di morire a seconda delle caratteristiche della popolazione deceduta. • Inventò quella parte di demografia che noi chiamiamo “antropologica”, “medica”, “biologica”, “biometrica”. • Fu membro della Società Reale di Londra e scrisse Observations on the Bills of Mortality. Le origini della statistica metodologica U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 14. 14 Nomenclatura statistica Nomenclatura statistica Unità statistica: è l’elemento di base della popolazione sul quale viene effettuata la rilevazione o la misurazione di uno o più fenomeni oggetto dell'indagine; è l’oggetto dell’osservazione di ogni fenomeno individuale che costituisce il fenomeno collettivo Popolazione statistica (o universo, o collettivo statistico): è qualsiasi insieme di elementi, reale o ipotetico, presente o futuro, che forma oggetto di uno studio statistico Rilevazione statistica: è il complesso di operazioni rivolte ad acquisire una o più informazioni su un insieme di elementi oggetto di studio U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 15. 15 Nomenclatura statistica Carattere (o variabile): è la caratteristica che ci permette di analizzare il fenomeno oggetto di studio, rilevato o misurato sulle unità statistiche Modalità: è l’espressione concreta del carattere nelle unità statistiche, cioè il numero (per caratteri quantitativi) o l'attributo (per caratteri qualitativi) che l'unità statistica manifesta Frequenza: è il numero di volte che una determinata modalità si verifica nel collettivo di riferimento • I caratteri possono essere classificati: In base al TEMPO Sempre invariabili Sono sempre posseduti dall’unità con la stessa modalità (es. sesso, data di nascita, ordine di nascita, ecc.) Variabili Cambiano nel corso del tempo di stato La modalità è individuata in un istante di tempo (es. età, peso, altezza, ecc.) di movimento La modalità è individuata in un intervallo di tempo (es. consumi, spese, ecc.) Definitivamente invariabili Sono presenti in ciascuna unità da un certo punto in poi (es. anno di matrimonio, ecc.) Nomenclatura statistica U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 16. 16 Nomenclatura statistica • I caratteri possono essere classificati: In base alla NATURA Quantitativi Sono espressi da numeri, sono misurabili e si possono fare operazioni di somma e sottrazione Qualitativi Sono espressi da attributi qualitativi Sconnessi La modalità non sono ordinabili attraverso una gerarchia (es. sesso, cittadinanza, ecc.) e si possono fare solo operazioni di uguaglianza o disuguaglianza Ordinati o ordinabili La modalità sono ordinabili attraverso una gerarchia (es. livello di istruzione, professione, ecc.) e si possono fare operazioni di uguaglianza o disuguaglianza e ordinamento Nomenclatura statistica • I caratteri quantitativi possono essere classificati: In base alla NATURA Continui Se comunque vengono fissati due valori tra le modalità, tutti i valori intermedi possono essere assunti come modalità del carattere (es. peso, statura, età, ecc.) Discontinui Se comunque fissati due valori tra le modalità, non tutti i valori intermedi possono essere assunti come modalità del carattere. Discreti Se comunque viene fissata una modalità esiste tutto un intervallo, di cui la modalità è il centro, in cui all’infuori di essa nessun altro valore può essere espressa come modalità del carattere (numero figli, numero stanze) U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 17. 17 Conclusioni • La statistica è la tecnica che ha come scopo la conoscenza quantitativa dei fenomeni collettivi. • Sin dalle società primitive si faceva pressante l’esigienza di non affidare alla memoria il risultato delle attività funzionali alla sopravvivenza e venivano messe in atto quelle che oggi chiameremmo politiche demografiche. • Attraverso la scelta dei caratteri (o variabili) è possibile analizzare un fenomeno oggetto di studio; i caratteri hanno diversi modi di essere classificati. • Le modalità sono l’espressione concreta del carattere nelle unità statistiche. Bibliografia • M. P. Perelli D’Argenzio, Storia della statistica – I momenti decisivi, L’INSEGNAMENTO DELLA MATEMATICA E DELLE SCIENZE INTEGRATE, VOL.25A-B N.6 Novembre – Dicembre 2002 • G. Leti, Statistica descrittiva, Soc. Ed. Il Mulino, 1983 U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 18. 18 Copyright AVVISO - Ai sensi dell'art. 1, comma 1 del decreto-legge 22 marzo 2004, n. 72, come modificato dalla legge di conversione 21 maggio 2004 n. 128, le opere presenti su questo sito hanno assolto gli obblighi derivanti dalla normativa sul diritto d'autore e sui diritti connessi. Tutti i contenuti sono proprietà letteraria riservata e protetti dal diritto di autore della Università degli Studi Guglielmo Marconi. Si ricorda che il materiale didattico fornito è per uso personale degli studenti, al solo scopo didattico. Per ogni diverso utilizzo saranno applicate le sanzioni previste dalla legge 22 aprile 1941, n. 633. Copyright©UNIMARCONI U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 19. 1 Introduzione alla statistica (Parte Seconda) Argomenti • Nella presente lezione verranno trattati i seguenti argomenti: – la statistica ufficiale; – l’informazione statistica; – la qualità dell’informazione statistica; – il Sistan; – l’Istat; – la tutela della riservatezza dei dati in ambito statistico. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 20. 2 Obiettivi • Con questa lezione ci si propone di raggiungere i seguenti obiettivi: – comprendere cosa si intende per ‘statistica ufficiale’; – conoscere i requisiti che rendono una statistica ‘ufficiale’; – capire il significato di ‘informazione statistica’; – definire il concetto di qualità nel passato e nel presente attraverso le sue caratteristiche; – descrivere cosa sono e quali sono le principali funzioni del Sistan e dell’Istat; – conoscere le principali norme di tutela della riservatezza dei dati in ambito statistico. La statistica ufficiale U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 21. 3 La statistica ufficiale • La statistica è la scienza che ha per oggetto lo studio dei fenomeni collettivi suscettibili di misurazione e di descrizione quantitativa. • Essa fa riferimento ai soggetti che la producono e la diffondono. • Le statistiche ufficiali sono poste al servizio delle istituzioni, degli operatori economici e del pubblico ai quali forniscono dati sulla situazione economica, demografica, sociale e ambientale, e costituiscono un elemento indispensabile nel sistema informativo di una società democratica. La statistica ufficiale Si parla di statistica pubblica poiché le attività (raccogliere i dati, elaborarli, diffonderli) sono al servizio dei cittadini e i prodotti e i servizi hanno la natura di bene pubblico. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 22. 4 Requisiti della statistica ufficiale • Imparzialità – libera da pressioni di qualsiasi tipo; – orientata esclusivamente agli obiettivi perseguiti; – disponibile a tutti gli utenti (Governo, altre amministrazioni, operatori economici e sociali, università ed enti di ricerca, cittadini) contemporaneamente. • Affidabilità – il dato prodotto deve essere il più aderente possibile alla realtà; – i ‘metadati’ contribuiscono a migliorare l’affidabilità; – le modalità con cui il sistema statistico pubblico opera sono di pubblico dominio. Requisiti della statistica ufficiale • Pertinenza – la produzione deve essere guidata da obiettivi e programmi chiaramente definiti a livello nazionale (Programma Statistico Nazionale) e/o internazionale (Programma Statistico dell’Unione Europea). • Economicità – uso ottimale delle risorse umane e finanziarie a disposizione; – minimizzazione del disturbo statistico. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 23. 5 Requisiti della statistica ufficiale • Riservatezza – tutela della privacy e diffusione dei dati solo in forma aggregata. • Trasparenza – tutela dei rispondenti (informazione sullo scopo della rilevazione, sull’obbligo di risposta, sulle leggi che garantiscono il rispetto della privacy); – per facilitare una corretta interpretazione, il dato deve essere accompagnato da tutte le informazioni riguardanti le modalità di acquisizione (metodologia, tecnica di indagine, fonte, ecc.), le definizioni, classificazioni, ecc.. Requisiti della statistica ufficiale • Le statistiche forniscono al Governo e alle pubbliche amministrazioni uno strumento per la formulazione e la valutazione delle politiche e per la gestione dei servizi e delle funzioni pubbliche. • Le statistiche forniscono ai cittadini uno strumento di valutazione sull’azione dell’amministrazione pubblica e sui risultati da essa conseguiti. • Salvaguardare l’affidabilità delle statistiche pubbliche e la fiducia dei cittadini è responsabilità di primaria importanza. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 24. 6 L’informazione statistica Caratteristiche dell’informazione statistica ufficiale MICRODATI dati rilevati sulla singola unità MACRODATI risultato di una funzione dei dati elementari METADATI informazioni di carattere qualitativo e/o quantitativo riguardanti le operazioni effettuate per ottenere il ‘dato’ U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 25. 7 Caratteristiche dell’informazione statistica ufficiale • I dati utilizzati a fini statistici possono derivare da ogni tipo di fonte, sia essa una rilevazione statistica o una documentazione amministrativa. • Le rilevazioni sono realizzate solo se i dati amministrativi non sono disponibili o sono insufficienti. • Le leggi, i regolamenti e i metodi di misura in base ai quali operano i sistemi statistici debbono essere resi pubblici. • L’uso di concetti, classificazioni e metodi concordati a livello internazionale promuove la coerenza, la comparabilità e l’efficienza dei sistemi statistici nazionali. Caratteristiche dell’informazione statistica ufficiale • Le istituzioni statistiche debbono poter scegliere la fonte più appropriata in relazione a: Qualità • capacità della informazione statistica di soddisfare le esigenze conoscitive dell’utente Tempestività • riduzione del tempo intercorrente tra l’acquisizione del dato e la sua diffusione Costi • i costi della produzione statistica pubblica (in termini finanziari e di uso delle risorse umane) devono essere valutati in termini di costi e di benefici Disturbo statistico • le rilevazioni sono condotte in modo da ridurre al minimo l'onere dei rispondenti U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 26. 8 Dato, informazione e conoscenza Dato •La rappresentazione quantitativa di un fenomeno nel momento in cui accade o è prodotto Informazione •La comprensione e interpretazione del dato, quale emerge dall’interazione tra soggetti sociali e nell’attribuzione di significato da parte del destinatario Conoscenza •L’attribuzione di valore all’informazione, in funzione del soddisfacimento di un bisogno dell’utente e dell’uso nell’assunzione di una decisione La qualità dell’informazione statistica U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 27. 9 Qualità dell’informazione statistica • Oggi è universalmente intesa come un concetto multidimensionale e dinamico, che coinvolge numerosi aspetti di natura differente e esigenze conoscitive degli utenti sempre più diverse. • Gli strumenti a disposizione della statistica ufficiale per migliorare la qualità di prodotto e di processo si sono arricchiti e perfezionati grazie alla disponibilità e alla diffusione di tecnologie di supporto sempre più evolute. Qualità dell’informazione statistica Questo sviluppo ha portato ad una moltiplicazione dei “soggetti attivi” (soggetti produttivi nel mondo dell’informazione statistica), portando ad una necessità crescente di momenti di formazione e armonizzazione degli strumenti e metodologie in uso. • Qualità = accuratezza (vicinanza tra la stima prodotta e il valore della stessa) In passato • Qualità = capacità di soddisfare gli utenti di informazione statistica Oggi U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 28. 10 Componenti della qualità • Rilevanza – capacità di soddisfare le reali esigenze degli utenti ed è valutata a livello di Programma Statistico Nazionale. • Accuratezza – riduzione dell’errore ‘non campionario’, nella sua componente sistematica (distorsioni) e nella sua componente casuale. • Tempestività – riduzione del periodo intercorrente tra il riferimento temporale del dato e il momento in cui l’informazione è resa disponibile. Componenti della qualità • Accessibilità – facilità con cui gli utenti possono apprendere l’informazione, localizzarla e trasferirla. • Comparabilità e coerenza – confrontabilità nello spazio e nel tempo; – confrontabilità delle statistiche tra stessa fonte, attraverso possibilità di rielaborare i dati in modo attendibile, e tra fonti diverse attraverso definizioni e classificazioni standard. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 29. 11 Errore e fasi dell’indagine Errore Campionario Deriva dalla scelta di osservare non l’intera popolazione ma un sottoinsieme. Tali errori sono ‘programmabili’ e si stimano dai ‘dati osservati’, o ‘totali noti’. Non campionario Possono sorgere in ogni fase dell’indagine ‘trasmettendosi da una all’altra, sommandosi, combinandosi, elidendosi’ L’errore è la differenza tra la stima prodotta e il valore ‘vero’ della stessa La statistica ufficiale in Italia – le date cruciali 1861 Divisione Generale della Statistica all’interno del Ministero dell’Agricoltura, Industria e Commercio Interno 1926 Istituto Centrale di Statistica del Regno d’Italia 1989 Decreto Legislativo 322 Sistema Statistico Nazionale - Sistan Istituto Nazionale di Statistica - Istat U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 30. 12 Il Sistan • Rete di soggetti, pubblici e privati, che fornisce l’informazione statistica ufficiale • I Soggetti che ne fanno parte: – Istat – Enti ed organismi pubblici di informazione statistica (Isae, Inea, Isfol) – Uffici di statistica delle amministrazioni ed enti pubblici – Uffici di statistica degli Uffici territoriali del Governo – Uffici di statistica degli enti territoriali (regioni, province, comuni, aziende sanitarie locali, camere di commercio) – Uffici di statistica di soggetti privati che svolgono funzioni di interesse pubblico Il Sistema Statistico Nazionale: che cosa è U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 31. 13 Il Sistan è stato istituito con il decreto legislativo 6 settembre 1989, n. 322, emanato in attuazione della delega contenuta nell'articolo 24 della legge 400/88, che ha dettato i principi ed i criteri direttivi per la riforma della statistica pubblica. Il decreto ha avviato una gestione radicalmente diversa dell'attività statistica nazionale, aumentando le capacità di risposta alle esigenze informative del Paese, e, al tempo stesso, riducendo le ridondanze causate principalmente dalla mancanza di coordinamento fra i diversi produttori. Il Sistema Statistico Nazionale: le norme Obiettivo primario del Sistan è quello di fornire al Paese e agli organismi internazionali una informazione statistica ufficiale che soddisfi i seguenti principi: affidabilità, imparzialità, pertinenza, tempestività, tutela della riservatezza, trasparenza, minimo carico sui rispondenti, efficienza. Sul piano organizzativo, il Sistema si basa sui principi di autonomia, differenziazione, adeguatezza e sussidiarietà. Il Sistema Statistico Nazionale: gli obiettivi U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 32. 14 Il Comitato di indirizzo e coordinamento dell’informazione statistica è l'organo di governo del Sistema statistico nazionale, esercita funzioni direttive nei confronti degli uffici di statistica e delibera il Programma statistico nazionale. Il Comitato dura in carica quattro anni e i suoi membri possono essere riconfermati per non più di due volte. Come stabilito dal dpr 166/2010 il Comitato è composto da 15 membri: dal presidente dell’Istituto, che lo presiede; da due membri in rappresentanza del Ministero dell’economia e delle finanze e da quattro membri in rappresentanza di altre amministrazioni statali, individuate dal Presidente del Consiglio dei Ministri, sentito il presidente dell’Istat; da tre rappresentanti delle regioni e degli enti locali; da un rappresentante designato dal presidente di Unioncamere; da due rappresentanti di enti pubblici tra quelli dotati dei più complessi sistemi d’informazione; da due esperti scelti tra i professori ordinari di ruolo di prima fascia in materie statistiche, economiche e affini. Il Sistema Statistico Nazionale: il governo del sistema La vigilanza sulle attività del Sistan è affidata alla Commissione per la garanzia dell'informazione statistica che è un organo esterno, autonomo e indipendente. In particolare, la Commissione vigila su: imparzialità e completezza dell'informazione statistica; qualità delle metodologie; conformità delle rilevazioni alle direttive degli organismi internazionali e comunitari. La Commissione, istituita presso la Presidenza del Consiglio dei Ministri, è composta da sei professori ordinari o direttori di Istituti di statistica o di ricerca statistica non facenti parte del Sistan e da tre alti dirigenti di enti e amministrazioni pubbliche non preposti ad uffici facenti parte del Sistan. Il Sistema Statistico Nazionale: la vigilanza del sistema U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 33. 15 La programmazione dell'attività statistica di interesse pubblico affidata al Sistan avviene attraverso il Programma statistico nazionale (Psn), che ha valenza triennale ed è aggiornato ogni anno. Il Psn individua le rilevazioni, le elaborazioni, gli studi progettuali e i sistemi informativi statistici che uffici, enti e organismi del Sistan sono chiamati a realizzare per soddisfare il fabbisogno informativo del Paese. Di grande importanza nella definizione del Programma è l'armonizzazione con i programmi di altri organismi internazionali, specialmente con quello dell'Unione Europea. Il Psn è il risultato di una articolata procedura, che garantisce l'autonomia scientifica delle rilevazioni, la partecipazione di tutti i soggetti responsabili della produzione di statistiche pubbliche, la tutela della privacy di cittadini e imprese. Il Sistema Statistico Nazionale: il PSN • Il Sistema statistico europeo (ESS) ha per finalità quella di fornire alle istituzioni comunitarie informazioni statistiche affidabili e comparabili. • È formato da: • Eurostat, l’Ufficio Statistico delle Comunità Europee; • Istituti Nazionali di statistica dei Paesi della Comunità; • Ministeri, Agenzie, Banche centrali che producono statistiche ufficiali nei Paesi membri della Comunità. • Funziona come una rete coordinata da Eurostat che ha il compito di condurre, in stretta collaborazione con le Autorità statistiche nazionali, ad una progressiva armonizzazione delle statistiche prodotte dai Paesi. • L’armonizzazione è prioritariamente rivolta alle aree di intervento delle politiche europee e, gradualmente, si sta estendendo a tutti i campi. Il Sistema Statistico Nazionale è parte del Sistema Statistico Europeo U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 34. 16 • Istituita nel 1953 per rispondere alle esigenze informative della Comunità del carbone e dell’acciaio. • Alla fondazione della Comunità Europea, nel 1958, diventa una DG della Commissione Europea • Missione: – elaborare e pubblicare informazioni statistiche comparabili a livello europeo; – mettere a punto un linguaggio statistico comune (definizioni, classificazioni e metodi comuni). Non raccoglie direttamente dati, ma utilizza dati raccolti dalle autorità statistiche degli stati membri. Eurostat L’Istat U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 35. 17 L’Istituto Nazionale di Statistica (Istat) • istituito con legge n. 1162/1926. E’ persona giuridica di diritto pubblico ed ha ordinamento autonomo. Sono organi dell'Istituto: • il presidente; • il comitato per l'indirizzo e il coordinamento dell'informazione statistica; • il consiglio; • il collegio dei revisori dei conti. L'Istat è sottoposto alla vigilanza del Presidente del Consiglio dei ministri tramite la Commissione per la garanzia dell’informazione statistica. L’Istituto Nazionale di Statistica (Istat): che cosa è Principali compiti dell’Istat: • predisposizione del Programma Statistico Nazionale; • esecuzione dei censimenti e delle altre rilevazioni statistiche previste dal programma statistico nazionale ed affidate all’esecuzione dell'Istituto; • indirizzo e coordinamento delle attività statistiche degli enti ed uffici facenti parte del Sistema statistico nazionale; • predisposizione delle nomenclature e metodologie di base per la classificazione e la rilevazione dei fenomeni di carattere demografico, economico e sociale; • promozione e sviluppo informatico a fini statistici degli archivi gestionali e delle raccolte di dati amministrativi; • svolgimento di attività di formazione e di qualificazione professionale per gli addetti al Sistema statistico nazionale; • rapporti con enti ed uffici internazionali operanti nel settore dell'informazione statistica. L’Istituto Nazionale di Statistica (Istat): i compiti U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 36. 18 La tutela della riservatezza dei dati in ambito statistico La riservatezza dei dati personali in campo statistico era tutelata dal d.lgs n. 322/ 89 che conteneva disposizioni sul segreto d’ufficio (art.8) e sul segreto statistico (art. 9). La legge 675/1996 disciplina condizioni, modalità e garanzie relativamente a tutti i trattamenti di dati personali, compresi quelli effettuati in ambito statistico. Con la legge 676/1996 il Parlamento delega il Governo ad emanare decreti legislativi in materia di tutela della riservatezza per i trattamenti di dati personali effettuati per finalità storiche, statistiche e di ricerca scientifica. In attuazione della delega, il Governo emana il decreto legislativo n. 281/1999, che integra e modifica sia il d.lgs n. 322/89 sia la legge n. 675/1996. Il 29 luglio 2003 viene emanato il testo unico che rivede e organizza tutte le disposizioni in merito : Codice in materia di protezione dei dati personali che è entrato in vigore il 1.1.2004, Decreto legislativo 30 giugno 2003, n. 196. Tutela della riservatezza dei dati in ambito statistico: la privacy U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 37. 19 Art. 1 (Diritto alla protezione dei dati personali) Chiunque ha diritto alla protezione dei dati personali che lo riguardano. Art. 3 (Principio di necessità nel trattamento dei dati) I sistemi informativi e i programmi informatici sono configurati riducendo al minimo l’utilizzazione di dati personali e di dati identificativi se ne deve escludere il trattamento quando le finalità perseguite possono essere realizzate mediante: - dati anonimi; - modalità di trattamento che permettano di identificare l’interessato solo in caso di necessità. Tutela della riservatezza dei dati in ambito statistico: il codice in materia di protezione dei dati personali Dati sensibili •i dati personali idonei a rivelare l'origine razziale ed etnica, le convinzioni religiose, filosofiche o di altro genere, le opinioni politiche, l'adesione a partiti, sindacati, associazioni od organizzazioni a carattere religioso, filosofico, politico o sindacale, nonché i dati personali idonei a rivelare lo stato di salute e la vita sessuale Dati anonimi •il dato che in origine, o a seguito di trattamento, non può essere associato ad un interessato identificato o identificabile Dati identificativi •i dati personali che permettono l’identificazione diretta dell’interessato Dati personali •informazione relativa a persona fisica, persona giuridica, ente od associazione, identificati o identificabili, anche indirettamente, mediante riferimento a qualsiasi altra informazione, ivi compreso un numero di identificazione personale Tutela della riservatezza dei dati in ambito statistico: il codice in materia di protezione dei dati personali U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 38. 20 Interessato •la persona fisica cui si riferiscono i dati personali Incaricato •le persone fisiche autorizzate a compiere operazioni di trattamento dal titolare o dal responsabile Responsabile •la persona fisica, la persona giuridica, la pubblica amministrazione e qualsiasi altro ente, associazione od organismo preposti dal titolare al trattamento di dati personali Titolare •la persona fisica, la persona giuridica, la pubblica amministrazione e qualsiasi altro ente, associazione od organismo cui competono, anche unitamente ad altro titolare, le decisioni in ordine alle finalità, alle modalità del trattamento di dati personali e agli strumenti utilizzati, ivi compreso il profilo della sicurezza Tutela della riservatezza dei dati in ambito statistico: il codice in materia di protezione dei dati personali Regolamentato dal d.lgs. 6 settembre 1989, n. 322 e successive modifiche introdotte dal d.lgs. 30 luglio 1999, n. 281. . Nasce con l’obiettivo di migliorare la qualità dell'informazione statistica scoraggiando i soggetti fornitori del dato, a rilasciare informazioni errate a scopi opportunistici. In base al decreto i dati raccolti nell'ambito di rilevazioni statistiche comprese nel programma statistico nazionale, possono essere utilizzati esclusivamente a fini statistici e non possono essere comunicati ad alcun soggetto - pubblico o privato - estraneo al Sistema statistico nazionale, né essere diffusi, se non in forma aggregata e secondo modalità che rendano non identificabili i soggetti interessati. Tutela della riservatezza dei dati in ambito statistico: il segreto statistico U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 39. 21 Per garantire la tutela del segreto statistico e la protezione dei dati personali l’Istat e tutti gli organi del Sistan sono tenuti ad adottare opportune misure organizzative, logistiche, informatiche, metodologiche e statistiche, secondo gli standard definiti a livello internazionale. Tutela della riservatezza dei dati in ambito statistico: il segreto statistico Conclusioni • La statistica ufficiale deve rispondere a specifici requisiti. • L’informazione statistica comprende microdati, macrodati e metadati. • La qualità è un requisito fondamentale dell’informazione statistica. • Fornire l’informazione statistica ‘ufficiale’ è compito del Sistan di cui L’Istat è parte integrante. • L’Istat e tutti gli organi del Sistan, sono tenuti per legge a garantire il diritto alla riservatezza e all'identità personale. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 40. 22 • http://www.garanteprivacy.it • http://www.sistan.it • http://www.istat.it Sitografia Copyright AVVISO - Ai sensi dell'art. 1, comma 1 del decreto-legge 22 marzo 2004, n. 72, come modificato dalla legge di conversione 21 maggio 2004 n. 128, le opere presenti su questo sito hanno assolto gli obblighi derivanti dalla normativa sul diritto d'autore e sui diritti connessi. Tutti i contenuti sono proprietà letteraria riservata e protetti dal diritto di autore della Università degli Studi Guglielmo Marconi. Si ricorda che il materiale didattico fornito è per uso personale degli studenti, al solo scopo didattico. Per ogni diverso utilizzo saranno applicate le sanzioni previste dalla legge 22 aprile 1941, n. 633. Copyright©UNIMARCONI U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 41. 1 La rilevazione statistica (Parte Prima) Argomenti • Nella presente lezione verranno trattati i seguenti argomenti: – tipologie di rilevazioni statistiche; – l’indagine statistica; – le fasi di un’indagine statistica; – gli errori non campionari. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 42. 2 Obiettivi • Con questa lezione ci si propone di raggiungere i seguenti obiettivi: – comprendere cos’è un’indagine statistica; – capire le differenze tra le principali tipologie di rilevazioni statistiche; – seguire il percorso che porta allo svolgimento di un’indagine statistica attraverso le sue fasi; – definire il concetto di accuratezza del dato rilevato attraverso la descrizione dell’errore. L’indagine statistica L'indagine statistica è lo strumento statistico mediante il quale si acquisiscono informazioni su uno o più fenomeni attinenti ad una popolazione. Scopo dell’indagine è quello di produrre informazioni statistiche, ovvero descrizioni riassuntive di carattere quantitativo, riguardanti un collettivo di interesse. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 43. 3 • nasce per scopi puramente statistici con l’obiettivo di analizzare uno o più fenomeni relativi ad un collettivo di interesse Indagine statistica classica • si utilizzano dati già raccolti a fini amministrativi (fini che comunque non sono di carattere statistico) Indagine da fonte amministrativa • si elaborano dati (micro e/o macro) provenienti da altre rilevazioni Elaborazioni (o studi secondari) Tipologie di indagini statistiche Implica la raccolta di informazioni su tutte le unità statistiche appartenenti al collettivo di interesse. La sua realizzazione richiede costi molto elevati ed una struttura organizzativa complessa; per queste ragioni, nell’ambito della statistica ufficiale, questa tipologia d’indagine viene adottata in casi di eccezionale importanza come il più noto “Censimento (generale della popolazione)”. Oltre al Censimento generale della popolazione, si ricorre ad indagini esaustive ogni qual volta il collettivo di interesse è costituito da poche unità (ad esempio il fatturato delle grandi imprese); in questo caso l’omissione di anche una sola di esse comporterebbe una distorsione tale da inficiare la qualità delle stime prodotte. Indagine statistica classica - censuaria U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 44. 4 Si abbandona l’opzione censuaria per ripiegarsi su osservazioni e quantificazioni del fenomeno di interesse che riguardano solo una parte (campione) del collettivo (universo di riferimento); il fenomeno misurato deve mantenere le caratteristiche che presenta nell’universo. L’indagine condotta su un sub-universo consente di ridurre l’onere della rilevazione (in termini di tempestività ed economicità) e di destinare maggiore attenzione a tutte le attività connesse al controllo della qualità dei dati raccolti; tuttavia la qualità dei dati è fortemente legata alla rappresentatività del campione selezionato per il quale si fa uno studio accurato del disegno campionario in base alle caratteristiche dell’indagine. La selezione di un campione implica una minore attendibilità delle stime riferite ai parametri di interesse (ERRORE CAMPIONARIO) rispetto all’osservazione di tutte le unità presenti nel collettivo. Indagine statistica classica - campionaria L’indagine da fonte amministrativa È una indagine che utilizza dati amministrativi per finalità di tipo statistico. I dati amministrativi sono informazioni raccolte e conservate da istituzioni pubbliche ai fini di controllo o di intervento nei confronti di singoli individui o entità di altro tipo (es. persone giuridiche). Il fine, amministrativo, della raccolta di tali dati ne contraddistingue quindi la natura. Ad esempio sono dati amministrativi quelli raccolti su persone ed imprese ai fini fiscali, pensionistici, anagrafici o giuridici. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 45. 5 Affinché il dato amministrativo possa essere utilizzato a fini statistici è necessario: – che le variabili di interesse siano oggetto di “osservazione” da parte di un processo amministrativo; – che il risultato di tale processo sia disponibile e che la qualità dei dati sia adeguata allo scopo; – che la popolazione di riferimento sia uguale oppure contenuta nella popolazione definita dalla norma generatrice dell’archivio amministrativo. Può essere necessario procedere all’integrazione di più archivi amministrativi (linkage) per realizzare un prodotto statistico. L’indagine da fonte amministrativa Elaborazioni (o studi secondari) Si parla di "elaborazioni" quando la produzione di informazioni statistiche avviene a seguito del trattamento di dati statistici già disponibili (perché derivanti da precedenti rilevazioni, dall'uso di archivi amministrativi o altre statistiche derivate). Si possono elaborare dati provenienti da una o più fonti e l'acquisizione del dato statistico può avvenire a livello di microdato o macrodato. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 46. 6 Le fasi di un’indagine statistica Fasi dell’indagine Progettazione Rilevazione Registrazione su supporto informatico Revisione Elaborazione Validazione Diffusione U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 47. 7 Progettazione • Si mette a punto il disegno di indagine sulla base di: 1. risorse organizzative e finanziarie; 2. conoscenze a priori del fenomeno oggetto di indagine. Progettazione • Operazioni da effettuare: – definizione obiettivi, contenuti, universo di riferimento, tecnica di indagine, unità di rilevazione, unità di analisi, eventuale disegno campionario; – definizione di un questionario (definizioni, classificazioni, variabili e modalità di risposta) e di un piano per la reportistica da inviare ai responsabili dell’indagine; – previsione lettera da mandare alle unità di rilevazione contenente le informazioni che riguardano l’indagine e la normativa sul trattamento dei dati; – articolazione della rilevazione (briefing e monitoraggio) e progettazione delle fasi di controllo e correzione dati; – ipotesi delle modalità di diffusione dei dati. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 48. 8 Progettazione • In questa fase generalmente si costituisce un ‘gruppo di progettazione’ che ha lo scopo di: – definire gli obiettivi conoscitivi dell’indagine; – adottare definizioni e concetti operativi; – pianificare gli aspetti operativi del processo di produzione. • Tale attività di pianificazione concettuale deve essere documentata a mezzo di un ‘documento di progettazione’. Rilevazione • Operazioni da effettuare: – contatti con la ditta aggiudicataria della gara d’appalto o con gli uffici regionali; – istruzione ai rilevatori e supervisori attraverso giornate di briefing di illustrazione dei contenuti e modalità di svolgimento dell’indagine; – intervista pilota; – pubblicizzazione dell’indagine; – selezione unità campionarie (se si tratta di indagine campionaria); – intervista; – monitoraggio durante le interviste e analisi della reportistica. Dati rilevati o grezzi MICRODATI U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 49. 9 Registrazione su supporto informatico • Operazione da effettuare: – controllo degli errori ammissibili e trasferimento su supporto informatico. • Nelle indagini telefoniche o faccia a faccia assistite da PC (indagini C.A.T.I. o C.A.P.I.) questa fase non è presente, poiché grazie alle procedure informatizzate è possibile un’acquisizione controllata dove il dato viene registrato correttamente “alla fonte”. Revisione del materiale • Operazione da effettuare: – verifica qualitativa e quantitativa ed eventuale correzione dei dati grezzi: 1. materiale cartaceo, controllato manualmente; 2. dati su PC, controllati attraverso procedure informatizzate. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 50. 10 Elaborazione • Operazione da effettuare: – predisposizione tavole, indicatori e analisi statistiche. MACRODATI Validazione • Operazione da effettuare: – valutazione della coerenza interna, analisi serie storiche e confronto con altre fonti. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 51. 11 Diffusione • Operazione da effettuare: – diffusione agli utenti finali di macrodati, metadati e, se previsto, microdati. Accuratezza del dato statistico L’Accuratezza, quale requisito della ‘qualità’ in campo statistico, può essere definita come la vicinanza tra la stima prodotta per un parametro (caratteristica della popolazione studiata) e il valore vero ma ignoto dello stesso. L’Accuratezza (e, più in generale, la qualità) dei risultati prodotti al temine di un processo di produzione di statistiche dipende dagli errori che possono verificarsi in tutte le fasi che determinano un’indagine statistica. L’errore è la differenza tra la stima prodotta e il valore ‘vero’ della stessa. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 52. 12 Errore della stima Errore Campionario Deriva dalla scelta di osservare non l’intera popolazione ma un sottoinsieme. Tali errori sono ‘programmabili’ e si stimano dai ‘dati osservati’, o ‘totali noti’. Non campionario Possono sorgere in ogni fase dell’indagine ‘trasmettendosi da una all’altra, sommandosi, combinandosi, elidendosi’. L’errore non campionario U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 53. 13 • Casuale (determinato dal caso): in un ipotetico elevato numero di replicazioni della stessa operazione (es. misurazione), tendono a compensarsi. In tal senso, la presenza di errori casuali provoca solo un aumento della variabilità (varianza) delle misurazioni successive intorno al valore vero che si intende misurare. • Sistematico: in un ipotetico elevato numero di replicazioni della stessa operazione tendono a manifestarsi nella stessa direzione. Gli errori pertanto non si compensano. L’entità dell’errore prende il nome di distorsione (bias). Per questo motivo gli errori di natura non casuale sono quelli che pongono maggiori problemi. L’errore non campionario L’errore non campionario Gli errori non campionari hanno generalmente un impatto superiore rispetto a quello attribuibile all’errore campionario, in quanto non sono programmabili. Si tratta di errori che possono manifestarsi in qualsiasi fase dell’indagine (raccolta dati, trattamento, …). NON possono essere programmati in anticipo ed è pertanto difficile tenerli sotto controllo. La loro ampiezza tende ad aumentare all’aumentare del numero di unità da osservare. La valutazione del loro L’impatto sulle stime finali richiede l’applicazione di metodi ad hoc o la conduzione di indagini aggiuntive (es. indagini di controllo). U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 54. 14 L’errore non campionario - copertura - mancata risposta - misurazione - trattamento ed elaborazione dati Errori di: Errori dovuti ad imperfezioni nella corrispondenza fra la lista utilizzata per selezionare e contattare le unità statistiche (archivi di base) e la popolazione oggetto di indagine. Gli errori di copertura possibili sono di due tipi: – inclusione nell'indagine di unità non appartenenti alla popolazione oggetto di interesse (sovracopertura); – l'impossibilità di selezionare o coinvolgere nell'indagine unità appartenenti alla popolazione oggetto di indagine (sottocopertura). L’errore non campionario: di copertura U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 55. 15 Errori dovuti al rifiuto o all'impossibilità di rispondere da parte delle unità statistiche contattate. Possono essere: – totali: se l'unità di rilevazione non fornisce alcuna delle informazioni richieste; – parziali: quando l'unità non fornisce solo alcune particolari risposte. L’errore non campionario: di mancata risposta Errori costituiti dalla differenza fra il vero valore della caratteristica da misurare su una data unità statistica e il valore effettivamente osservato all'indagine. Tali differenze possono essere: – introdotte dal rispondente stesso (per dimenticanza, imprecisione o dolo); – introdotte nelle fasi di elaborazione successive alla raccolta del dato (Esempio: errori introdotti dalle operazioni di registrazione su supporto informatico o di codifica dei quesiti aperti). L’errore non campionario: di misurazione U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 56. 16 Sono errori introdotti nella fase di preparazione ed elaborazione dei dati raccolti. L’errore non campionario: di trattamento ed elaborazione dati Azioni per ridurre l’errore non campionario Le azioni di intervento per ridurre l’errore non campionario si distinguono in: • preventive: fanno parte di queste azioni tutte quelle accortezze mirate a prevenire l’insorgenza dell’errore, si concretizzano in una serie di azioni che attengono prevalentemente alla fase di progettazione di un’indagine; • di monitoraggio: permettono di individuare nel corso dell’indagine eventuali problemi o imperfezioni che possono essere migliorate, ad esempio analisi della reportistica giornaliera prevista nella fase di rilevazione (analisi delle durate, delle cadute, dei rifiuti, se necessario distinta per rilevatore); • di controllo e correzione: hanno l’obiettivo di individuare e correggere l’errore (attraverso imputazione delle mancate risposte con metodo deterministico o probabilistico) e si realizzano successivamente alla fase di rilevazione (compresa l’eventuale registrazione su supporto informatico se non assistite da PC). U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 57. 17 Come si misura l’errore? Misure dirette: si tratta di stime di varianza e/o distorsione che forniscono una valutazione diretta dell’errore ma richiedono l’applicazione di metodi ad hoc o indagini supplementari con conseguente allungamento dei tempi e dei costi. Indicatori di qualità: si tratta di una serie di indicatori relativi al processo di produzione (tassi errori di lista, tasso di mancate risposte, tasso imputazione, …) e hanno le seguenti caratteristiche: – sono più economici delle misure dirette; – permettono di individuare meglio i punti critici del processo; – analizzati congiuntamente permettono un giudizio sul livello complessivo della qualità di un prodotto; – non forniscono una misura diretta dell’errore. Conclusioni • Le informazioni statistiche possono essere rilevate attraverso diverse tipologie di indagine, ognuna con differenti criticità e punti di forza. • Tra le fasi di un’indagine statistica quella più complessa è quella della progettazione poiché in essa si gettano le basi per le fasi successive. • L’accuratezza è un requisito fondamentale per la qualità dell’informazione statistica. • Gli errori ‘non campionari’ possono annidarsi in ognuna delle fasi che portano ad un’indagine statistica. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 58. 18 Copyright AVVISO - Ai sensi dell'art. 1, comma 1 del decreto-legge 22 marzo 2004, n. 72, come modificato dalla legge di conversione 21 maggio 2004 n. 128, le opere presenti su questo sito hanno assolto gli obblighi derivanti dalla normativa sul diritto d'autore e sui diritti connessi. Tutti i contenuti sono proprietà letteraria riservata e protetti dal diritto di autore della Università degli Studi Guglielmo Marconi. Si ricorda che il materiale didattico fornito è per uso personale degli studenti, al solo scopo didattico. Per ogni diverso utilizzo saranno applicate le sanzioni previste dalla legge 22 aprile 1941, n. 633. Copyright©UNIMARCONI U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 59. 1 La rilevazione statistica (Parte seconda) Argomenti • Nella presente lezione verranno trattati i seguenti argomenti: – tecniche di indagine; – costruzione di un questionario; – strutturazione delle domande e tipologie di quesiti. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 60. 2 Obiettivi • Con questa lezione ci si propone di raggiungere i seguenti obiettivi: – distinguere le diverse tecniche di indagine attraverso un confronto di vantaggi e svantaggi di ogni singola tecnica; – comprendere come si costruisce un questionario; – capire il significato e l’uso di diverse tipologie di quesiti. Le tecniche di indagine U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 61. 3 Le tecniche di indagine • Definizione: – insieme delle modalità di contatto delle unità statistiche interessate dalla rilevazione (unità di rilevazione) e di reperimento delle informazioni oggetto di interesse. INTERVISTA DIRETTA INTERVISTA TELEFONICA QUESTIONARIO AUTOCOMPILATO Intervista diretta • Viene condotta da un rilevatore che legge le domande e le opzioni di risposta (se domanda a risposta predefinita) nello stesso ordine e linguaggio del questionario. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 62. 4 Intervista diretta Vantaggi • Buona capacità di persuadere il rispondente • Identificazione del rispondente • Istruzione del rispondente • Interviste più approfondite Svantaggi • Costi alti • Necessaria organizzazione capillare sul territorio • Tempi lunghi di raccolta dei dati • Rischi di condizionare il rispondente • L’intervistatore potrebbe cambiare la sequenza delle domande • L’intervista potrebbe sembrare un interrogatorio Intervista telefonica • Viene condotta da un rilevatore che legge le domande e le opzioni di risposta (se domanda a risposta predefinita) nello stesso ordine e linguaggio del questionario. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 63. 5 Vantaggi • Bassi costi rispetto al faccia a faccia • Velocità nella raccolta • Non è richiesta una organizzazione sul territorio • Migliore la fase di monitoraggio • Maggiori possibilità di contatto in orari non canonici • Minore condizionamento e maggiore possibilità di sottoporre quesiti delicati Svantaggi • Selettività del campione (impossibile contattare famiglie senza telefono) • Il rispondente non è identificato con certezza • Il questionario deve avere una durata limitata Intervista telefonica Questionario autocompilato • Il ricevente riceve il questionario a mezzo di un corriere, lo compila e lo rispedisce indietro o lo riconsegna ad un addetto. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 64. 6 Vantaggi • Bassi costi • Minore organizzazione • Non c’è condizionamento • Idoneo per quesiti delicati • Maggiore disponibilità per reperire informazioni e documentazioni, in particolare per quesiti che riguardano il passato Svantaggi • Tempi lunghi di raccolta • Impossibile identificare con certezza il rispondente • Minore capacità di ottenere partecipazione all’indagine • Difficile aiutare il rispondente nella compilazione Questionario autocompilato Il questionario U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 65. 7 Il questionario • Definizione: – è lo strumento di rilevazione designato a raccogliere le informazioni sulle variabili qualitative e quantitative oggetto di indagine. Il questionario come strumento di misura e di comunicazione • STRUMENTO DI MISURA Affinché tale strumento sia adeguato a misurare un fenomeno si impongono due condizioni: • i quesiti devono essere rivolti a tutti nella stessa forma; • i quesiti devono avere un significato univoco. • STRUMENTO DI COMUNICAZIONE Ha la funzione di trasmettere all’intervistato l’esatto significato dell’informazione richiesta. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 66. 8 Costruzione dello schema concettuale del questionario • È un modello concettuale (insieme di strutture e rappresentazioni) che consente di raccogliere tutti gli aspetti della realtà di interesse. • Operazioni: – adottare una successione logica di temi; – evitare condizionamenti nella disposizione del questionario; – considerare adeguatamente la difficoltà dell’argomento. Costruzione dello schema concettuale del questionario • È preferibile inserirli a metà del questionario Quesiti con sforzo di memoria • È preferibile inserirli alla fine del questionario Quesiti delicati • Idonei per saltare sezioni • Idonei per saltare quesiti • Fondamentali per evitare condizionamenti nelle domande Domande filtro U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 67. 9 Strutturazione delle domande (quesiti) A risposta aperta • Quando il fenomeno è sconosciuto: – lasciano all’intervistato la possibilità di esprimersi nella forma che preferisce. A risposta predefinita • Quando è noto il campo di variazione di un fenomeno: – prevedono alternative fisse di risposte predefinite dal ricercatore. Domande a risposta aperta Vantaggi • Non ci sono condizionamenti • Idonee per quesiti delicati • Versatili per tutte le ricerche Svantaggi • Alti costi • Lunghi tempi per decodifica • Necessità di personale addestrato • Sforzo elaborazione rispondente • Limite culturale • Rischio “luoghi comuni” U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 68. 10 Domande a risposta predefinita Vantaggi • Riduzione tempi elaborazione e codifica • Riduzione errori trascrizione • Aiuto alla memoria (ottimo per indagini retrospettive) • Facilitano il rispondente Svantaggi • Se la lista è troppo lunga c’è il rischio di influenzare gli intervistati e produrre concentrazioni artificiose in corrispondenza di alcune modalità • Possono indurre scelte non ragionate dovute a forme di acquiescenza in particolar modo quando le domande riguardano opinioni, motivazioni o atteggiamenti Problematiche relative all’utilizzo di risposte predefinite e possibili soluzioni • Non sempre si conoscono tutte le modalità che un fenomeno può assumere (e anche quando si conoscono è necessaria una pre-codifica). • domande aperte funzionali all’adozione di criteri per elaborare le modalità per risposte predefinite Indagine esplorativa U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 69. 11 • A volte gli item non coprono tutti i casi possibili per cui è opportuno lasciare una modalità aperta “altro (specificare)”. Vantaggio della modalità “altro” Consente di raccogliere i casi rari In fase di pilota, l’analisi delle voci consente di migliorare l’efficienza della domanda Se non si prevede la modalità “altro” Aumento della frequenza di alcune modalità Si gonfia il numero delle mancate risposte Problematiche relative all’utilizzo di risposte predefinite e possibili soluzioni • A volte è opportuna una domanda strutturata ma senza leggere le risposte: – per evitare di influenzare gli intervistati o concentrare le risposte sui primi o sugli ultimi item. Limite: rischio di alterare la qualità delle risposte dovuto alla discrezionalità dell’intervistatore Problematiche relative all’utilizzo di risposte predefinite e possibili soluzioni U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 70. 12 Come strutturare le domande • Indagine esplorativa • Ricorso a esperti (in particolare per la terminologia) • Spunti da altre indagini (rischio di mancata esaustività, tempi e cultura diversi) Strutturazione delle domande a risposta predefinita Le domande chiuse • Tra le domande a risposta predefinita le domande chiuse rappresentano un caso limite e presentano massimo tre modalità di risposta. • Generalmente vengono utilizzate per verificare la presenza-assenza di un fenomeno e spesso sono utilizzate come domande filtro. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 71. 13 Domanda aperta o predefinita? • Ogni volta che si aggrega si perdono informazioni Tipo di variabili (classificazione o studio) • Per non appesantire il rispondente Accuratezza • Se sconosciuto, domanda aperta Natura del fenomeno Il problema dei ‘non so’ La possibilità di inserire “non so” • Dovrebbe significare che il rispondente non ha riflettuto o è indeciso, ma a volte è indice esclusivamente di pigrizia. • si forza il rispondente ad inserire una modalità a caso Se non si inserisce: • potrebbe costituire un ‘escamotage’ per coloro che sono momentaneamente perplessi o pigri Se si inserisce in maniera esplicita: U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 72. 14 Alcune tipologie di quesiti RETROSPETTIVI DELICATI I quesiti retrospettivi • Si usano nelle indagini retrospettive o per indagare alcuni fenomeni riferiti al passato. Limiti • Campione selezionato • Errori dovuti alla memoria (omissione di informazioni ed «effetto telescoping») U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 73. 15 I quesiti retrospettivi Come si limitano gli errori dovuti alla memoria? Come si limitano gli errori dovuti alla memoria? Identificare la forma più adeguata con cui esprimere un quesito Individuare la lunghezza ottimale sul periodo di riferimento Prevedere strumenti che aiutino il ricordo Inserire domande strutturate I quesiti retrospettivi Tipi di quesiti retrospettivi Stesso periodo di riferimento per tutti i rispondenti (es. anno x) Periodo di riferimento mobile (dalla data dell’intervista) ma di durata uguale per tutti (es. ultima settimana) Periodo di riferimento e durata diversa per ogni rispondente U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 74. 16 I quesiti retrospettivi Quando sussistono più periodi di riferimento: Limitare la diversificazione temporale Evitare sforzo di memoria e di calcolo Come si aiuta l’intervistato? Domande strutturate Fatti documentati Diari I quesiti “delicati” Come somministrarli? • sottolineare la normalità di certi comportamenti quando sono conosciuti come “devianti”; • non essere bruschi e affrettati; • incorporare la domanda in una breve affermazione per far vedere il carattere non valutativo dell’indagine; • ricorrere all’auto-compilazione. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 75. 17 I quesiti “delicati” Da evitare: • uso di parole che abbiano una carica emotiva in positivo o negativo; • domande che collegano a fatti obiettivamente positivi o negativi (es. volontariato o guerra); • domande che danno per scontati alcuni fatti. La verifica del questionario prima di passare all’indagine ‘a regime’ • Si usa nella fase preliminare del questionario per determinare la forma più adatta alla strutturazione delle domande INDAGINE ESPLORATIVA • Costituisce il veicolo più utilizzato per validare internamente il questionario la cui ‘bozza’ viene testata su un campione ragionato di unità PRE-TEST • Vengono messe a confronto sia diverse versioni di questionario sia, eventualmente, diverse tecniche di indagine TEST FORMALE DELLE ALTERNATIVE • E’ la ‘prova generale’ del questionario e serve a valutare sia la bontà dello strumento in senso stretto sia gli altri aspetti della ricerca INDAGINE PILOTA U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 76. 18 Conclusioni • La scelta della tecnica di indagine varia in funzione di numerosi aspetti. • Il questionario è uno strumento di rilevazione che cambia in base alla tecnica di indagine. • Le tipologie di quesiti cambiano in base agli obiettivi di un’indagine e alla conoscenza di un fenomeno. Copyright AVVISO - Ai sensi dell'art. 1, comma 1 del decreto-legge 22 marzo 2004, n. 72, come modificato dalla legge di conversione 21 maggio 2004 n. 128, le opere presenti su questo sito hanno assolto gli obblighi derivanti dalla normativa sul diritto d'autore e sui diritti connessi. Tutti i contenuti sono proprietà letteraria riservata e protetti dal diritto di autore della Università degli Studi Guglielmo Marconi. Si ricorda che il materiale didattico fornito è per uso personale degli studenti, al solo scopo didattico. Per ogni diverso utilizzo saranno applicate le sanzioni previste dalla legge 22 aprile 1941, n. 633. Copyright©UNIMARCONI U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 77. 1 Le distribuzioni statistiche Argomenti • Nella presente lezione verranno trattati i seguenti argomenti: – la distribuzione statistica; – la distribuzione statistica unitaria; – la distribuzione statistica di frequenze; – la distribuzione statistica di quantità; – le serie e le seriazioni. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 78. 2 Obiettivi • Con questa lezione ci si propone di raggiungere i seguenti obiettivi: – comprendere cosa è una distribuzione statistica; – comprendere le differenze tra le diverse distribuzioni; – comprendere come organizzare i dati statistici relativi ad un collettivo statistico in forma di distribuzione; – conoscere le diverse tipologie di serie e seriazioni statistiche. La distribuzione statistica U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 79. 3 La distribuzione statistica • La distribuzione statistica rappresenta il modo in cui le diverse modalità di un carattere si distribuiscono tra le unità di un collettivo statistico. • In base al numero di caratteri cui si riferisce, la distribuzione si distingue: • se il carattere secondo cui si distribuisce il collettivo statistico è unico Semplice • se i caratteri secondo cui si distribuisce il collettivo statistico sono due Doppia • se i caratteri secondo cui si distribuisce il collettivo statistico sono più di due Multipla La distribuzione statistica • In base al modo con cui vengono presentati i dati e al tipo di carattere si distingue in : • quando ad ogni unità del collettivo statistico viene associata la modalità con la quale si presenta ciascun carattere Unitaria • quando ad ogni modalità di un carattere viene associato il numero delle unità statistiche (frequenza assoluta) che presenta quella modalità. Di Frequenza • quando ad ogni modalità di un carattere viene associata la quantità che presenta quella modalità (solo per dati quantitativi). Di quantità U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 80. 4 La distribuzione unitaria • Si parla di distribuzione statistica unitaria quando ad ogni unità del collettivo statistico viene associata la modalità con la quale si presenta ciascun carattere. • In generale: date n unità di un collettivo, la distribuzione unitaria secondo un carattere X (con modalità x1…xk) è un insieme di n coppie in cui il primo elemento indica l'unità del collettivo e il secondo indica la modalità del carattere osservato (xi). Se abbiamo n caratteri, ad ogni unità del collettivo corrisponderanno le n modalità corrispondenti (distribuzione unitaria multipla) La distribuzione unitaria • Esempio: consideriamo come si distribuisce un collettivo di 10 studenti iscritti al 2° anno di Scienze statistiche secondo il voto ottenuto rispettivamente all’esame di statistica e matematica (distribuzione unitaria doppia). Studente Voto in statistica Voto in matematica 1° 30 27 2° 21 25 3° 26 28 4° 19 21 5° 20 26 6° 30 30 7° 19 23 8° 30 27 9° 23 28 10° 26 28 U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 81. 5 La distribuzione di frequenze • Si parla di distribuzione statistica di frequenza quando ad ogni modalità di un carattere viene associato il numero delle unità statistiche (frequenza assoluta) che presenta quella modalità. La distribuzione di frequenze • In generale: dato un carattere X che presenta le modalità x1, x2,…, xi,…, xk e un collettivo statistico costituito da n unità statistiche avremo che la distribuzione di frequenze del collettivo rispetto al carattere X sarà: dove la generica ni (frequenza assoluta) indica il numero delle unità statistiche che presentano la modalità xi. Carattere X Numero di unità statistiche x1 n1 x2 n2 . . . . xi ni . . xk nk Totale n U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 82. 6 La distribuzione di frequenze • Esempio: trasformiamo la distribuzione unitaria dell’esempio precedente in una distribuzione di frequenze considerando un solo carattere: “voto in statistica”. Voto in statistica xi Numero di studenti ni 18 0 19 2 20 1 21 1 22 0 23 1 24 0 25 0 26 2 27 0 28 0 29 0 30 3 Totale 10 La distribuzione di frequenze doppia • Dati due caratteri X e Y che presentano rispettivamente le modalità x1, x2,…, xi,…, xk e y1, y2,…, yj,…, yw e dato un collettivo statistico costituito da n unità statistiche avremo che la distribuzione di frequenze del collettivo rispetto ai caratteri X e Y sarà: dove la generica nij (frequenza assoluta) indica il numero delle unità statistiche che presentano contemporaneamente la modalità xi del carattere X e yj del carattere Y . Carattere X Carattere Y y1 y2 . . yj . yw Totale x1 n11 n12 . . n1j . n1w n10 x2 n21 n22 . . n2j . n2w n20 . . . . . . . . . . . . . . . . . . xi ni1 ni2 . . nij . niw nio . . . . . . . . . xk nk1 nk2 . . nkj . nkw nk0 Totale n01 n02 . . n0j . n0k n U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 83. 7 La distribuzione di frequenze doppia • Esempio: trasformiamo la distribuzione unitaria dell’esempio precedente in una distribuzione di frequenze considerando entrambi i caratteri : “voto in statistica” e “voto in matematica”. Voto in statistica Voto in matematica Totale 18 19 20 21 22 23 24 25 26 27 28 29 30 18 0 19 1 1 2 20 1 1 21 1 1 22 0 23 1 1 24 0 25 0 26 2 2 27 0 28 0 29 0 30 2 1 3 Totale 0 0 0 1 0 1 0 1 1 2 3 0 1 10 La distribuzione di frequenze doppia Nel caso di distribuzione di frequenze doppia si definisce: – distribuzione marginale di X: la distribuzione della X, indipendentemente dalle modalità della Y; Corrisponde alla distribuzione di frequenze semplice del collettivo statistico rispetto al carattere X. Carattere X Carattere Y y1 y2 . . yj . yw Totale x1 n11 n12 . . n1j . n1w n10 x2 n21 n22 . . n2j . n2w n20 . . . . . . . . . . . . . . . . . . xi ni1 ni2 . . nij . niw nio . . . . . . . . . xk nk1 nk2 . . nkj . nkw nk0 Totale n01 n02 . . n0j . n0k n U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 84. 8 La distribuzione di frequenze doppia Nel caso di distribuzione di frequenze doppia si definisce: • distribuzione marginale di Y: la distribuzione della Y, indipendentemente dalle modalità della X; Corrisponde alla distribuzione di frequenze semplice del collettivo statistico rispetto al carattere Y. Carattere X Carattere Y y1 y2 . . yj . yw Totale x1 n11 n12 . . n1j . n1w n10 x2 n21 n22 . . n2j . n2w n20 . . . . . . . . . . . . . . . . . . xi ni1 ni2 . . nij . niw nio . . . . . . . . . xk nk1 nk2 . . nkj . nkw nk0 Totale n01 n02 . . n0j . n0k n La distribuzione di frequenze doppia Nel caso di distribuzione di frequenze doppia si definisce: – distribuzioni condizionate di X: le distribuzioni della X, in corrispondenza di ciascuna delle modalità della Y; Corrisponde alla distribuzione di frequenze del collettivo statistico rispetto al carattere X dato Y=yj. Carattere X Carattere Y y1 y2 . . yj . yw Totale x1 n11 n12 . . n1j . n1w n10 x2 n21 n22 . . n2j . n2w n20 . . . . . . . . . . . . . . . . . . xi ni1 ni2 . . nij . niw nio . . . . . . . . . xk nk1 nk2 . . nkj . nkw nk0 Totale n01 n02 . . n0j . n0k n U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 85. 9 La distribuzione di frequenza doppia Nel caso di distribuzione di frequenze doppia si definisce: – distribuzioni condizionate di Y: le distribuzioni della Y, in corrispondenza di ciascuna modalità della X; Corrisponde alla distribuzione di frequenze del collettivo statistico rispetto al carattere Y dato X=xk. Carattere X Carattere Y y1 y2 . . yj . yw Totale x1 n11 n12 . . n1j . n1w n10 x2 n21 n22 . . n2j . n2w n20 . . . . . . . . . . . . . . . . . . xi ni1 ni2 . . nij . niw nio . . . . . . . . . xk nk1 nk2 . . nkj . nkw nk0 Totale n01 n02 . . n0j . n0k n La distribuzione di quantità • Si parla di distribuzione di quantità quando ad ogni modalità del carattere X (x1, x2,…, xi,…, xk) si fa corrispondere la quantità del carattere Q (q1, q2,…qi,qk) rilevata sulle n unità della popolazione. Modalità del carattere X Quantità x1 q1 x2 q2 . . . . xi qi . . xk qk Totale q U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 86. 10 La distribuzione di quantità • Esempio: ammontare dei protesti in euro secondo il tipo di titolo di credito. Tipo di titolo di credito Ammontare dei titoli protestati (in migliaia di euro) Cambiale ordinaria 3.800 Tratta 4.580 Assegno bancario 1.250 Totale 9.630 Serie e seriazioni U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 87. 11 Serie e seriazioni Se il carattere secondo cui è costruita la distribuzione è di tipo qualitativo la distribuzione è detta: SERIE Se il carattere secondo cui è costruita la distribuzione è di tipo quantitativo la distribuzione è detta: SERIAZIONE Una serie può essere: Sconnessa se il carattere secondo cui è costruita la distribuzione è di tipo qualitativo sconnesso (ovvero non ordinabile secondo una gerarchia) Ordinata se il carattere secondo cui è costruita la distribuzione è di tipo qualitativo ordinato Rettilinea se il carattere secondo cui è costruita la distribuzione è di tipo ordinato rettilineo Ciclica se il carattere secondo cui è costruita la distribuzione è di tipo ordinato ciclico Serie U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 88. 12 • Caratteri: genere, colore occhi, colore capelli, cittadinanza, ecc. Sconnessa • Caratteri: titolo di studio, posizione nella professione, ecc. Ordinata rettilinea • Caratteri: giorni della settimana, stagioni, mesi, ecc. Ordinata ciclica • Esempio: Serie • sono distribuzioni di un dato fenomeno rispetto al tempo. Tipici esempi ne sono i dati statistici relativi alle produzioni industriali nei vari anni, quelli relativi alla natalità (o mortalità) distinti per giorni, mesi, anni, ecc. Le serie storiche possono essere: • statiche : quando non vi sono variazioni apprezzabili; • dinamiche: quando il fenomeno tende a variare. Serie TEMPORALI (O STORICHE) • sono distribuzioni di un dato fenomeno rispetto allo spazio. Ad esempio, la serie dei nati in Italia in un dato anno distinti per regione costituisce una serie territoriale. Serie DI LUOGO (O TERRITORIALI) • Tra le serie più conosciute ed utilizzate abbiamo: Serie U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 89. 13 Seriazioni Una seriazione può essere: Rettilinea se il carattere secondo cui è costruita la distribuzione è di tipo quantitativo rettilineo Ciclica se il carattere secondo cui è costruita la distribuzione è di tipo quantitativo ciclico Seriazioni Esempio di seriazione rettilinea: distribuzione di frequenze degli studenti iscritti al corso di statistica secondo l’altezza Per quanto riguarda le seriazioni cicliche, si tratta di dati che vengono presi in considerazione molto raramente (es. latitudine e longitudine). Statura (in cm) Numero di studenti meno di 155 3 155-160 2 160-165 36 165-170 78 170-175 99 175-180 71 180-185 21 185-190 7 190 e oltre 1 Totale 318 U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 90. 14 Conclusioni • In base al numero di caratteri cui si riferisce la distribuzione statistica essa può essere classificata in semplice, doppia o multipla. • In base al modo con cui vengono presentati e al tipo di dati della distribuzione statistica essa può essere classificata in unitaria, di frequenza o di quantità. • Se il carattere secondo cui è costruita la distribuzione è di tipo qualitativo la distribuzione è detta serie, se è di tipo quantitativo è detta seriazione. Copyright AVVISO - Ai sensi dell'art. 1, comma 1 del decreto-legge 22 marzo 2004, n. 72, come modificato dalla legge di conversione 21 maggio 2004 n. 128, le opere presenti su questo sito hanno assolto gli obblighi derivanti dalla normativa sul diritto d'autore e sui diritti connessi. Tutti i contenuti sono proprietà letteraria riservata e protetti dal diritto di autore della Università degli Studi Guglielmo Marconi. Si ricorda che il materiale didattico fornito è per uso personale degli studenti, al solo scopo didattico. Per ogni diverso utilizzo saranno applicate le sanzioni previste dalla legge 22 aprile 1941, n. 633. Copyright©UNIMARCONI U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 91. 1 Le rappresentazioni grafiche Argomenti • Nella presente lezione verranno trattati i seguenti argomenti: – la rappresentazione grafica; – i grafici delle distribuzioni semplici secondo un carattere qualsiasi; – i grafici delle distribuzioni semplici secondo un carattere ordinato; – i grafici delle distribuzioni semplici secondo un carattere quantitativo; – i grafici delle serie territoriali. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 92. 2 Obiettivi • Con questa lezione ci si propone di raggiungere i seguenti obiettivi: – comprendere a cosa serve una rappresentazione grafica; – saper rappresentare un grafico per migliorare facilitare l’interpretazione di un fenomeno; – comprendere quale tipo di grafico scegliere in base al tipo di distribuzione che caratterizza un dato fenomeno. La rappresentazione grafica U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 93. 3 La rappresentazione grafica • Le rappresentazione grafica è sostanzialmente un disegno che si ottiene facendo corrispondere ai numeri di una tabella degli enti geometrici elementari o diverse intensità di colore o tratteggio. • Infatti, ciò che in una tabella può dedursi con fatica o solo se esperti, può essere fornito con immediatezza e chiarezza a mezzo di una rappresentazione grafica. Grafici e tabelle • La rappresentazione grafica ha dunque dei vantaggi rispetto alla rappresentazione tabellare, in termini di immediatezza nella comprensione di un fenomeno, ma è senza dubbio una fonte meno ricca di informazioni. Le cifre delle tabelle danno l’analisi dei fenomeni Tabelle Tabelle Essi forniscono la sintesi di un fenomeno e ne consentono una chiara percezione Grafici Grafici U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 94. 4 Grafici e tabelle • Talvolta un grafico può sostituire una tabella, ma nella maggior parte dei casi, in particolare nelle distribuzioni multiple, grafici e tabelle sono il complemento l’uno dell’altra. La rappresentazione grafica deve essere completamente autonoma dalla tabella che ne ha dato origine e deve contenere pertanto tutte le informazioni necessarie per la sua chiara interpretazione. Regole da osservare nella compilazione di un grafico • Indicare il titolo in cui deve essere specificato l’oggetto della rappresentazione, il riferimento temporale e spaziale e la fonte da cui sono stati ricavati i dati. • Indicare chiaramente quali sono i caratteri che sono stati osservati nelle unità. • Indicare sempre le unità di misura. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 95. 5 Grafici delle distribuzioni semplici secondo un carattere qualsiasi Diagrammi simbolici o pictogrammi • Il pictrogramma, o diagramma simbolico, è un tipo di rappresentazione grafica prettamente divulgativa ed è destinata a un pubblico vasto. • Il pictogramma è costituito da simboli che ricordano l’oggetto al quale si riferisce il fenomeno rappresentato e che sono ripetuti tante volte quant’è la frequenza o la quantità della relativa modalità o situazione o hanno dimensioni minori o maggiori a seconda di tali frequenze o quantità. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 96. 6 • Esempio: Consumo medio annuo di birra in Lazio e Lombardia nel 2012 (in litri) Regioni Consumo medio annuo di birra Lazio 60 litri Lombardia 90 litri Lazio Lombardia Attenzione a rispettare la proporzione corrispondente a quantità o frequenza Diagrammi simbolici o pictogrammi • Le frequenze o le quantità delle modalità di riferimento sono rappresentate da rettangoli aventi tutti la stessa altezza e basi proporzionali alle frequenze o alle quantità. Nastri • Le frequenze o le quantità delle modalità di riferimento sono rappresentate da rettangoli aventi tutti la stessa base e altezze proporzionali alle frequenze o alle quantità. Colonne • I grafici a nastri o colonne possono essere sostituiti da grafici a barre (orizzontali o verticali rispettivamente) che hanno l’aspetto di figure tridimensionali. Barre Grafici a nastri, a colonne o a barre Sono grafici particolarmente indicati a rappresentare distribuzioni secondo caratteri qualitativi. Se il carattere qualitativo è ordinato i nastri o le colonne vanno disposti secondo l’ordine cui si susseguono le modalità. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 97. 7 Grafici a nastri 39,2 21,6 5,0 4,8 5,2 6,5 4,2 13,5 0 20 40 60 Per stare più tempo con i figli Inconciliabilità lavoro-famiglia Insoddisfatta dei guadagni Insoddisfatta della posizione lavorativa Motivi di salute Insoddisfatta tipo lavoro Sede distante Altri motivi Valori percentuali • Esempio: Madri occupate per motivo della difficoltà nel conciliare famiglia e lavoro, Anno 2005, Italia – valori percentuali Fonte: Istat, Indagine Campionaria sulle nascite Anno 2005 Grafici a colonne • Parti per luogo del parto, Vari anni, Italia – valori percentuali 0 10 20 30 40 50 60 70 80 90 100 Abitazione Istituto di cura pubblico Casa di cura privata Altri luoghi Valori percentuali Luogo del parto 1980 1990 1996 2000/2001 2003 Fonte: Istat, Indagine Campionaria sulle nascite Anno 2005 U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 98. 8 Grafici a barre • Esempio: 0 20 40 Per stare più tempo con i figli Inconciliabilità lavoro-famiglia Insoddisfatta dei guadagni Insoddisfatta della posizione… Motivi di salute Insoddisfatta tipo lavoro Sede distante Altri motivi 39,2 21,6 5,0 4,8 5,2 6,5 4,2 13,5 Valori percentuali 0 10 20 30 40 50 60 70 80 90 Abitazion e Istituto di cura… Casa di cura… Altri luoghi Valori percentuali Luogo del parto 1980 1990 1996 2000/ 2001 2003 Fonte: Istat, Indagine Campionaria sulle nascite Anno 2005 Madri occupate per motivo della difficoltà nel conciliare famiglia e lavoro, Anno 2005, Italia – valori percentuali Parti per luogo del parto, Vari anni, Italia – valori percentuali Aereogrammi • L’aereogramma è un grafico in cui le frequenze o le quantità di una distribuzione statistica sono rappresentate da superfici di figure piane poste una accanto all’altra, oppure, tra i più usati, da parti di un’unica figura. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 99. 9 Aereogrammi • Esempio: Madri che non lavorano per motivazione, Anno 2005, Italia – valori percentuali Perché non ne avverte la necessità 4.0% Perché non ha trovato un lavoro adatto a lei 7.6% Perché vuole dedicarsi completam ente alla famiglia 69.5% Perché non sa a chi affidare il bambino; 5.3% Non riesce a trovare un lavoro 10.2% Altre motivazioni 3.3% Fonte: Istat, Indagine Campionaria sulle nascite Anno 2005 Grafici delle distribuzioni semplici secondo un carattere ordinato U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 100. 10 Rappresentazione grafica delle distribuzioni secondo un carattere ordinato (istogramma a basi uguali) • Le modalità di un carattere ordinato hanno un ordine e una prima ed una ultima modalità. Le modalità si rappresentano come segmenti uguali disposti uno accanto all’altro su una retta seguendo l’ordine in cui si susseguono le modalità, e le frequenze o quantità corrispondenti con un rettangolo avente per base (o altezza se a nastri) il segmento rappresentante la modalità, e come altezza (o base) un segmento proporzionale alla frequenza o alla quantità. • Si ottiene così un istogramma a basi uguali. Ordinato RETTILINEO • Se un carattere è ordinato ciclico, le modalità non presentano per definizione un inizio e fine ‘naturali’, ma, se vengono fissate convenzionalmente, possono esser assimilabile e dunque rappresentata come un carattere ordinato rettilineo. • Se non si vogliono fare convenzioni sulle modalità estreme bisogna rappresentare le modalità ricorrendo a sezioni di una circonferenza o di un cerchio. Ordinato CICLICO Rappresentazione grafica delle distribuzioni secondo un carattere ordinato rettilineo • Esempio: Madri al primo figlio per giudizio espresso sul desiderio di avere altri figli in futuro (dati fittizi), Anno 2011, Italia – valori percentuali Fonte: (dati fittizi) U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 101. 11 Grafici delle distribuzioni semplici secondo un carattere quantitativo Rappresentazione grafica delle distribuzioni semplici secondo un carattere quantitativo (diagramma cartesiano) • Si può rappresentare in un sistema cartesiano ortogonale ponendo sull’asse delle ascisse le modalità e sull’asse delle ordinate le frequenze; l’insieme dei punti costituisce la distribuzione. • Per aumentare la valenza segnaletica del grafico si possono congiungere i punti derivanti dalle coordinate (x,y) con l’asse x, tramite segmenti paralleli all’asse y; si ottiene così il diagramma cartesiano ad aste. Quantitativo DISCRETO • Anche il carattere quantitativo continuo si usa rappresentare sul diagramma cartesiano, mettendo sulle ascisse il carattere continuo, e sulle ordinate la frequenza o la quantità relativa alla modalità. Le modalità sono equamente distanziate l’una dall’altra, e il grafico è costituito da un numero finito di punti relativo ad ogni modalità; se si utilizzasse un registratore a grafico continuo l’insieme di punti darebbe luogo ad una curva. Quantitativo CONTINUO e SERIE STORICHE U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 102. 12 Rappresentazione grafica delle distribuzioni semplici secondo un carattere quantitativo per serie storiche (diagramma cartesiano) • Il diagramma cartesiano (che utilizziamo anche per i caratteri quantitativi continui) è la rappresentazione grafica più idonea a rappresentare le serie storiche che rappresentano l’andamento nel tempo di un collettivo di stato (stock rilevabile in un istante di tempo) o di un carattere quantitativo di stato. • Si usa rappresentare pertanto sulle ascisse il tempo in modo che ogni punto dell’asse rappresenti l’istante. Rappresentazione grafica delle distribuzioni secondo un carattere quantitativo discreto • Esempio: Distribuzione di 49 studenti secondo il voto riportato all’esame di ragioneria, Anno 2011, Italia (dati fittizi) Fonte: (dati fittizi) 0 1 2 3 4 5 6 7 8 9 10 18 20 22 24 26 28 30 F r e q u e n z a Voti U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 103. 13 Rappresentazione grafica delle distribuzioni secondo un carattere quantitativo continuo • Esempio: Numero medio di figli per 1.000 donne in età feconda, Anni 1936-1996, Italia Fonte: Istat Rappresentazione grafica delle serie storiche di movimento e delle distribuzioni secondo un carattere quantitativo rettilineo avente per modalità delle classi (istogrammi) • Nel caso di istogramma a intervalli uguali parlare di “area proporzionale” equivale a parlare di “altezza proporzionale”; ogni rettangolo deve avere altezza proporzionale alla frequenza o quantità da rappresentare Intervalli UGUALI • Nel caso di istogramma a intervalli diversi ogni rettangolo deve avere un’altezza proporzionale al rapporto fra il valore da rappresentare e la misura dell’intervallo di base Intervalli DIVERSI U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 104. 14 Rappresentazione grafica delle serie storiche di movimento e delle distribuzioni secondo un carattere quantitativo rettilineo avente per modalità delle classi (intervalli uguali) Fonte: (dati fittizi) • Esempio: distribuzione di 54 studenti iscritti al corso di statistica per classi d’età di uguale ampiezza Classi d'età Frequenza assoluta 19-21 9 22-24 15 25-27 20 28-30 10 Totale 54 0 5 10 15 20 25 19-21 22-24 25-27 28-30 Rappresentazione grafica delle serie storiche di movimento e delle distribuzioni secondo un carattere quantitativo rettilineo avente per modalità delle classi (intervalli diversi) • Volendo rappresentare la stessa distribuzione accorpando le classi d’età nel seguente modo: (19-21;22-30) avremo due rettangoli di base diversa e di altezza rispettivamente uguale o proporzionale ai valori 3 e 5. Fonte: (dati fittizi) Classi d'età Ampiezza della classe C Frequenza assoluta F altezza del rettangolo uguale o proporzionale a F/C 19-21 3 9 3 22-30 9 45 5 Frequenza (o quantità)=(o proporzionale) all’area e quindi uguale o proporzionale bxh h=Area/b=Frequenza (o quantità)/b U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 105. 15 Grafici delle serie territoriali unidimensionali Grafici delle serie territoriali (cartogrammi) • Tali serie, cioè le distribuzioni secondo soltanto un carattere geografico, si possono rappresentare con tutti i grafici che raffigurano le distribuzioni unidimensionali secondo un carattere di qualsiasi tipo, dunque pictogrammi, grafici a nastri, colonne, ecc. • Tuttavia, per mettere in evidenza in maniera immediata la relazione esistente tra dati del fenomeno e relativo ambiente geografico si usa ricorrere a carte geografiche. • I grafici statistici eseguiti su carte geografiche vengono chiamati cartogrammi. U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i
  • 106. 16 Grafici delle serie territoriali (cartogrammi) • Il dettaglio territoriale può essere la ripartizione, la regione, la provincia e il comune. • L’ambito territoriale viene caratterizzato da colori diversi o con intensità crescente al crescere del fenomeno da rappresentare. • Le modalità del fenomeno vengono raggruppate in classi, se i dati sono quantitativi, o comunque aggragate in modo che le modalità non siano troppe (di solito massimo 5), per rendere il cartogramma facilmente interpretabile. • L’ampiezza delle classi corrispondente ai livelli dell’intensità del fenomeno dipende dal fenomeno stesso (possono avere eguale ampiezza, o ampiezza tale da far ricadere lo stesso numero di unità territoriali, o quartili, o ampiezza ragionata. Grafici delle serie territoriali unidimensionali (cartogrammi) • Esempio: tasso di fecondità totale per regione, Anno 2011, Italia – numeri indice (Italia 2011=100) Fonte: (dati fittizi) Regioni Tasso di fecondità N.I. Italia 2011=100 Piemonte 100,58 Valle d'Aosta/Vallée d'Aoste 112,96 Liguria 92,70 Lombardia 106,08 Bolzano/Bozen 114,43 Trento 114,11 Veneto 103,34 Friuli-Venezia Giulia 99,27 Emilia-Romagna 104,39 Toscana 97,40 Umbria 96,30 Marche 99,77 Lazio 101,12 Abruzzo 93,01 Molise 83,10 Campania 99,87 Puglia 93,16 Basilicata 83,77 Calabria 89,68 Sicilia 99,78 Sardegna 81,61 Italia 100,00 U n i v e r s i t à d e g l i S t u d i G u g l i e l m o M a r c o n i