5. Noi siamo interessati sia ai flussi
che alle basi di dati
Organizzazione
Fornisce Fruisce
Aggiorna
Usa
Base Dati
Flusso di dati
Materia
5
6. Scopo della attivita’ di ricostruzione del contenuto informativo della PALP
• Popolare unoschema che metta in correlazione le
seguenti entita’ gerarchicamente suddivise:
• MATERIE(ARGOMENTI)
• DATI
– SCHEMI
• CONCETTUALI
• LOGICI
• FISICI
Organizzando questa parte
In un repository
– CONTENUTI
• UNITA’ ORGANIZZATIVE (2 livelli) ENTI
– FORNITORI
– FRUITORI
6
7. Dettaglio su – organizzazioni, basi dati, e flussi
scambiati - schema dei concetti coinvolti
Base
di dati11
Base
di dati1n
Organizzazione 1
Base
di dati 21
Base
di dati n1
Organizzazione n
Organizzazione 2
Fornisce
Flusso
di dati2
Fornisce
Flusso
di dati1
Base
di dati nn
Flusso
di dati n
7
8. Il modello si puo’ applicare ricorsivamente all’interno
delle organizzazioni: esempio per la organizzazione 1
Base
di dati111
Base
Base
di dati11n di dati 121
Organizzazione 11
Organizzazione 1n
Organizzazione 12
Flusso
di dati12
Flusso
di dati11
Fornisce
Base
Base
di dati 1n1 di dati 1nn
Flusso
di dati1n
Fruisce
8
9. Metaschema – Versione sintetica
Materia/
Argomento CSI
Organizzazione
Fornisce Fruisce
Aggiorna
Usa
Schema logico
fisico di base
di dati
Flusso di dati
9
10. Metaschema – Versione dettagliata - 1
Materia/
Argomento CSI
Organizzazione
Fornisce
Aggiorna
Usa
Fruisce
Flusso di dati
Concetto(Oggetto) di schema
(Entita’/Rel/Gen.)
Schema logico
fisico
Schema concettuale
10
11. Metaschema – Versione dettagliata - 2
Materia/
Argomento CSI
Organizzazione
Fornisce
Aggiorna
Usa
Fruisce
Flusso di dati
Concetto(Oggetto) di schema
(Entita’/Rel/Gen.)
Concetto
Gerarchie Generalizzazione
Schema logico
fisico
Schema concettuale
Schema
conc. base
Schema
conc. astratto
Repository
11
12. Il metaschema della attivita’ di ricostruzione
degli schemi CSI rappresentato in Infodir
12
13. Il metaschema della attivita’ di ricostruzione degli schemi CSI
............
IS T IT UZIONE
BAS E DAT I
T AVOLA (C OMP
INFO)
S UPE R T IPO
...........
........
.........
UNIT A
OR G ANIZZAT IVA
C OLLE ZIONE
C ONC E T T O
.......
......
..........
AT T R IBUT O
.
.....
..
MAT E R IA
(AR G OME NT O IN
C S I)
R E LAZIONE
.............
....
C ONC E T T O IN
S C HE MA
GE R AR C HIA
S C HE MA
E NTIT A
...
GE NE R ALIZZAZIONE
13
14. Quale e’ la conoscenza disponibile
per popolare il metaschema?
• Gli schemi logici e fisici della PA Piemontese
gestiti da Infodir
• Gli schemi concettuali della PA centrale
organizzati in un Repository
14
15. Descrizione del problema
• Si vuole arrivare a consolidare una metodologia
che consenta, partendo dalla seguente
conoscenza:
– strutture dati concettuali della P.A. Centrale
– strutture dati logiche (Supertipi) della P.A.
Piemontese
– strutture dati fisiche (Basi Dati) della P.A.
Piemontese
• di ottenere, tramite una metodologia, il modello
concettuale “approssimato” di una qualsiasi base
dati censita per la P.A. Piemontese
15
17. Facendo cio’ con basso utilizzo di risorse
• Assumendo di procedere con una metodologia
tradiizonale di reverse engineering sui 450
schemi PACP, e assumendo due settimane
persona a schema, si ha
• Risorse con procedura tradizionale = 0,5 mesi
persona * 450 = 20 anni persona
• Dobbiamo inventarci una metodologia
approssimata che ci permetta di ridurre l’uso
delle risorse di un ordine di grandezza
17
19. • 5. L’ attivita’ di ricostruzione del
contenuto concettuale della PA
Piemontese
–
–
–
–
5.0 Scopo della attivita’
5.1 La conoscenza disponibile
5.2 La metodologia adottata
5.3 Una metodologia arricchita
19
20. • 5. L’ attivita’ di ricostruzione del contenuto concettuale della
PA Piemontese
• 5.0 Scopo della attivita’
• 5.1 La conoscenza disponibile
– 1. Introduzione
– 2. Gli schemi di base della Pa centrale
– 3. Il repository di schemi
– 4. Le gerarchie di concetti
– 5. Infodir: schemi logico fisici della PA locale Piemontese
– 6. Come utilizzare la conoscenza per l’attivita’ di
ricostruzione
• 5.2 La metodologia adottata
– 1. La metodologia in breve
– 2. La metodologia in dettaglio: i 5 passi
– 3. Attivita’ di verifica e sperimentazione
– 4. Sviluppi futuri
• 5.3 Una metodologia arricchita
20
21. Dal Repository Logico Fisico al Repository concettuale
(grazie a Gabriella Munari per la slide)
CONCETTUALE
Gerarchie di
Generalizzazione
SUPERTIPI
DI ATTRIBUTO
LOGICO-FISICO
21
23. Contenuti della sezione 5.1
• 5.1 La conoscenza disponibile
–
–
–
–
–
1. Introduzione
2. Gli schemi di base della Pa centrale
3. Il repository di schemi
4. Le gerarchie di concetti
5. Infodir: schemi logico fisici della PA locale
Piemontese
23
24. 1. Introduzione
• Nel 1993 – 1995 l’Aipa condusse una attivita’ di
acquisizione di schemi concettuali, inizialmente
presso le Pubbliche amministrazioni Centrali e
poi presso Inps e Inail.
• Cio’ porto’ alla costruzione di circa 500 schemi
concettuali e due Repository, della PAC e di Inps
+ Inail, successivamente parzialmente integrati
in un unico repository, che d’ora in poi
chiameremo Repository PAC.
24
25. 1. Introduzione
• Repository PAC
– Circa 500 schemi concettuali PACentrale, con
• Circa 5.000 entita’
• Circa 10.000 attributi
– Circa 50 schemi astratti della PAC, organizzati
secondo le operazioni di integrazione astrazione
– Gerarchie di concetti •
•
•
•
Bene (17 entita’ costituenti la gerarchia completa)
Documento (5 entita’ costituenti la gerarchia completa)
Luogo (8 entita’)
Soggetto (Fisico e Giuridico) (24 entita’)
25
26. Input al problema, con dimensionamento
• Documentazione CSI Infodir (catalogo metadati)
–
–
–
–
–
–
–
–
12 Unita’ Organizzative di primo livello
60 Unita’ Organizzative di secondo livello
76 Unita’ Organizzative di ennesimo livello
393 Collezioni di metadati (storico = 956)
446 Basi Dati (storico = 1085)
244 Servizi (storico = 594)
17627 Tavole (storico = 42881)
185690 Attributi (storico = 451728)
26
28. Ambienti di gestione: oggi
• Repository PAC (Access)
• Schemi astratti PAC (Jpeg)
• Repository PAC organizzato per piramide di
schemi (Coolbiz)
• Repository PAC organizzato per materie
(Coolbiz)
• Enterprise data model PA centrale (ErWin)
• Catalogo metadati (Infodir)
• Metadati dei dimensionamenti basi dati CSI
(Excel)
28
29. Ambienti di gestione: in futuro
• Schemi PAC Piemonte (Ambiente da
definire)
• Catalogo metadati (Nuovo Infodir)
29
31. Schemi di base
• Per ognuno dei circa 500 schemi, e’ disponibile
una descrizione in termini di
–
–
–
–
Entita’
Generalizzazioni
Relazioni
Attributi
• Per molti e’ anche disponibile una descrizione
diagrammatica
31
32. Esempio di schema concettuale:
ex motorizzazione civile
OMOLOGAZIONE
CASA
COSTRUTTRICE
ottiene
mctc 650.000
rispetta
relativo a
ALLESTITORE
COLLAUDO
ottiene
VEICOLO
sottoposto a
LICENZA
per
per
VEICOLO
IMMATRICOLATO
per
possiede
mctc-55.000.000
CARTA
DI
CIRCOLAZIONE
ottiene
ottiene
PERSONA
AUTORIZZAZIONE
ottiene
mctc - 400.000
PERSONA
FISICA
PERSONA
GIURIDICA
AUTOTRASPORTATORE
INTERNAZIONALE
FOGLIO ROSA
richiede/ per
sostenere
PERSONA FISICA
ABILITATA ALLA
GUIDA
possiede
ESAME
richiede
PERSONA
ISCRITTA AD
ALBO CONTO
TERZI
PERSONA
ISCRITTA AD
ELENCO CONTO
PROPRIO
presenta
riferimento a
PERSONA ISCRITTA
AD ALBO CONTO
TERZI
INTERNAZIONALE
per
PATENTE
EMESSA
PERSONA ISCRITTA
AD ELENCO CONTO
PROPRIO
INTERNAZIONALE
rilasciata da
AUTOTRASPORTATORE
INTERNAZIONALE
ITALIA-AUSTRIA
CAP/ADR
ottiene
PATENTE
RILASCIATA
presenta
riferimento a
TRANSITO
ottiene da
ottiene
ECOPUNTI
PREFETTURA
schema concettuale base di dati veicoli -MCTC
32
34. Esempio di metadati descrittivi delle basi di dati del Repository
Amministraz.
Materia
Nome espteso
Dimensione
INAIL
Infortuni
archivio documentale delle immagini
INAIL
Infortuni
postumi
MF
Territorio/Fisco
Catasto urbano
457,0
MF
Territorio/Fisco
Catasto terreni
225,0
INAIL
Infortuni
datori di lavoro
223,0
EIMA
Territorio
Premi da normativa dell'UE
200,0
MF
Fisco
Imposte dirette
195,0
MF
Fisco
Registro
154,0
INAIL
Infortuni
prestazioni
151,0
MF
Territorio/Fisco
Catasto geometrico
118,0
MPI
Personale P.A.
Pubblica Istruzione
108,0
MF
Fisco
Anagrafe tributaria
85,0
INPS
PensionatieAssistiti
Pensioni
85,0
MF
Fisco
Ipoteche
68,0
MTN_DGMCTC
BeniMobili/Veicoli
Veicoli
60,0
INPS
PensionatieAssistiti
Posizioni anagrafiche e assicurative
60,0
INPS
PensionatieAssistiti
Denunce contributive e previdenziali
aziendali
50,0
MGG
Indagini
Casellario giudiziale centrale
45,1
552000,0
12000,0
34
35. Basi di dati di Ministero
Base di dati
di CED
Metodologia
adottata per le
attività di
integrazione e
astrazione
Base di dati
di CED
Basi di dati di Ministero
Base di dati
di CED
Base di dati
di CED
Base di dati
di CED
Base di dati
di CED
Base di dati
di CED
Base di dati
di CED
1. Reverse engineering
Schema
dei dati
Schema
dei dati
Schema
dei dati
Schema
dei dati
Schema
dei dati
Schema
dei dati
Schema
dei dati
Schema
dei dati
2. Classificazione degli schemi in famiglie
PROTOCOLLO
ORGANI
COLLEGIALI
FISCO
LAVORO
AZIENDE
TRASPORTI
3. Integrazione astrazione delle famiglie in schemi rappresentativi
Schema
PROTOCOLLO
Schema
ORGANI
COLLEGIALI
Schema
FISCO
Schema
LAVORO
Schema
AZIENDE
Schema
TRASPORTI
4. Iterazione dei passi 2 e 3 fino a produrre uno schema finale astratto
Repository degli schemi
35
38. Repository – struttura completa
SCHEMA INTEGRATO DELLE BASI DI DATI DELLA PA DI 1° LIVELLO
SCHEMA INTEGRATO DELLE BASI DI DATI DELLA PA DI 2° LIVELLO
SCHEMA INTEGRATO DELLE BASI DI DATI DELLA PA DI 3° LIVELLO
RISORSE
SERVIZI
SERVIZI SOCIALI ED ECONOMICI
SERVIZI DIRETTI
TRASPORTI
TRASPORTI
COMUNICAZIONI
10/178
AZIENDE INDUSTRALI
PRODUZIONE
AZIENDE AGRICOLE
BENI CULTURALI
LAVORO
3/53
9/112
38
CULTURA
10/100
AMBIENTE
8/213
EDILIZIA
AMBIENTE
ISTRUZIONE
ISTRUZIONE
3/134
SERVIZIO SANITARIO
5/56
ASSISTENZA
SANITA'
6/155
6/130
SICUREZZA INTERNA
SICUREZZA
CRIMINALITA'
GIUSTIZIA
6/76
DIFESA
10/76ATTIVITA' GIURIDICA
AFFARI
ESTERI
4/36 RELAZIONI ESTERE IN ITALIA
6/53 RELAZIONI ITALIANE ALL' ESTERO
PREVIDENZA
ASSICURAZIONE SOCIALE
9/118
3/66
RAPPRESENTANZE
CATASTO
CERTIFICA-
STATISTICA
3/75
FORMAZIONE
DIPENDENTI
RISORSE
UMANE
37/336
BENI IMMOBILI
STRUMENTI
AUTOMEZZI
RISORSE
STRUMENTALI E
IMMOBILIARI
2/89
3/59
2/65
RISORSE
FINANZIARIE
6/69 DOGANE
3/182 CAPITOLI DI SPESA
TRASFERIMENTO FONDI
3/30 A ENTI LOCALI PER ENTI PUIBBLICI
2/12 ORGANI COLLEGIALI
8/293
FISCO
2/93
PROTOCOLLO
RISORSE DI
SUPPORTO
SERVIZI ECONOMICI
LAVORO
SERVIZI SOCIALI
9/118
SERVIZI GENERALI
39. Il Repository della PAC - dettaglio
SCH EM A INT EG RAT O D EL LE BASI D I DA TI D EL LA PA D I 1 ° L IVEL LO
SCH EM A INT EG RAT O D EL LE BASI D I DA TI D EL LA PA D I 2 ° L IVEL LO
SCH EM A INT EG RAT O D EL LE BASI D I DA TI D EL LA PA D I 3 ° L IVEL LO
RISOR SE
SE RVIZI
SE RVIZI SO CIAL I ED ECO NO M ICI
SE RVIZI D IRET T I
39
T RASP ORT I
TRA SP O RTI
CO MU NI CAZI ON I
10/178
AZ IE NDE INDU ST RAL I
P RO DUZI O NE
AZ IE NDE AGRIC O LE
L AV OR O
3/53
9/112
BE NI CU L TU RAL I
AM BIEN TE
8/213
CU LTURA
10/100
IST RUZ ION E
EDI LIZIA
ISTRU ZIO NE AM BIENTE
3/134
6/155
AS SIS TE NZ A
SE RVIZ IO SA NIT ARIO
S AN ITA'
5/56
SICU REZ Z A INT ERN A
S ICU REZZA
6/130
CRIMIN AL ITA '
G IUS TIZ IA
6/76
D IF ESA
10/76 AT T IVIT A' GIURID ICA
AF F ARI
ES TERI
4/36 RE LA ZIO NI ES TE RE IN IT AL IA
6/53 R E LA ZIO NI ITA LIA NE A LL ' ES TE RO
PRE VID EN ZA
9/118
CA TA S TO
CE R TI FI C AZI O NI
4/121
3/66
EN TI TE RR I TOR IA LI
S ERVIZI
CERTI F ICA - AS S IC URA ZIO S OCI ALI E
N E SO CI ALE
TERRITOR IA LI Z ION E
RA P P RES EN TA NZE
S TATIST I CA
3/75
6/95
F OR MA ZI O NE
D IP E N D E NT I
RISO RS E
UM AN E
37/336
BE N I I MM O BI LI
S TRU ME NTI
A UTO M EZZI
RI SO RS E
S TRUM ENTALI E
I MMO BI LIA RI
2/89
3/59
2/65
3/182 CA P I T OLI D I S P ES A
F
F
I
3/30 T RANSTIERI M ENTOEROENDTI P U IB BLI CI
AE
LO CA LI P
N
F I SC O
D OG A NE
RI SO RS E
F IN AN ZIA RIE
6/69
O RG AN I CO LLE G I AL I
8/293
2/12
2/93
P RO TO CO L LO
R ISO RSE DI
SU PPO RT O
SE RVIZI ECO NO M ICI
L AVO RO
SE RVIZI SO CIAL I
9/118
SE RVIZI G EN ERA LI
40. Lo schema piu’ astratto
Unità
organizzativa
Bene
Soggetto
Riferimento
territoriale
Documento
40
43. Convenzione per identificare gli schemi
SCH EM A INT EG RAT O D EL LE BASI D I DA TI D EL LA PA D I 1 ° L IVEL LO
Livello 2, Progressivo a
SCH EM A INT EG RAT O D EL LE BASI D I DA TI D EL LA PA D I 2 ° L IVEL LO
SCH EM A INT EG RAT O D EL LE BASI D I DA TI D EL LA PA D I 3 ° L IVEL LO
RISOR SE
SE RVIZI
SE RVIZI SO CIAL I ED ECO NO M ICI
SE RVIZI D IRET T I
43
T RASP ORT I
TRA SP O RTI
CO MU NI CAZI ON I
10/178
AZ IE NDE INDU ST RAL I
P RO DUZI O NE
AZ IE NDE AGRIC O LE
L AV OR O
3/53
9/112
BE NI CU L TU RAL I
AM BIEN TE
8/213
CU LTURA
10/100
IST RUZ ION E
EDI LIZIA
ISTRU ZIO NE AM BIENTE
3/134
6/155
AS SIS TE NZ A
SE RVIZ IO SA NIT ARIO
S AN ITA'
5/56
SICU REZ Z A INT ERN A
S ICU REZZA
6/130
CRIMIN AL ITA '
G IUS TIZ IA
6/76
D IF ESA
10/76 AT T IVIT A' GIURID ICA
AF F ARI
ES TERI
4/36 RE LA ZIO NI ES TE RE IN IT AL IA
6/53 R E LA ZIO NI ITA LIA NE A LL ' ES TE RO
PRE VID EN ZA
9/118
CA TA S TO
CE R TI FI C AZI O NI
4/121
3/66
EN TI TE RR I TOR IA LI
S ERVIZI
CERTI F ICA - AS S IC URA ZIO S OCI ALI E
N E SO CI ALE
TERRITOR IA LI Z ION E
RA P P RES EN TA NZE
S TATIST I CA
3/75
6/95
F OR MA ZI O NE
D IP E N D E NT I
RISO RS E
UM AN E
37/336
BE N I I MM O BI LI
S TRU ME NTI
A UTO M EZZI
RI SO RS E
S TRUM ENTALI E
I MMO BI LIA RI
2/89
3/59
2/65
3/182 CA P I T OLI D I S P ES A
F
F
I
3/30 T RANSTIERI M ENTOEROENDTI P U IB BLI CI
AE
LO CA LI P
N
F I SC O
D OG A NE
RI SO RS E
F IN AN ZIA RIE
6/69
O RG AN I CO LLE G I AL I
8/293
2/12
2/93
P RO TO CO L LO
R ISO RSE DI
SU PPO RT O
SE RVIZI ECO NO M ICI
L AVO RO
SE RVIZI SO CIAL I
9/118
SE RVIZI G EN ERA LI
44. Schema base: documenti sottocomponente 2a5a6b1
16 S PE DIT O A
07
COR R IS PONDE NT E
.
..
.
12 R E PAR TO
.
15
COMPE TE NT E DI
.
.
.
.
.
APPAR T IE NE
22 F A PAR T E DI
.
.
.
&D01
DOC UME NT O
PR OT OCOLLATO
.
.
.
.
..
.
..
17 S PE DIT O DA
..
24 E ' LE G ATO A
.
.
.
.
.
19
COMPE TE NT E DI
08 S CADE NZA
.
14 R IFE R IT O A
&S 06 contribuente
.
.
..
&3 UT E NTE
50257 sezione
11 compos to da
.
.
10 UFFIC IO
PE R IFE R ICO
R IFE R IT O A
.
.
..
12 E ' DI
..
. .
..
&D01 T IPO
DOC UME NTO
22 R IFE R IT O A
.
.
20 G E S T OR E DI
..
21 DI
COMPE T E NZA
R E LAT IVA DI
.
.
.
.
.
.
50240 fas cicolo
.
.
.
.
44
23
INTE R E S S AT O
DA
54. • 4. Le gerarchie di generalizzazione (ontologie) di
concetti
54
55. Le gerachie come rappresentazione sintetica del repository
• 500 schemi con circa 5000 concetti, anche se
rappresentati in un repository, sono una
conoscenza troppo ricca per poter essere
elaborata in modo efficiente.
• Siamo alla ricerca di una rappresentazione
sintetica dei 500 schemi che conservi la
conoscenza piu’ importante.
• Abbiamo scelto di utilizzare come
rappresentazione sintetica le gerarchie di
generalizzazione nel repository dei concetti che
compaiono nello schema astratto
55
56. Lo schema piu’ astratto
Unità
organizzativa
Bene
Soggetto
Riferimento
territoriale
Documento
56
60. Le 4 gerarchie
• Cio’ ha portato alla generazione di 4 gerarchie
relative ai concetti:
• Soggetto
• Bene
• Luogo
• Documento
60
61. Gerarchia relativa alla categoria soggetto
SO G GETTO
S O G G E T T O F IS IC O
LAVO RATORE
D IP E N D E N T E P U B B L IC O
D IS O C C U P A T O
IM P R E N D IT O R E
P E N S IO N A T O
STU DEN TE
AUTONOMO
S O G G E T T O G I U R ID I C O
IM P R E SA
I S T I T U Z I O N E D E L L A P .A .
IS T I T U Z IO N E S O C IA L E P R IV A T A
61
62. I principali oggetti delle 4 ontologie: SOGGETTO
–soggetto fisico
•lavoratore
–lavoratore autonomo
–imprenditore
–dipendente pubblico
•disoccupato
•pensionato
•studente
–soggetto giuridico
•impresa
•istituzione p.a.
•Istituzione sociale privata
62
63. La gerarchia relativa a Bene
BENE
BENE PUBBLICO
BENE
DEMANIALE
DEMANIO
NECESSARIO
134.800
BENE PRIVATO
BENE
PATRIMONIALE
29.000
DEMANIO
ACCIDENTALE
BENE PATRIMONIALE
DISPONIBILE
BENE PATRIMONIALE
INDISPONIBILE
BENE IMMOBILE
TERRENO
FABBRICATO
BENE MOBILE
BENE IMMOBILE
REGISTRATO
ABITAZIONE
DEMANIO NECESSARIO
IDRICO
108.000
DEMANIO
STRADALE
AUTOMOBILE
DEMANIO NECESSARIO
MILITARE
1.800
DEMANIO
FERROVIARIO
AUTOVEICOLO
DEMANIO NECESSARIO
MARITTIMO
25.000
DEMANIO
AERONAUTICO
300
IMBARCAZIONE
ACQUEDOTTI
DEMANIO ARTISTICO
STORICO CULTURALE
2.400
RACCOLTE MUSEI
PINACOTECHE BIBLIOTECHE
CIMITERO
MERCATO COMUNALE
63
BENE MOBILE
NON REGISTRATO
64. La gerarchia relativa a Bene
–Bene pubblico
•Bene demaniale
–demanio necessario
–demanio accidentale
•Bene patrimoniale
–disponibile
–indisponibile
–Bene privato
•immobile
–terreno
–fabbricato
–abitazione
•mobile
–registrato
–non registrato
64
66. Bene privato
BENE PRIVATO
BENE IMMOBILE
TERRENO
FABBRICATO
BENE MOBILE
ABITAZIONE
BENE IMMOBILE
REGISTRATO
BENE MOBILE
NON REGISTRATO
AUTOMOBILE
AUTOVEICOLO
IMBARCAZIONE
66
67. La gerarchia relativa a Luogo
–
–
–
–
–
–
–
–
localita’
particella catastale
porzione
primitiva grafica
riferimento catastale
sede scolastica statale
superficie agricola
unita’ immobiliare urbana (U.I.U.)
67
68. La gerarchia relativa a Documento
• versamento
– spontaneo
– con delega
– diretto
•
•
•
•
rata di pensione emessa
negozio
documento liquidato
atto registro
68
85. Problema
•
•
•
•
Partendo dai
500 schemi concettuali della Pa centrale +
Il repository di schemi
Le 4 gerarchie
• I 450 schemi logici della Pa piemontese
• Costruire con basso uso di risorse
• I 450 schemi concettuali della Pa piemontese e
• Il corrispondente repository
85
88. Terza ipotesi: partire dal Repository
Pubblica
Amministrazione
locale
Pubblica Amministrazione centrale
Rappresentazione
concettuale
Rappresentazione
logico fisica
88
89. Quarta ipotesi:
partire dalle gerarchie di generalizzazione
Pubblica
Amministrazione
locale
Pubblica Amministrazione centrale
Rappresentazione
concettuale
Rappresentazione
logico fisica
89
90. Dal Repository Logico Fisico al Repository concettuale
CONCETTUALE
Gerarchie di
Generalizzazione
SUPERTIPI
DI ATTRIBUTO
LOGICO-FISICO
90
92. 5.2 La metodologia adottata - contenuti
• 1. La metodologia in sintesi
• 2. La metodologia in dettaglio
• 3. Le sperimentazioni effettuate
– 3.1 Sperimentazioni della metodologia su schemi PA
Piemonte
– 3.2 Sperimentazione di passi alternativi
• 4. Carichi di lavoro
• 5. La concettualizzazione dei flussi
• 6. Elaborazioni sulla conoscenza generata
92
94. Sintesi - 1
• Scopo della metodologia: semplificare il
compito del referente dati, utulizzando il
piu’ possibile strumenti automatici, a costo
di una certa approssimazione nelle scelte.
• Assunzione: ad un certo livello di
astrazione gli schemi della PAL Piemontese
sono “simili” a quelli della PA Centrale. Si
differenziano nei livelli di astrazione piu’
bassi.
94
95. Sintesi - 2
• Input al processo di generazione di uno
schema concettuale di base dati:
– Lo schema logico della base dati
– Le gerarchie di concetti
– I 500 schemi base del Repositry PAC
• Output: lo schema concettuale
95
96. Sintesi – 3
• Strategia per il referente dati:
• 1. Crea un primo schema in modo automatico,
utilizzando la conoscenza disponibile (Gerarchie
di concetti) per guidare la costruzione dello
schema concettuale secondo criteri di priorita’,
generando:
– A. le Entita’, i concetti piu’ importanti
– B. le Generalizzazioni tra entita’, poi le
Relazioni, poi gli Attributi
• 2. Successivamente completa manualmente lo
schema con la conoscenza di dominio a te nota.
96
97. I due passi della metodologia
Passo
automatico
Schema
scheletro
Passo
manuale
Referente dati
competente
sul dominio
97
Schema
finale
98. Dettaglio per le entita’ e relazioni
• Le entita’ vengono selezionate a partire dalle
gerarchie (Assunzione) sulla base di criteri di
similitudine con i concetti rappresentati nelle
tavole (attributi)
• Le relazioni vengono selezionate dal Repository
PAC (Assunzione), quando collegano una
qualunque coppia di entita’ selezionate nel passo
precedente.
98
99. Introduzione di un ulteriore passo automatico
• Passo 1 – Applica la metodologia per ottenere uno
schema approssimato
• Passo 2 – Arricchisci lo schema con le relazioni
ottenute dai constraints
• Passo 3 – Rivedi lo schema, partendo dalla
conoscenza di dominio, aggiungendo i concetti
(eventualmente) mancanti e ristrutturando
(eventualmente) quelli presenti, ottendendo uno
schema completo
99
101. Passi della metodologia - 1
•
•
•
•
•
•
Generazione Entita’
Generazione Generalizzazioni
Generazione Relazioni
Generazione Attributi delle entita’
Generazioni Relazioni aggiuntive utilizzando I
constraints fisici
Verifica con il Referente dati
101
102. • Passo 1. generazione Entita’
• Dettaglio ed Esempio
102
103. 1. Generazione Entita’
• Input: le quattro gerarchie dei concetti + le
circa 18.000 tabelle delle circa 450 basi di dati
• Per ogni base di dati PACP,
– Per ogni entita’ nelle gerarchie,
– Misura la distanza tra l’ entita’ e gli attributi e tabelle
nella Base dati, tramite la distanza tra il nome della
entita’ e i nomi e definizioni di attributi e tabelle
– Scegli le entita’ E1, E2, …, En la cui distanza e’ minore
di una data soglia.
• Output: schema scheletro della base dati,
costituito dalle sole entita’.
103
104. Funzione di distanza scelta attualmente
• In questo momento (1/2005) la funzione di
distanza e’ l’identita’.
• Percio’, se viene trovato almeno un attributo con
nome o descrizione in cui compare esattamente il
nome della entita’, l’entita’ viene scelta,
altrimenti viene scartata.
104
115. Passo di generazione generalizzazioni
• Input:
le entita' E1, E2, ..., En trovate nel passo precedente
• Le 4 gerarchie dei concetti
•
Output:
lo schema arricchito con le generalizzazioni definite tra
le entita’
•
Algoritmo:
Per ogni generalizzazione definita sulle entita'
E1, E2, ..., En nelle gerarchie, aggiungila allo schema.
115
118. Passo di selezione relazioni
Input:
le entita' selezionate ai passi precedenti
Gli schemi base del Repository PAC
Output: lo schema arricchito con le relazioni tra
le entita‘
• Algoritmo
• Per ogni coppia di entita’ Ei e Ej tra E1, E2, …,
En, cerca negli schemi base se ve ne e’ almeno
uno su cui sia definita una relazione diretta tra
Ei ed Ej: se c’e’ selezionane una qualunque tra
quelle trovate, e inseriscila nello schema,
altrimenti non inserirla
•
•
•
•
118
124. Passo alternativo per la generazione dei nomi delle relazioni
• Per ciascuna delle relazioni trovate tra le entita’
Ei ed Ej, riportare la frequenza di presenza nei
500 schemi (cioe’ quante volte e’ stata trovata)
• Associare alla relazione il nome della relazione
piu’ frequente
124
126. Terza possibilita’: coinvolgimento del referente
• In alternativa chiedere all’esperto di dominio di
scegliere (attivita’ a basso costo, ma molto
efficace). In quest’ ultimo caso, il sistema
automatico trova la relazione, l’essere umano
sceglie il nome (il significato)
126
127. Scelta del nome da parte del referente dati
Il nome e’:
Lavora in
E2
E1
E3
127
129. Passo di generazione attributi
Input:
le entita' selezionate nel passo 1
le tavole a cui appartengono gli attributi selezionati nel
passo 1, e i corrispondenti attributi
Output: per ciascuna entita' i suoi attributi
Algoritmo:
Importare in ciascuna entita' gli attributi delle tavole
corrispondenti
129
132. • Passo 5 Generazione relazioni dai constraint
fisici
132
133. Passo di generazione relazioni
partendo dai constraints fisici
• Input:
le tavole selezionate al punto 1 di generazione entita'
Output:
• le tavole selezionate unite dagli eventuali constraints,
piu' eventuali tavole intermedie per costituire il cammino
dei constraints
Algoritmo:
- con un tool (ad esemio erwin) si effettuano sulla base
dati operazioni di "infer relationship" considerando:
- chiavi primarie e chiavi esterne esistenti
- indici univoci
- somiglianza di nomi campi
- si derivano i constraints (relazioni fisiche) e si
aggiungono allo schema le corrispondenti relazioni nel
modello ER
133
134. Aggiunta delle relazioni da constraint fisici
E3
E2
E1
E2
..
E1
E3
Attributi e
Tabelle
K3
…..
K2
134
135. • Passo 6 Verifica manuale del referente dati
135
136. Verifica con il referente dati
• Input:
lo schema prodotto nei passi precedenti
le indicazioni del referente dati, in generale di 2 tipi:
- non trovo rappresentata la Tavola Ti/ Entita’ Ei
• - non dovrebbe essere rappresentata la entita’ Ej
Output:
• Lo schema dati con i concetti/Entita’ in piu' e/o in meno
verificati col referente dati
Algoritmo:
- per ogni entita' selezionata impropriamente, la rimuovo
(il criterio di somiglianza e’ approssimato)
- per ogni entita' mancante, la aggiungo, corredandola di
attributi e relazioni
136
141. • Scelta di una base dati verificata con la
referente
• la base dati scelta e’ MONI = MonItoraggio
imprese (Attivita’ Produttive) --> sistema
informativo dei contributi alle imprese
141
143. Tavole db MonI
MONI D FORMA
GIURIDICA
MONI D MOTIVO
RESPINTA
MONI D ERRORI
DATI
MONI D
PROVINCIE
MONI D STATI
ESTERI
MONI D MODULO
LOCALE
MONI D ATECO
MONI D COMUNI
ITALIANI
MONI D STATO
DATO
MONI D TIPO
ENTE
MONI T
ACQUISIZIONE
DATI
MONI D TIPO
FONTE
MONI D TIPO
INIZIATIVA
MONI D TIPO
REVOCA
MONI D TIPO
AGEVOLAZIONE
MONI D STATO
PROGETTO
MONI T
ATTUAZIONE
NORMATIVA
MONI T
CONTRIBUTO
CONCESSO
MONI T
CONTRIBUTO
LIQUIDATO
MONI T
CONTRIBUTO
REVOCATO
moni t beneficiario
moni t ente
MONI T GENERA
INVIO FILE
MONI T UTENTE
MONI T
VERSIONE DB
moni t
rendicontazione
moni t progetto
agevolazione
MONI T NORMA
AGEVOLAZIONE
MONI D TIPO
SPESA
MONI T FONTE
MONI T SPESA
PROGETTO
143
150. Tavole dopo la verifica con il referente dati
moni t progetto
agevolazione
MONI T
C ONT R IBUT O
LIQUIDAT O
MONI T
C ONT R IBUT O
C ONC E S S O
moni t beneficiario
moni t
rendicontazione
MONI T
C ONT R IBUT O
R E VOC AT O
MONI T UT E NT E
MONI T S PE S A
PR OG E T T O
moni t ente
MONI T G E NE R A
INVIO FILE
MONI T
AT T UAZIONE
NOR MAT IVA
MONI T NOR MA
AG E VOLAZIONE
MONI T F ONT E
150
152. Tavole db MonI che ricadono nelle gerarchie
moni t ente
S 01-S OGGE T TO
MONI T
BE NE FICIAR IO....
MONI T
BE NE FIC IAR IO...
S 02--S OG G E T T Ofis icoPE R S ONAfisic
S 17---IT ALIANO
S 40--s oggE TT O
giurIDIC O
MONI T
BE NE F IC IAR IO..
MONI T
BE NE FIC IAR IO.
S 41---impres A
D01-D0CUME NT O
moni t beneficiario
moni t progetto
agevolazione
D02--ATT O
R E GIS T R O
moni t
rendicontazione
152
153. Tavole db MonI che ricadono nella gerarchia Soggetto
moni t ente
S 01-S OGGE T T O
MONI T
BE NE FIC IAR IO....
MONI T
BE NE FIC IAR IO...
S 02--S OGGE T T Ofis icoPE R S ONAfis ic
S 17---IT ALIANO
S 40--s oggE TT O
giurIDIC O
MONI T
BE NE FIC IAR IO..
MONI T
BE NE FIC IAR IO.
S 41---impres A
moni t beneficiario
moni t progetto
agevolazione
153
154. Tavole db MonI che ricadono nella gerarchia Documento
D01-D0C UME NT O
D02--AT T O
R E GIS T R O
MONI T
R E NDIC ONT AZIONE
.
.
154
155. Generalizzazioni individuate
S 01-MONI T
E NT E
S 40--MONI T
BE NE FIC IAR IO
D01-D0C UME NT O
S 41---MONI T
PR OG E T T O
AGE VOLAZIO
D02--MONI T
R E NDIC ONT AZIONE
155
158. Relazioni tra entita’ in MonI
moni t ente
S 01-S OGGE T TO
MONI T
BE NE FICIAR IO....
MONI T
BE NE FIC IAR IO...
S 02--S OG G E T T Ofis icoPE R S ONAfisic
S 17---IT ALIANO
&&S D
DOC UME NT O
S OG GE TT O
S 40--s oggE TT O
giurIDIC O
MONI T
BE NE F IC IAR IO..
MONI T
BE NE FIC IAR IO.
S 41---impres A
D01-D0CUME NT O
moni t beneficiario
moni t progetto
agevolazione
D02--ATT O
R E GIS T R O
moni t
rendicontazione
158
167. Relazioni dai constraints per MonI
MONI T
ATT UAZIONE
NOR MAT IVA
moni t progetto
agevolazione
moni t
rendicontazione
moni t ente
MONI T
C ONT R IBUT O
C ONC E S S O
moni t beneficiario
MONI T GE NE R A
INVIO FILE
167
168. Tavole dopo la verifica con referente dati MonI
moni t progetto
agevolazione
MONI T
C ONT R IBUT O
LIQUIDAT O
MONI T
C ONT R IBUTO
C ONCE S S O
moni t beneficiario
moni t
rendicontazione
MONI T
C ONT R IBUT O
R E VOC AT O
MONI T UT E NT E
MONI T S PE S A
PR OG E T T O
moni t ente
MONI T GE NE R A
INVIO FILE
MONI T
AT T UAZIONE
NOR MATIVA
MONI T NOR MA
AG E VOLAZIONE
MONI T FONTE
168
169. Nota
• Le tavole segnalate dal referente dati di MonI
come tavole importanti a seguito della
generazione entita’, vengono “gratuitamente”
estrapolate dall’algoritmo di derivazione
relazioni dai constraints.
• Questo conferma la validita’ e l’importanza del
passo alternativo
169
170. Modello concettuale Moni
• E’ l’unione dei 2 schemi che seguono, ovvero:
– Lo schema ottenuto attingendo dagli schemi
concettuali
– Lo schema ottenuto con il passo di derivazione
constraints
170
171. Relazioni tra entita’ concettuali MonI
moni t ente
S 01-S OGGE T TO
MONI T
BE NE FICIAR IO....
MONI T
BE NE FIC IAR IO...
S 02--S OG G E T T Ofis icoPE R S ONAfisic
S 17---IT ALIANO
&&S D
DOC UME NT O
S OG GE TT O
S 40--s oggE TT O
giurIDIC O
MONI T
BE NE F IC IAR IO..
MONI T
BE NE FIC IAR IO.
S 41---impres A
D01-D0CUME NT O
moni t beneficiario
moni t progetto
agevolazione
D02--ATT O
R E GIS T R O
moni t
rendicontazione
171
172. Tavole dopo la verifica con referente dati MonI
moni t progetto
agevolazione
MONI T
C ONT R IBUT O
LIQUIDAT O
MONI T
C ONT R IBUTO
C ONCE S S O
moni t beneficiario
moni t
rendicontazione
MONI T
C ONT R IBUT O
R E VOC AT O
MONI T UT E NT E
MONI T S PE S A
PR OG E T T O
moni t ente
MONI T GE NE R A
INVIO FILE
MONI T
AT T UAZIONE
NOR MATIVA
MONI T NOR MA
AG E VOLAZIONE
MONI T FONTE
172
173. Cammino completo tra le tavole individuate MonI
MONI D COMUNI
IT ALIANI
MONI D S T AT O
DAT O
MONI T
C ONT R IBUT O
CONC E S S O
MONI T
ACQUIS IZIONE
DAT I
MONI D S T AT I
ES TE RI
MONI D S T AT O
P R OGE T T O
MONI D
PR OVINCIE
MONI D T IPO
AGE VOLAZIONE
MONI D FOR MA
GIUR IDICA
MONI D MOT IVO
R E S PINT A
moni t beneficiario
MONI D T IPO
R E VOCA
moni t progetto
agevolazione
MONI T
CONT R IBUT O
LIQUIDAT O
moni t
rendicontazione
MONI T UT E NT E
MONI D T IPO
E NT E
MONI T
CONT R IBUT O
R E VOC AT O
moni t ente
MONI T S P E S A
P R OGE T T O
MONI D T IPO
S PE S A
MONI T NOR MA
AGE VOLAZIONE
MONI T GE NE R A
INVIO FILE
MONI D T IPO
FONT E
MONI T
AT T UAZIONE
NOR MAT IVA
MONI D T IPO
INIZIAT IVA
MONI T FONT E
MONI D AT E C O
173
174. Verifica euristica MonI
S 01-MONI T
E NT E
S 40--MONI T
BE NE FIC IAR IO
D01-D0C UME NT O
S 41---MONI T
PR OG E T T O
AGE VOLAZIO
D02--MONI T
R E NDIC ONT AZIONE
.
.
174
176. Carichi di lavoro
•
•
•
•
•
•
MonI = 32 tavole = 2 giorni
SMRGAA = 42 tavole = 2,625 giorni (3 giorni)
16 tavole = 1 giorno
17627 tavole = 446 basidati = 1100 giorni
#medio di tavole per basedati = 40
tempo medio di concettualizzazione di una base
dati = 2,5 giorni
• A regime 1 giorno
176