SlideShare a Scribd company logo
1 of 42
Klaus Kempf
Data curation oppure quanto
durevoli sono i nostri sforzi per
una biblioteca digitale’?
Milano, 15-16 marzo 2018Klaus Kempf
Aspetti fondamentali della „biblioteca digitale“
• Visione d‘insieme dell‘argomento ipercomplesso
• Conta il punto di vista d‘utente, non quello all‘interno
della biblioteca/quello tecnologico (obiettivo maggiore:
riuso dei contenuti)
• Cooperazione tra vari partner (parola chiave:
standardizzazione in ogni campo d‘attività)
• Cura dei relativi dati nel senso vasto del termine ed in
modo permanente
2Milano, 15-16 marzo 2018
Milano, 15-16 marzo 2018 3
Milano, 15-16 marzo 2018
Bayerische Staatsbibliothek a uno sguardo…
Photos: BSB/H.-R. Schulz
4
• Dal 1997 >500
progetti di
digitalizzazione
terminati
• > 2.3 milioni
volumi
digitalizzati
• >1,800,000,000
data files
• = 980 terabyte
• > 200 offerte
digitali
disponibili
sull’internet
Milano, 15-16 marzo 2018
Digitalizzazione alla Bayerische Staatsbibliothek
(situazione fine febbraio 2018)
5
Produzione digitale e
archivazione a lungo
termine
Milano, 15-16 marzo 2018 6
(Ri)Uso: numero di PDF-downloads
Milano, 15-16 marzo 2018 7
Il nostro servizio digitale, basato sul posseduto delle
nostre collezioni, si può definire come:
• un successo eclatante
• ma deve continuamente fare i conti con la gestione di
risorse umane estremamente limitate
• e con costi sempre straripanti (almeno 9 volte di più per
l'hosting e la gestione dei dati rispetto al mondo
analogico).
Milano, 15-16 marzo 2018 8
Milano, 15-16 marzo 2018
Definition „Data curation“
Data curation is a broad term to indicate processes and activities related to the
organization and integration of data collected from various sources, their enrichment as
well as their publication and presentation in a way that their value is maintained over
time and they remain available for reuse and preservation. Data curation includes „all
the processes needed for principled and controlled data creation, maintenance, and
management, together with the capacity to add value to data.” In science, data curation
may indicate the process of extraction of important information from scientific texts,
such as research articles by experts, and its conversion into an electronic format, such as
an entry of a biological database.
In the modern era of big data the curation of data has become more prominent,
particularly for software processing high volume and complex data systems. The term is
also used in the science of history and in the humanities, where increasing cultural and
scholarly data from digital humanities projects require the expertise and analytical
practices of data curation. In broad terms, curation means a range of activities and
processes done to create, manage, maintain, and validate a component.
(see: Wikipedia)
9
„data curation“ – definizione + spiegazione
Data curation includes „tutti i processi necessari per la
creazione, la manutenzione e la gestione controllate dei
dati, insieme alla capacità di aggiungere valore ai dati“.
Commento: con dati sono ritenuti naturalmente anche i relativi
metadati. E l‘obiettivo maggiore è sempre l‘aumentare il riuso degli
oggetti/dei dati
10Milano, 15-16 marzo 2018
Data curation è come una matryoshka, cioè una
bambola russa …
11Milano, 15-16 marzo 2018
1. „Data curation“ include fondamentalmente le
quattro sotto-attività seguenti:
1. Consentire e migliorare la ricercabilità e la reperibilità dei dati,
ad esempio mediante il miglioramento della loro presentazione
e visualizzazione (ricerca dei dati)
2. Adottare ampie misure per la garanzia della qualità, compresa
la correzione dei dati e dei relativi metadati (mantenimento e
miglioramento della qualità dei dati)
3. Aggiungere valore, ad esempio mediante l’indicizzazione
approfondita o l’arricchimento di dati / metadati, creando nuovi
contesti e connessioni di ricerca, ma anche sviluppando e
offrendo nuovi servizi originali (aggiunta di valore ai dati)
4. Rendere disponibili i dati generati per le più svariate forme di
riutilizzo (riutilizzo dei dati inclusa la conservazione)
Milano, 15-16 marzo 2018 12
1.1. L'estensione e la qualità del recupero dei dati è
determinata fondamentalmente nella fase di produzione
Milano, 15-16 marzo 2018
• Sviluppo di un flusso di lavoro completo e standardizzato /
computerizzato
• Produzione di oggetti / contenuti digitali nella migliore qualità
possibile
• Aggiunta di un insieme di metadati il più completo possibile
(metadati tecnico-amministrativi, bibliografici e strutturali,
incluso un identificativo persistente)
• Collegamento o inserimento dei (meta)dati all’interno di
quanti più strumenti bibliografici e di accesso (= cataloghi e
portali) possibile.
13
Processo di digitalizzazione a uno sguardo
Milano, 15-16 marzo 2018 14
Milano, 15-16 marzo 2018
• Un aspetto essenziale di una politica sistematica di gestione
dei dati è l'inclusione di una politica di qualità e di un controllo
costante della qualità durante la produzione di immagini
digitali. La risoluzione e la nitidezza delle immagini, insieme
alla gestione del colore, sono parametri essenziali.
• In un simile contesto, la tecnologia di riproduzione disponibile
(scanner e fotocamere digitali) deve essere rinnovata su base
continuativa.
• Oltre a tutto questo, nel nostro centro di scansione vengono
prese altre misure di garanzia della qualità. Una di queste è
l'uso sistematico del protocollo <Metamorfoze> (linee guida
per la produzione e la conservazione di immagini sviluppate
dalla Biblioteca Nazionale dei Paesi Bassi).
1.2. Politica di gestione dei dati: controllo di qualità
15
Milano, 15-16 marzo 2018
1.3. Politica di gestione dei dati: flussi di lavoro
• Alla BSB la nostra politica sulla gestione dei dati include anche
una gestione delle risorse mirata ad ottimizzare l'impiego dei
dipendenti.
• Considerando la dimensione raggiunta dai nostri dati digitali (oltre
2 milioni di volumi) e in particolare la necessità di migrare molte
sotto-raccolte fino ad ora basate su soluzioni software individuali,
un ulteriore aumento e un miglioramento dell'efficienza possono
essere raggiunti solo con la conseguente standardizzazione e
organizzazione strettamente orientata al flusso di lavoro di
tutte le possibili fasi di lavoro nella produzione digitale.
• L'efficienza della programmazione e degli altri compiti, ad
esempio nel campo dei metadati / gestione dei dati, è accresciuta
(tra le altre misure) dagli strumenti utilizzati. Questi sono, ad
esempio, strumenti software (middleware) come RabbitMQ.
16
RabbitMQ
Milano, 15-16 marzo 2018 17
Workflow-
oriented
organization
of the Digital
Library at the
BSB - 1
Milano, 15-16 marzo 2018 18
Workflow-
oriented
organization
of the Digital
Library at the
BSB - 2
Milano, 15-16 marzo 2018 19
1.4. Miglioramento del recupero e della qualità della
ricerca dei dati tramite ...
• Il rafforzamento della visibilità e dell'accessibilità della propria
produzione digitale mediante la consegna dei metadati a
cataloghi regionali, nazionali e mondiali e a vari portali
specializzati:
 Deutsche Digitale Bibliothek
 Europeana
 World Digital Library
 bavarikon
• Il nostro sito web: "Collezioni digitali del Munich Digitization
Centre (MDZ)"
• Prossimo passo: mostre online/virtuali
Milano, 15-16 marzo 2018 20
Milano, 15-16 marzo 2018 21
Milano, 15-16 marzo 2018 22
23Milano, 15-16 marzo 2018
2. Mantenere e migliorare la qualità dei dati – parte 1
• Miglioramento della qualità dei volumi digitalizzati da
Google, tramite:
 Una continua attenzione dedicata alla correzione delle
immagini digitali e / o dei metadati
 Inserimento delle pagine ripiegate fuori-testo (mappe,
ecc.) non digitalizzate da Google
Milano, 15-16 marzo 2018 24
2. Mantenere e migliorare la qualità dei dati – parte 2
• Creare nuovi/addizionali metadati (ad esempio indici
elettronici)
• Produrre testi ricercabili (fulltext mediante tools OCR)
• Generare nuovi contesti di ricerca tramite l’interconnessione
delle risorse digitali e/o migrazione dei dati su nuove base
software (come, per esempio, il DFG project “I verbali del
Deutschen Reichstag”; o il Zedler-Lexikon)
Milano, 15-16 marzo 2018 25
3. Aggiungere valore ai dati grazie a nuovi servizi e/o
prodotti
• Migliorare la presentazione e la consegna dei dati tramite
"dati per la ricerca scientifica" (= Daten für die Forschung
/ DaFo)
• Offrire un nuovo visualizzatore online per le immagini
(IIIF manifest)
• Proporre un nuovo modo di fruire dei quotidiani storici:
digiPress
• Produzione di nuovi oggetti digitali: digitalizzazione 3D
• Ricerca basata non solo sul testo, ma anche sull’analisi
della similarità delle immagini
Milano, 15-16 marzo 2018 26
Milano, 15-16 marzo 2018 27
Milano, 15-16 marzo 2018 28
Milano, 15-16 marzo 2018 29
bavarikon
3D digitization
Milano, 15-16 marzo 2018 30
Milano, 15-16 marzo 2018 31
Ricerca basata sulla similarità delle imagini
Milano, 15-16 marzo 2018 32
Milano, 15-16 marzo 2018 33
Milano, 15-16 marzo 2018 34
DaFo –Data for scientific research
Milano, 15-16 marzo 2018 35
DaFo –
order form
(english version)
Milano, 15-16 marzo 2018 36
Milano, 15-16 marzo 2018 37
Providing
IIIF manifests
Milano, 15-16 marzo 2018 38
Milano, 15-16 marzo 2018 39
4. Rendere disponibili i dati generati per le più
svariate forme di riutilizzo (riuso dei dati)
• Il nostro obiettivo principale è preservare l'originale. Per
noi questo significa che ogni originale viene scansionato
solo una volta nella migliore qualità possibile
• La scansione ad alta qualità e ad alta risoluzione richiede
un controllo di qualità permanente e sistematico (utilizzo
del protocollo <Metamorfoze>)
• Esempio: document delivery „Altes Buch - old book“
Milano, 15-16 marzo 2018 40
Sommario
Data curation è
• un processo in corso e senza fine,
• che offre sempre nuove sfide, a causa del cambiamento
delle tecnologie e delle esigenze degli utenti.
• Una parte essenziale delle soluzioni ai problemi è l'ampia
cooperazione non solo tra le istituzioni che detengono i
dati, ma anche la stretta interazione con gli utenti.
• Per questo, però, in particolare i ricercatori devono
sviluppare una sensibilità molto più ampia verso la
conservazione e l'uso di dati a lungo termine.
Milano, 15-16 marzo 2018 41
42Milano, 15-16 marzo 2018
Grazie per l‘attenzione!
Contatto: klaus.kempf@bsb-muenchen.de

More Related Content

Similar to Data curation ovvero quanto durevoli sono i nostri sforzi per una biblioteca digitale?

Formez PA : workshop "R-Innovare i servizi per il lavoro" - Roma, 28 novembre...
Formez PA : workshop "R-Innovare i servizi per il lavoro" - Roma, 28 novembre...Formez PA : workshop "R-Innovare i servizi per il lavoro" - Roma, 28 novembre...
Formez PA : workshop "R-Innovare i servizi per il lavoro" - Roma, 28 novembre...
INPSDG
 

Similar to Data curation ovvero quanto durevoli sono i nostri sforzi per una biblioteca digitale? (20)

Data &amp; analytics framework malerba
Data &amp; analytics framework   malerbaData &amp; analytics framework   malerba
Data &amp; analytics framework malerba
 
La filiera integrata dei dati pubblici. Od2016 cagliari - B
La filiera integrata dei dati pubblici. Od2016 cagliari - BLa filiera integrata dei dati pubblici. Od2016 cagliari - B
La filiera integrata dei dati pubblici. Od2016 cagliari - B
 
Presentazione sce
Presentazione scePresentazione sce
Presentazione sce
 
Intervento su Data governance in Piemonte (genn 2009) - parte 1
Intervento su Data governance in Piemonte (genn 2009) -  parte 1Intervento su Data governance in Piemonte (genn 2009) -  parte 1
Intervento su Data governance in Piemonte (genn 2009) - parte 1
 
Il progetto ODINet
Il progetto ODINetIl progetto ODINet
Il progetto ODINet
 
Av_Curriculum
Av_CurriculumAv_Curriculum
Av_Curriculum
 
Le biblioteche al centro della Ricerca: come la nuova strategia LIBER 2018-20...
Le biblioteche al centro della Ricerca: come la nuova strategia LIBER 2018-20...Le biblioteche al centro della Ricerca: come la nuova strategia LIBER 2018-20...
Le biblioteche al centro della Ricerca: come la nuova strategia LIBER 2018-20...
 
Debora Tronu, Daniela Vacca - Strumenti ed esperienze a supporto della statis...
Debora Tronu, Daniela Vacca - Strumenti ed esperienze a supporto della statis...Debora Tronu, Daniela Vacca - Strumenti ed esperienze a supporto della statis...
Debora Tronu, Daniela Vacca - Strumenti ed esperienze a supporto della statis...
 
Dati e pratiche conoscitive per le valutazioni
Dati e pratiche conoscitive per le valutazioniDati e pratiche conoscitive per le valutazioni
Dati e pratiche conoscitive per le valutazioni
 
FAIR DATA e Action Plan
FAIR DATA e Action PlanFAIR DATA e Action Plan
FAIR DATA e Action Plan
 
G. Barcaroli - Il modello di Business Architecture dell’Istat
 G. Barcaroli - Il modello di Business Architecture dell’Istat G. Barcaroli - Il modello di Business Architecture dell’Istat
G. Barcaroli - Il modello di Business Architecture dell’Istat
 
Il Piano Triennale - Simone Piunno, Chief Technology Officer del Team per la ...
Il Piano Triennale - Simone Piunno, Chief Technology Officer del Team per la ...Il Piano Triennale - Simone Piunno, Chief Technology Officer del Team per la ...
Il Piano Triennale - Simone Piunno, Chief Technology Officer del Team per la ...
 
T. Ammendola, Le informazioni ritornano al territorio: il caso della Città me...
T. Ammendola, Le informazioni ritornano al territorio: il caso della Città me...T. Ammendola, Le informazioni ritornano al territorio: il caso della Città me...
T. Ammendola, Le informazioni ritornano al territorio: il caso della Città me...
 
F. Rizzo, L’evoluzione della diffusione dei dati aggregati in Istat e l’armon...
F. Rizzo, L’evoluzione della diffusione dei dati aggregati in Istat e l’armon...F. Rizzo, L’evoluzione della diffusione dei dati aggregati in Istat e l’armon...
F. Rizzo, L’evoluzione della diffusione dei dati aggregati in Istat e l’armon...
 
Formez PA : workshop "R-Innovare i servizi per il lavoro" - Roma, 28 novembre...
Formez PA : workshop "R-Innovare i servizi per il lavoro" - Roma, 28 novembre...Formez PA : workshop "R-Innovare i servizi per il lavoro" - Roma, 28 novembre...
Formez PA : workshop "R-Innovare i servizi per il lavoro" - Roma, 28 novembre...
 
Dati della scuola
Dati della scuolaDati della scuola
Dati della scuola
 
Business intelligence v0.3
Business intelligence v0.3Business intelligence v0.3
Business intelligence v0.3
 
Cerved a journey of innovation
Cerved a journey of innovationCerved a journey of innovation
Cerved a journey of innovation
 
Presentazione percorso laboratori_open_ras-aprile 2017- sintesi
Presentazione percorso laboratori_open_ras-aprile 2017- sintesiPresentazione percorso laboratori_open_ras-aprile 2017- sintesi
Presentazione percorso laboratori_open_ras-aprile 2017- sintesi
 
Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...
Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...
Poliglottismo tecnologico & innovazione: un matrimonio perfetto? Esperienze d...
 

More from Anna Maria Tammaro

More from Anna Maria Tammaro (20)

Sdg and libraries reshaping the education for the next generation
Sdg and libraries  reshaping the education for the next generationSdg and libraries  reshaping the education for the next generation
Sdg and libraries reshaping the education for the next generation
 
Gap di competenze. Aiutare col gioco studenti "digital native" a riconoscere ...
Gap di competenze. Aiutare col gioco studenti "digital native" a riconoscere ...Gap di competenze. Aiutare col gioco studenti "digital native" a riconoscere ...
Gap di competenze. Aiutare col gioco studenti "digital native" a riconoscere ...
 
New competencies and modes of teaching for digital librarianship: the role of...
New competencies and modes of teaching for digital librarianship: the role of...New competencies and modes of teaching for digital librarianship: the role of...
New competencies and modes of teaching for digital librarianship: the role of...
 
Digital libraries and participatory culture: transforming learning!
Digital libraries and participatory culture: transforming learning! Digital libraries and participatory culture: transforming learning!
Digital libraries and participatory culture: transforming learning!
 
Biblioteche di conservazione & Data Curation: dal Custos catalogi al Digital ...
Biblioteche di conservazione & Data Curation: dal Custos catalogi al Digital ...Biblioteche di conservazione & Data Curation: dal Custos catalogi al Digital ...
Biblioteche di conservazione & Data Curation: dal Custos catalogi al Digital ...
 
Danilo Deana Prevenire è meglio che curare: vent'anni della vita di un bibli...
Danilo Deana  Prevenire è meglio che curare: vent'anni della vita di un bibli...Danilo Deana  Prevenire è meglio che curare: vent'anni della vita di un bibli...
Danilo Deana Prevenire è meglio che curare: vent'anni della vita di un bibli...
 
Data curator: who is s / he?
Findings of the IFLA Library Theory and Research...
Data curator: who is s / he?
Findings of the IFLA Library Theory and Research...Data curator: who is s / he?
Findings of the IFLA Library Theory and Research...
Data curator: who is s / he?
Findings of the IFLA Library Theory and Research...
 
Chi educa il bibliotecario educatore? Curriculum, Didattica, Competenze per l...
Chi educa il bibliotecario educatore? Curriculum, Didattica, Competenze per l...Chi educa il bibliotecario educatore? Curriculum, Didattica, Competenze per l...
Chi educa il bibliotecario educatore? Curriculum, Didattica, Competenze per l...
 
Commenti a margine del Libro di Simona Turbanti "Bibliometria e scienze del l...
Commenti a margine del Libro di Simona Turbanti "Bibliometria e scienze del l...Commenti a margine del Libro di Simona Turbanti "Bibliometria e scienze del l...
Commenti a margine del Libro di Simona Turbanti "Bibliometria e scienze del l...
 
Open education in italia stato e prospettive
Open education in italia  stato e prospettiveOpen education in italia  stato e prospettive
Open education in italia stato e prospettive
 
Definizione di biblioteca digitale
Definizione di biblioteca digitale Definizione di biblioteca digitale
Definizione di biblioteca digitale
 
Biblioteca digitale e creatività Convegno Stelline 2017
Biblioteca digitale e creatività Convegno Stelline 2017Biblioteca digitale e creatività Convegno Stelline 2017
Biblioteca digitale e creatività Convegno Stelline 2017
 
Digital humanities, digital libraries, information science what relation? 4
Digital humanities, digital libraries, information science  what relation? 4Digital humanities, digital libraries, information science  what relation? 4
Digital humanities, digital libraries, information science what relation? 4
 
What education for digital librarian? DILL employers survey
What education for digital librarian? DILL employers surveyWhat education for digital librarian? DILL employers survey
What education for digital librarian? DILL employers survey
 
Tammaro Facilitatori di conoscenza e curatori di dati: le competenze del bibl...
Tammaro Facilitatori di conoscenza e curatori di dati: le competenze del bibl...Tammaro Facilitatori di conoscenza e curatori di dati: le competenze del bibl...
Tammaro Facilitatori di conoscenza e curatori di dati: le competenze del bibl...
 
Tammaro presentazione World Fafè Napoli
Tammaro presentazione World Fafè NapoliTammaro presentazione World Fafè Napoli
Tammaro presentazione World Fafè Napoli
 
A framework for lifelong learning and teaching: the competencies paradigm and...
A framework for lifelong learning and teaching: the competencies paradigm and...A framework for lifelong learning and teaching: the competencies paradigm and...
A framework for lifelong learning and teaching: the competencies paradigm and...
 
Formazione continua AIB: il sistema delle competenze
Formazione continua AIB: il sistema delle competenzeFormazione continua AIB: il sistema delle competenze
Formazione continua AIB: il sistema delle competenze
 
Formazione continua AIB: un cambio di paradigma
Formazione continua AIB: un cambio di paradigmaFormazione continua AIB: un cambio di paradigma
Formazione continua AIB: un cambio di paradigma
 
Il sistema delle competenze ed il portfolio: un cambio di paradigma
Il sistema delle competenze ed il portfolio: un cambio di paradigmaIl sistema delle competenze ed il portfolio: un cambio di paradigma
Il sistema delle competenze ed il portfolio: un cambio di paradigma
 

Recently uploaded

Presentazione tre geni della tecnologia informatica
Presentazione tre geni della tecnologia informaticaPresentazione tre geni della tecnologia informatica
Presentazione tre geni della tecnologia informatica
nico07fusco
 
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptx
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptxScienza Potere Puntoaaaaaaaaaaaaaaa.pptx
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptx
lorenzodemidio01
 
case passive_GiorgiaDeAscaniis.pptx.....
case passive_GiorgiaDeAscaniis.pptx.....case passive_GiorgiaDeAscaniis.pptx.....
case passive_GiorgiaDeAscaniis.pptx.....
giorgiadeascaniis59
 
Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptx
Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptxNicola pisano aaaaaaaaaaaaaaaaaa(1).pptx
Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptx
lorenzodemidio01
 
Adducchio.Samuel-Steve_Jobs.ppppppppppptx
Adducchio.Samuel-Steve_Jobs.ppppppppppptxAdducchio.Samuel-Steve_Jobs.ppppppppppptx
Adducchio.Samuel-Steve_Jobs.ppppppppppptx
sasaselvatico
 

Recently uploaded (20)

Presentazione tre geni della tecnologia informatica
Presentazione tre geni della tecnologia informaticaPresentazione tre geni della tecnologia informatica
Presentazione tre geni della tecnologia informatica
 
Una breve introduzione ad Elsa Morante, vita e opere
Una breve introduzione ad Elsa Morante, vita e opereUna breve introduzione ad Elsa Morante, vita e opere
Una breve introduzione ad Elsa Morante, vita e opere
 
Vuoi girare il mondo? educazione civica.
Vuoi girare il mondo? educazione civica.Vuoi girare il mondo? educazione civica.
Vuoi girare il mondo? educazione civica.
 
Aristotele, vita e opere e fisica...pptx
Aristotele, vita e opere e fisica...pptxAristotele, vita e opere e fisica...pptx
Aristotele, vita e opere e fisica...pptx
 
descrizioni della antica civiltà dei sumeri.pptx
descrizioni della antica civiltà dei sumeri.pptxdescrizioni della antica civiltà dei sumeri.pptx
descrizioni della antica civiltà dei sumeri.pptx
 
Oppressi_oppressori.pptx................
Oppressi_oppressori.pptx................Oppressi_oppressori.pptx................
Oppressi_oppressori.pptx................
 
TeccarelliLorenzo-Mitodella.cavernaa.pdf
TeccarelliLorenzo-Mitodella.cavernaa.pdfTeccarelliLorenzo-Mitodella.cavernaa.pdf
TeccarelliLorenzo-Mitodella.cavernaa.pdf
 
Storia-CarloMagno-TeccarelliLorenzo.pptx
Storia-CarloMagno-TeccarelliLorenzo.pptxStoria-CarloMagno-TeccarelliLorenzo.pptx
Storia-CarloMagno-TeccarelliLorenzo.pptx
 
LE ALGHE.pptx ..........................
LE ALGHE.pptx ..........................LE ALGHE.pptx ..........................
LE ALGHE.pptx ..........................
 
Esame di Stato 2024 - Materiale conferenza online 09 aprile 2024
Esame di Stato 2024 - Materiale conferenza online 09 aprile 2024Esame di Stato 2024 - Materiale conferenza online 09 aprile 2024
Esame di Stato 2024 - Materiale conferenza online 09 aprile 2024
 
Descrizione Piccolo teorema di Talete.pptx
Descrizione Piccolo teorema di Talete.pptxDescrizione Piccolo teorema di Talete.pptx
Descrizione Piccolo teorema di Talete.pptx
 
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptx
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptxScienza Potere Puntoaaaaaaaaaaaaaaa.pptx
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptx
 
ProgettoDiEducazioneCivicaDefinitivo_Christian Tosone.pptx
ProgettoDiEducazioneCivicaDefinitivo_Christian Tosone.pptxProgettoDiEducazioneCivicaDefinitivo_Christian Tosone.pptx
ProgettoDiEducazioneCivicaDefinitivo_Christian Tosone.pptx
 
case passive_GiorgiaDeAscaniis.pptx.....
case passive_GiorgiaDeAscaniis.pptx.....case passive_GiorgiaDeAscaniis.pptx.....
case passive_GiorgiaDeAscaniis.pptx.....
 
Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptx
Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptxNicola pisano aaaaaaaaaaaaaaaaaa(1).pptx
Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptx
 
Scrittura seo e scrittura accessibile
Scrittura seo e scrittura accessibileScrittura seo e scrittura accessibile
Scrittura seo e scrittura accessibile
 
Tosone Christian_Steve Jobsaaaaaaaa.pptx
Tosone Christian_Steve Jobsaaaaaaaa.pptxTosone Christian_Steve Jobsaaaaaaaa.pptx
Tosone Christian_Steve Jobsaaaaaaaa.pptx
 
Adducchio.Samuel-Steve_Jobs.ppppppppppptx
Adducchio.Samuel-Steve_Jobs.ppppppppppptxAdducchio.Samuel-Steve_Jobs.ppppppppppptx
Adducchio.Samuel-Steve_Jobs.ppppppppppptx
 
TeccarelliLorenzo-i4stilidellapitturaromana.docx
TeccarelliLorenzo-i4stilidellapitturaromana.docxTeccarelliLorenzo-i4stilidellapitturaromana.docx
TeccarelliLorenzo-i4stilidellapitturaromana.docx
 
discorso generale sulla fisica e le discipline.pptx
discorso generale sulla fisica e le discipline.pptxdiscorso generale sulla fisica e le discipline.pptx
discorso generale sulla fisica e le discipline.pptx
 

Data curation ovvero quanto durevoli sono i nostri sforzi per una biblioteca digitale?

  • 1. Klaus Kempf Data curation oppure quanto durevoli sono i nostri sforzi per una biblioteca digitale’? Milano, 15-16 marzo 2018Klaus Kempf
  • 2. Aspetti fondamentali della „biblioteca digitale“ • Visione d‘insieme dell‘argomento ipercomplesso • Conta il punto di vista d‘utente, non quello all‘interno della biblioteca/quello tecnologico (obiettivo maggiore: riuso dei contenuti) • Cooperazione tra vari partner (parola chiave: standardizzazione in ogni campo d‘attività) • Cura dei relativi dati nel senso vasto del termine ed in modo permanente 2Milano, 15-16 marzo 2018
  • 4. Milano, 15-16 marzo 2018 Bayerische Staatsbibliothek a uno sguardo… Photos: BSB/H.-R. Schulz 4
  • 5. • Dal 1997 >500 progetti di digitalizzazione terminati • > 2.3 milioni volumi digitalizzati • >1,800,000,000 data files • = 980 terabyte • > 200 offerte digitali disponibili sull’internet Milano, 15-16 marzo 2018 Digitalizzazione alla Bayerische Staatsbibliothek (situazione fine febbraio 2018) 5
  • 6. Produzione digitale e archivazione a lungo termine Milano, 15-16 marzo 2018 6
  • 7. (Ri)Uso: numero di PDF-downloads Milano, 15-16 marzo 2018 7
  • 8. Il nostro servizio digitale, basato sul posseduto delle nostre collezioni, si può definire come: • un successo eclatante • ma deve continuamente fare i conti con la gestione di risorse umane estremamente limitate • e con costi sempre straripanti (almeno 9 volte di più per l'hosting e la gestione dei dati rispetto al mondo analogico). Milano, 15-16 marzo 2018 8
  • 9. Milano, 15-16 marzo 2018 Definition „Data curation“ Data curation is a broad term to indicate processes and activities related to the organization and integration of data collected from various sources, their enrichment as well as their publication and presentation in a way that their value is maintained over time and they remain available for reuse and preservation. Data curation includes „all the processes needed for principled and controlled data creation, maintenance, and management, together with the capacity to add value to data.” In science, data curation may indicate the process of extraction of important information from scientific texts, such as research articles by experts, and its conversion into an electronic format, such as an entry of a biological database. In the modern era of big data the curation of data has become more prominent, particularly for software processing high volume and complex data systems. The term is also used in the science of history and in the humanities, where increasing cultural and scholarly data from digital humanities projects require the expertise and analytical practices of data curation. In broad terms, curation means a range of activities and processes done to create, manage, maintain, and validate a component. (see: Wikipedia) 9
  • 10. „data curation“ – definizione + spiegazione Data curation includes „tutti i processi necessari per la creazione, la manutenzione e la gestione controllate dei dati, insieme alla capacità di aggiungere valore ai dati“. Commento: con dati sono ritenuti naturalmente anche i relativi metadati. E l‘obiettivo maggiore è sempre l‘aumentare il riuso degli oggetti/dei dati 10Milano, 15-16 marzo 2018
  • 11. Data curation è come una matryoshka, cioè una bambola russa … 11Milano, 15-16 marzo 2018
  • 12. 1. „Data curation“ include fondamentalmente le quattro sotto-attività seguenti: 1. Consentire e migliorare la ricercabilità e la reperibilità dei dati, ad esempio mediante il miglioramento della loro presentazione e visualizzazione (ricerca dei dati) 2. Adottare ampie misure per la garanzia della qualità, compresa la correzione dei dati e dei relativi metadati (mantenimento e miglioramento della qualità dei dati) 3. Aggiungere valore, ad esempio mediante l’indicizzazione approfondita o l’arricchimento di dati / metadati, creando nuovi contesti e connessioni di ricerca, ma anche sviluppando e offrendo nuovi servizi originali (aggiunta di valore ai dati) 4. Rendere disponibili i dati generati per le più svariate forme di riutilizzo (riutilizzo dei dati inclusa la conservazione) Milano, 15-16 marzo 2018 12
  • 13. 1.1. L'estensione e la qualità del recupero dei dati è determinata fondamentalmente nella fase di produzione Milano, 15-16 marzo 2018 • Sviluppo di un flusso di lavoro completo e standardizzato / computerizzato • Produzione di oggetti / contenuti digitali nella migliore qualità possibile • Aggiunta di un insieme di metadati il più completo possibile (metadati tecnico-amministrativi, bibliografici e strutturali, incluso un identificativo persistente) • Collegamento o inserimento dei (meta)dati all’interno di quanti più strumenti bibliografici e di accesso (= cataloghi e portali) possibile. 13
  • 14. Processo di digitalizzazione a uno sguardo Milano, 15-16 marzo 2018 14
  • 15. Milano, 15-16 marzo 2018 • Un aspetto essenziale di una politica sistematica di gestione dei dati è l'inclusione di una politica di qualità e di un controllo costante della qualità durante la produzione di immagini digitali. La risoluzione e la nitidezza delle immagini, insieme alla gestione del colore, sono parametri essenziali. • In un simile contesto, la tecnologia di riproduzione disponibile (scanner e fotocamere digitali) deve essere rinnovata su base continuativa. • Oltre a tutto questo, nel nostro centro di scansione vengono prese altre misure di garanzia della qualità. Una di queste è l'uso sistematico del protocollo <Metamorfoze> (linee guida per la produzione e la conservazione di immagini sviluppate dalla Biblioteca Nazionale dei Paesi Bassi). 1.2. Politica di gestione dei dati: controllo di qualità 15
  • 16. Milano, 15-16 marzo 2018 1.3. Politica di gestione dei dati: flussi di lavoro • Alla BSB la nostra politica sulla gestione dei dati include anche una gestione delle risorse mirata ad ottimizzare l'impiego dei dipendenti. • Considerando la dimensione raggiunta dai nostri dati digitali (oltre 2 milioni di volumi) e in particolare la necessità di migrare molte sotto-raccolte fino ad ora basate su soluzioni software individuali, un ulteriore aumento e un miglioramento dell'efficienza possono essere raggiunti solo con la conseguente standardizzazione e organizzazione strettamente orientata al flusso di lavoro di tutte le possibili fasi di lavoro nella produzione digitale. • L'efficienza della programmazione e degli altri compiti, ad esempio nel campo dei metadati / gestione dei dati, è accresciuta (tra le altre misure) dagli strumenti utilizzati. Questi sono, ad esempio, strumenti software (middleware) come RabbitMQ. 16
  • 18. Workflow- oriented organization of the Digital Library at the BSB - 1 Milano, 15-16 marzo 2018 18
  • 19. Workflow- oriented organization of the Digital Library at the BSB - 2 Milano, 15-16 marzo 2018 19
  • 20. 1.4. Miglioramento del recupero e della qualità della ricerca dei dati tramite ... • Il rafforzamento della visibilità e dell'accessibilità della propria produzione digitale mediante la consegna dei metadati a cataloghi regionali, nazionali e mondiali e a vari portali specializzati:  Deutsche Digitale Bibliothek  Europeana  World Digital Library  bavarikon • Il nostro sito web: "Collezioni digitali del Munich Digitization Centre (MDZ)" • Prossimo passo: mostre online/virtuali Milano, 15-16 marzo 2018 20
  • 24. 2. Mantenere e migliorare la qualità dei dati – parte 1 • Miglioramento della qualità dei volumi digitalizzati da Google, tramite:  Una continua attenzione dedicata alla correzione delle immagini digitali e / o dei metadati  Inserimento delle pagine ripiegate fuori-testo (mappe, ecc.) non digitalizzate da Google Milano, 15-16 marzo 2018 24
  • 25. 2. Mantenere e migliorare la qualità dei dati – parte 2 • Creare nuovi/addizionali metadati (ad esempio indici elettronici) • Produrre testi ricercabili (fulltext mediante tools OCR) • Generare nuovi contesti di ricerca tramite l’interconnessione delle risorse digitali e/o migrazione dei dati su nuove base software (come, per esempio, il DFG project “I verbali del Deutschen Reichstag”; o il Zedler-Lexikon) Milano, 15-16 marzo 2018 25
  • 26. 3. Aggiungere valore ai dati grazie a nuovi servizi e/o prodotti • Migliorare la presentazione e la consegna dei dati tramite "dati per la ricerca scientifica" (= Daten für die Forschung / DaFo) • Offrire un nuovo visualizzatore online per le immagini (IIIF manifest) • Proporre un nuovo modo di fruire dei quotidiani storici: digiPress • Produzione di nuovi oggetti digitali: digitalizzazione 3D • Ricerca basata non solo sul testo, ma anche sull’analisi della similarità delle immagini Milano, 15-16 marzo 2018 26
  • 32. Ricerca basata sulla similarità delle imagini Milano, 15-16 marzo 2018 32
  • 35. DaFo –Data for scientific research Milano, 15-16 marzo 2018 35
  • 36. DaFo – order form (english version) Milano, 15-16 marzo 2018 36
  • 40. 4. Rendere disponibili i dati generati per le più svariate forme di riutilizzo (riuso dei dati) • Il nostro obiettivo principale è preservare l'originale. Per noi questo significa che ogni originale viene scansionato solo una volta nella migliore qualità possibile • La scansione ad alta qualità e ad alta risoluzione richiede un controllo di qualità permanente e sistematico (utilizzo del protocollo <Metamorfoze>) • Esempio: document delivery „Altes Buch - old book“ Milano, 15-16 marzo 2018 40
  • 41. Sommario Data curation è • un processo in corso e senza fine, • che offre sempre nuove sfide, a causa del cambiamento delle tecnologie e delle esigenze degli utenti. • Una parte essenziale delle soluzioni ai problemi è l'ampia cooperazione non solo tra le istituzioni che detengono i dati, ma anche la stretta interazione con gli utenti. • Per questo, però, in particolare i ricercatori devono sviluppare una sensibilità molto più ampia verso la conservazione e l'uso di dati a lungo termine. Milano, 15-16 marzo 2018 41
  • 42. 42Milano, 15-16 marzo 2018 Grazie per l‘attenzione! Contatto: klaus.kempf@bsb-muenchen.de