SlideShare une entreprise Scribd logo
1  sur  32
Télécharger pour lire hors ligne
Cinematek
& Linked data
Eén van de oudste en grootste filmarchieven ter
wereld
Ontstaan in 1938
Copies of negatieven van +-90.000
titels (170,000 copies)
60.000 Boeken over film
700.000 foto’s
Gespecialiseerd in Belgische film (vanaf eerste bewegende
beelden uit 1897), experimentele and avant-gardische films
Veel geschiedenis dus, maar weinig
digitale ontwikkelingen vanaf de
jaren negentig.
Ter herinnering. Dit is hoe Amazon eruitzag in 1995
In 2012 begon onze nieuwe directeur de
grondslagen van onze digitale toekomst
uit te tekenen
Vijf grondslagen voor onze toekomst
1. Vernieuwd restauratielabo
2. Versneld digitalizatie programma
3. Nieuwe database
4. Interactieve online onderzoeksinfrastructuur
5. Nieuwe interactieve elementen
Cinematek had nog steeds dezelfde database
software uit begin 2000
Tijd voor vernieuwing, maar met enkele bepalingen
• We zijn een klein archief qua mankracht
• We hebben een beperkt budget
• We gaan niet bijbenen, maar vooruitspringen
• We willen onze databank openstellen naar verschillende
doelgroepen
• We willen ons archief openstellen voor connecties met
andere collecties en archieven
Waarom Linked data?
1. Connectie: mogelijkheden om makkelijk banden te leggen met andere
databases (bvb. weg van exports)
2. Open: grote mogelijkheden om onze collecties open te stellen voor developers,
andere archieven, researchers ...
3. Linked Open Data Services zoals Wikimedia, Geonames
a) Automatische verrijking van onze metadata
b) Multilinguale oplossingen
c) The deus ex machina ‘Same-as’ oplossing
4. We zagen Europeana, Library of Congress, televisie-archieven de linked weg
opgaan
5. We vonden een jong Gents bedrijf gespecialiseerd in Linked data met een open
source software solution: Republic of Reinvention.
https://www.reinvention.be/en/
Stralo Film Database klaar
1. Ontologie gebaseerd op de FIAF catalogueing rules
2. Volledig Linked Database
3. Waar mogelijk gekoppeld aan LOD’s: Wikidata, Geonames en IMDB
datasets
• Keywords, Agents (regisseurs, acteurs ...)
4. Connectie gemaakt met de automatische analysetools van I-Media-
Cities
www.imediacities.eu en onze interne automatic enrichment tools
https://www.wikidata.org/wiki/Q470843
Linked Data en vergeten straatnamen
Projecten zoals I-Media-Cities hebben ons getoond dat historisch materiaal niet altijd door moderne tools kan
worden geanalyseerd.
Linked Data en verdwenen gebouwen
North Station Bxl 1935 North Station Bxl 2015
Linked Data en multilingualisme
https://www.wikidata.org/wiki/Q79007
Linked Data and gekoppelde concepten
Linked Data en gekoppelde concepten
Waarschuwing en Engagement
• Wat als de informatie op de LOD source niet correct is?
• Veel data ontbreekt nog steeds op LOD sources. Dit
Cinematek zal zich vanaf 2020 gaan engageren om niet enkel eigen datasets als
open datasets te gaan aanbieden, maar ook om informatie op Wikidata te
corrigeren en toe te voegen. We hopen dit te doen in samenwerking met Packed
en andere erfgoedinstellingen.
Daarnaast wil Cinemetek ook belangrijke technische informatie als open data
source referentie gaan publiceren, zodat die informatie vanuit officiële bronnen
komt voor andere archieven en musea. Bvb. Framerate, kleurinformatie ...
Automatische A/V Analyse
Waarschuwing en Engagement
• Resultaten van deze tools zijn gigantische datafiles. Info op frame-level, wat een
vertaling vergt om een human readable resultaat te krijgen.
• We zitten vroeg in de evolutie van deze tools, dus die resultaten zijn vaak low
level info die nog verder dient gecombineerd te worden om echt interessante
informatie te krijgen
• De resultaten zijn nooit 100% correct. Deze tools worden bovendien nu nog
steeds voornamelijk door Computer engineers bedacht. We hebben
erfgoedinstellingen en wetenschappers nodig om deze tools op ,een andere
manier te benaderen.
• Cinematek, Imec en Fraunhofer zijn het CHANGE netwerk gestart, waarbij we
erfgoedspecialisten willen bekend maken met Machine learning en samen willen
kijken hoe we nuttige resultaten kunnen halen uit deze tools.
www.Changenet.be
De moeilijkste punten bij overschakeling naar Linked data
• Vergeet uw Ontologie niet uit het oog.
• Cleaning van data vergt veel meer tijd dan je denkt
• Vrije tekst velden
• Linked data is geen ingeburgerd concept. Dit vergt een bepaald
omdenken. Mensen zijn relationele databases gewoon.
• LOD sources hebben slechts een 15-20% van de informatie waarnaar
je wil doorkoppelen.
• Specifieke search engines vergen bepaalde kennis.
• Het langst hebben we gediscussieerd over de persistente identifiers
Persistente ID’s
• Data ontsluiten betkent een duidelijk URI-protocol.
• We ontsluiten onze eigen data altijd onder ons eigen URI-domein:
collection.cinematek.be. Vb.
http://collection.cinematek.be/resource/1096505793698813506?lang
=en
• We vervolledigen dan met een subcategorie: hier ‘resource’ (wat bij
ons breed is, kan slaan op film, agent, plaats, ...
• Het kan ook gaan over een film (indien we daar een digitale versie van
een bepaalde film publiceren, photo ...
Persistente ID’s
• Voor alle pagina’s gebruiken we dan een intern gestructureerde ID
(de constructie van deze ID loopt volgens bepaalde regels. Wat
misschien nog beter zou zijn zou zijn om de URI te vervolledigen met
bvb. De titel van de film. Dat is een keuze. Vb.
http://collection.cinematek.be/resource/1096505793698813506/work/Daens?lang=en
• Bewaar de oorspronkelijke numerieke ID’s uit je oude database op
de pagina van de resource in je nieuwe database. Dit bespaart je
heel veel gedoe.
Vragen?!
davy.hanegreefs@cinematek.be
0032/25511916
Imediacities.eu

Contenu connexe

Tendances

20190307 datadive _datanight_at_the_museum
20190307 datadive _datanight_at_the_museum20190307 datadive _datanight_at_the_museum
20190307 datadive _datanight_at_the_museumPACKED vzw
 
20191018_Cinematek_presentation_open_data_bootcamp
20191018_Cinematek_presentation_open_data_bootcamp20191018_Cinematek_presentation_open_data_bootcamp
20191018_Cinematek_presentation_open_data_bootcampPACKED vzw
 
Alina Saenko: Persistente URI's
Alina Saenko: Persistente URI'sAlina Saenko: Persistente URI's
Alina Saenko: Persistente URI'sPACKED vzw
 
20180330 lod ap_hogeschool
20180330 lod ap_hogeschool20180330 lod ap_hogeschool
20180330 lod ap_hogeschoolPACKED vzw
 
Afstudeeronderzoek linked open data duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomstAfstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data duurzaam voor de toekomstErfgoed 2.0
 
Bert Lemmens - VKC ecosysteem
Bert Lemmens - VKC ecosysteemBert Lemmens - VKC ecosysteem
Bert Lemmens - VKC ecosysteemPACKED
 
Viaa presentatie bootcamp 2019 Matthias Priem
Viaa presentatie bootcamp 2019 Matthias PriemViaa presentatie bootcamp 2019 Matthias Priem
Viaa presentatie bootcamp 2019 Matthias PriemPACKED vzw
 
20160922 Reinwardt Academie - NDE Bruikbaar case study GTAA bij Groninger Arc...
20160922 Reinwardt Academie - NDE Bruikbaar case study GTAA bij Groninger Arc...20160922 Reinwardt Academie - NDE Bruikbaar case study GTAA bij Groninger Arc...
20160922 Reinwardt Academie - NDE Bruikbaar case study GTAA bij Groninger Arc...Lotte Belice Baltussen
 
Netwerk Digitaal Erfgoed - Annotatie webarchief Groninger Archieven - AVA_Net...
Netwerk Digitaal Erfgoed - Annotatie webarchief Groninger Archieven - AVA_Net...Netwerk Digitaal Erfgoed - Annotatie webarchief Groninger Archieven - AVA_Net...
Netwerk Digitaal Erfgoed - Annotatie webarchief Groninger Archieven - AVA_Net...Lotte Belice Baltussen
 
Museums & Wikidata - studiedag Rubenianum
Museums & Wikidata - studiedag RubenianumMuseums & Wikidata - studiedag Rubenianum
Museums & Wikidata - studiedag RubenianumPACKED vzw
 
Blauwdruk gedistribueerd beeldbeheer
Blauwdruk gedistribueerd beeldbeheerBlauwdruk gedistribueerd beeldbeheer
Blauwdruk gedistribueerd beeldbeheerPACKED vzw
 

Tendances (20)

20190307 datadive _datanight_at_the_museum
20190307 datadive _datanight_at_the_museum20190307 datadive _datanight_at_the_museum
20190307 datadive _datanight_at_the_museum
 
SOS Linked Data - partnerevent voorjaar 2021
SOS Linked Data - partnerevent voorjaar 2021SOS Linked Data - partnerevent voorjaar 2021
SOS Linked Data - partnerevent voorjaar 2021
 
Mee met meemoo - partnerevent voorjaar 2021
Mee met meemoo - partnerevent voorjaar 2021Mee met meemoo - partnerevent voorjaar 2021
Mee met meemoo - partnerevent voorjaar 2021
 
20191018_Cinematek_presentation_open_data_bootcamp
20191018_Cinematek_presentation_open_data_bootcamp20191018_Cinematek_presentation_open_data_bootcamp
20191018_Cinematek_presentation_open_data_bootcamp
 
Hublet tablets for shared use in libraries
Hublet tablets for shared use in librariesHublet tablets for shared use in libraries
Hublet tablets for shared use in libraries
 
Digitaal mobiel-genetwerkt - workshop
Digitaal mobiel-genetwerkt - workshopDigitaal mobiel-genetwerkt - workshop
Digitaal mobiel-genetwerkt - workshop
 
Alina Saenko: Persistente URI's
Alina Saenko: Persistente URI'sAlina Saenko: Persistente URI's
Alina Saenko: Persistente URI's
 
Kbr, een eeuwenoude bibliotheek in (r)evolutie
Kbr, een eeuwenoude bibliotheek in (r)evolutieKbr, een eeuwenoude bibliotheek in (r)evolutie
Kbr, een eeuwenoude bibliotheek in (r)evolutie
 
Weg met de museumwebsite
Weg met de museumwebsiteWeg met de museumwebsite
Weg met de museumwebsite
 
20180330 lod ap_hogeschool
20180330 lod ap_hogeschool20180330 lod ap_hogeschool
20180330 lod ap_hogeschool
 
Afstudeeronderzoek linked open data duurzaam voor de toekomst
Afstudeeronderzoek linked open data   duurzaam voor de toekomstAfstudeeronderzoek linked open data   duurzaam voor de toekomst
Afstudeeronderzoek linked open data duurzaam voor de toekomst
 
Bert Lemmens - VKC ecosysteem
Bert Lemmens - VKC ecosysteemBert Lemmens - VKC ecosysteem
Bert Lemmens - VKC ecosysteem
 
Hoe ISNI en Linked Open Data cultureel erfgoed helpen beheren en ontsluiten
Hoe ISNI en Linked Open Data cultureel erfgoed helpen beheren en ontsluitenHoe ISNI en Linked Open Data cultureel erfgoed helpen beheren en ontsluiten
Hoe ISNI en Linked Open Data cultureel erfgoed helpen beheren en ontsluiten
 
Viaa presentatie bootcamp 2019 Matthias Priem
Viaa presentatie bootcamp 2019 Matthias PriemViaa presentatie bootcamp 2019 Matthias Priem
Viaa presentatie bootcamp 2019 Matthias Priem
 
20160922 Reinwardt Academie - NDE Bruikbaar case study GTAA bij Groninger Arc...
20160922 Reinwardt Academie - NDE Bruikbaar case study GTAA bij Groninger Arc...20160922 Reinwardt Academie - NDE Bruikbaar case study GTAA bij Groninger Arc...
20160922 Reinwardt Academie - NDE Bruikbaar case study GTAA bij Groninger Arc...
 
Netwerk Digitaal Erfgoed - Annotatie webarchief Groninger Archieven - AVA_Net...
Netwerk Digitaal Erfgoed - Annotatie webarchief Groninger Archieven - AVA_Net...Netwerk Digitaal Erfgoed - Annotatie webarchief Groninger Archieven - AVA_Net...
Netwerk Digitaal Erfgoed - Annotatie webarchief Groninger Archieven - AVA_Net...
 
Digitaal archiveren met Lias
Digitaal archiveren met LiasDigitaal archiveren met Lias
Digitaal archiveren met Lias
 
Museums & Wikidata - studiedag Rubenianum
Museums & Wikidata - studiedag RubenianumMuseums & Wikidata - studiedag Rubenianum
Museums & Wikidata - studiedag Rubenianum
 
Blauwdruk gedistribueerd beeldbeheer
Blauwdruk gedistribueerd beeldbeheerBlauwdruk gedistribueerd beeldbeheer
Blauwdruk gedistribueerd beeldbeheer
 
Mensen, manuscripten, manifesten MMMonk
Mensen, manuscripten, manifesten MMMonkMensen, manuscripten, manifesten MMMonk
Mensen, manuscripten, manifesten MMMonk
 

Similaire à Cinematek presentation open data bootcamp

Open Cultuur Data Masterclass #3 - Open State - Lex Slaghuis
Open Cultuur Data Masterclass #3 - Open State - Lex SlaghuisOpen Cultuur Data Masterclass #3 - Open State - Lex Slaghuis
Open Cultuur Data Masterclass #3 - Open State - Lex SlaghuisKennisland
 
Inctspiratie 2009 - KB - Op weg naar de digitale bibliotheek
Inctspiratie 2009 - KB - Op weg naar de digitale bibliotheekInctspiratie 2009 - KB - Op weg naar de digitale bibliotheek
Inctspiratie 2009 - KB - Op weg naar de digitale bibliotheekElco van Staveren
 
Big Data en Open Data
Big Data en Open DataBig Data en Open Data
Big Data en Open DataBart Hanssens
 
Walther Hasselo - Regionaal Archief Leiden
Walther Hasselo - Regionaal Archief LeidenWalther Hasselo - Regionaal Archief Leiden
Walther Hasselo - Regionaal Archief LeidenKVANdagen
 
Sessie 'Onderduikkaarten online' | Hans Laagland | Noordelijke Netwerkdag Oor...
Sessie 'Onderduikkaarten online' | Hans Laagland | Noordelijke Netwerkdag Oor...Sessie 'Onderduikkaarten online' | Hans Laagland | Noordelijke Netwerkdag Oor...
Sessie 'Onderduikkaarten online' | Hans Laagland | Noordelijke Netwerkdag Oor...Netwerk Oorlogsbronnen
 
Workshop Digital Radio (03/27/2009)
Workshop Digital Radio (03/27/2009)Workshop Digital Radio (03/27/2009)
Workshop Digital Radio (03/27/2009)Maarten Verwaest
 
Matthias Vandermaesen: De Datahub
Matthias Vandermaesen: De DatahubMatthias Vandermaesen: De Datahub
Matthias Vandermaesen: De DatahubPACKED vzw
 
Matthias Vandermaesen - De datahub
Matthias Vandermaesen - De datahubMatthias Vandermaesen - De datahub
Matthias Vandermaesen - De datahubPACKED
 
LIBISnet Gebruikersdag 01062017 - Nieuws vanuit LIBIS
LIBISnet Gebruikersdag 01062017 - Nieuws vanuit LIBISLIBISnet Gebruikersdag 01062017 - Nieuws vanuit LIBIS
LIBISnet Gebruikersdag 01062017 - Nieuws vanuit LIBISLIBIS
 
Ecg v-ict-or - werktafel november 2011 2
Ecg   v-ict-or - werktafel november 2011 2Ecg   v-ict-or - werktafel november 2011 2
Ecg v-ict-or - werktafel november 2011 2bl1133a
 

Similaire à Cinematek presentation open data bootcamp (20)

Open Cultuur Data Masterclass #3 - Open State - Lex Slaghuis
Open Cultuur Data Masterclass #3 - Open State - Lex SlaghuisOpen Cultuur Data Masterclass #3 - Open State - Lex Slaghuis
Open Cultuur Data Masterclass #3 - Open State - Lex Slaghuis
 
Viaa presentatie bootcamp 2019 Matthias Priem
Viaa presentatie bootcamp 2019 Matthias PriemViaa presentatie bootcamp 2019 Matthias Priem
Viaa presentatie bootcamp 2019 Matthias Priem
 
Inctspiratie 2009 - KB - Op weg naar de digitale bibliotheek
Inctspiratie 2009 - KB - Op weg naar de digitale bibliotheekInctspiratie 2009 - KB - Op weg naar de digitale bibliotheek
Inctspiratie 2009 - KB - Op weg naar de digitale bibliotheek
 
Open Linked Data
Open Linked DataOpen Linked Data
Open Linked Data
 
Big Data en Open Data
Big Data en Open DataBig Data en Open Data
Big Data en Open Data
 
Walther Hasselo - Regionaal Archief Leiden
Walther Hasselo - Regionaal Archief LeidenWalther Hasselo - Regionaal Archief Leiden
Walther Hasselo - Regionaal Archief Leiden
 
Sessie 'Onderduikkaarten online' | Hans Laagland | Noordelijke Netwerkdag Oor...
Sessie 'Onderduikkaarten online' | Hans Laagland | Noordelijke Netwerkdag Oor...Sessie 'Onderduikkaarten online' | Hans Laagland | Noordelijke Netwerkdag Oor...
Sessie 'Onderduikkaarten online' | Hans Laagland | Noordelijke Netwerkdag Oor...
 
Mee met meemoo
Mee met meemooMee met meemoo
Mee met meemoo
 
Vanstappen De Caigny
Vanstappen De CaignyVanstappen De Caigny
Vanstappen De Caigny
 
EDepots in het CVAa en het NAi
EDepots in het CVAa en het NAi EDepots in het CVAa en het NAi
EDepots in het CVAa en het NAi
 
Presentatie 20091216
Presentatie 20091216Presentatie 20091216
Presentatie 20091216
 
Marco de Niet
Marco de NietMarco de Niet
Marco de Niet
 
Workshop Digital Radio (03/27/2009)
Workshop Digital Radio (03/27/2009)Workshop Digital Radio (03/27/2009)
Workshop Digital Radio (03/27/2009)
 
Kennis ontwikkelen, kennisdelen en verbinden in het Kennisnetwerk Informatie ...
Kennis ontwikkelen, kennisdelen en verbinden in het Kennisnetwerk Informatie ...Kennis ontwikkelen, kennisdelen en verbinden in het Kennisnetwerk Informatie ...
Kennis ontwikkelen, kennisdelen en verbinden in het Kennisnetwerk Informatie ...
 
De Datahub
De DatahubDe Datahub
De Datahub
 
Matthias Vandermaesen: De Datahub
Matthias Vandermaesen: De DatahubMatthias Vandermaesen: De Datahub
Matthias Vandermaesen: De Datahub
 
Matthias Vandermaesen - De datahub
Matthias Vandermaesen - De datahubMatthias Vandermaesen - De datahub
Matthias Vandermaesen - De datahub
 
LIBISnet Gebruikersdag 01062017 - Nieuws vanuit LIBIS
LIBISnet Gebruikersdag 01062017 - Nieuws vanuit LIBISLIBISnet Gebruikersdag 01062017 - Nieuws vanuit LIBIS
LIBISnet Gebruikersdag 01062017 - Nieuws vanuit LIBIS
 
Ecg v-ict-or - werktafel november 2011 2
Ecg   v-ict-or - werktafel november 2011 2Ecg   v-ict-or - werktafel november 2011 2
Ecg v-ict-or - werktafel november 2011 2
 
Opendata kviv
Opendata kvivOpendata kviv
Opendata kviv
 

Plus de meemoo, Vlaams instituut voor het archief

GIVE or take_het nut van kwaliteitscontrole bij digitalisering - 30 nov 2023
GIVE or take_het nut van kwaliteitscontrole bij digitalisering - 30 nov 2023GIVE or take_het nut van kwaliteitscontrole bij digitalisering - 30 nov 2023
GIVE or take_het nut van kwaliteitscontrole bij digitalisering - 30 nov 2023meemoo, Vlaams instituut voor het archief
 

Plus de meemoo, Vlaams instituut voor het archief (20)

20240425 Sectormoment podiumkunstenorganisaties meemoo
20240425 Sectormoment podiumkunstenorganisaties meemoo20240425 Sectormoment podiumkunstenorganisaties meemoo
20240425 Sectormoment podiumkunstenorganisaties meemoo
 
Publiek domein - namiddagsessie partnerevent 30 nov 2023
Publiek domein - namiddagsessie partnerevent 30 nov 2023Publiek domein - namiddagsessie partnerevent 30 nov 2023
Publiek domein - namiddagsessie partnerevent 30 nov 2023
 
Uitwisselplatform 30 november 2023
Uitwisselplatform 30 november 2023Uitwisselplatform 30 november 2023
Uitwisselplatform 30 november 2023
 
Inspiratiesessie hetarchief.be - 30 nov 2023
Inspiratiesessie hetarchief.be - 30 nov 2023Inspiratiesessie hetarchief.be - 30 nov 2023
Inspiratiesessie hetarchief.be - 30 nov 2023
 
GIVE or take_het nut van kwaliteitscontrole bij digitalisering - 30 nov 2023
GIVE or take_het nut van kwaliteitscontrole bij digitalisering - 30 nov 2023GIVE or take_het nut van kwaliteitscontrole bij digitalisering - 30 nov 2023
GIVE or take_het nut van kwaliteitscontrole bij digitalisering - 30 nov 2023
 
GIVE metadata - showcase - 30 nov 2023.pptx
GIVE metadata - showcase - 30 nov 2023.pptxGIVE metadata - showcase - 30 nov 2023.pptx
GIVE metadata - showcase - 30 nov 2023.pptx
 
Presentatie partnerevent 30 nov 2023 - plenaire sessie
Presentatie partnerevent 30 nov 2023 - plenaire sessiePresentatie partnerevent 30 nov 2023 - plenaire sessie
Presentatie partnerevent 30 nov 2023 - plenaire sessie
 
Presentatie online partnerevent plenaire sessie 11 mei 2023
Presentatie online partnerevent plenaire sessie 11 mei 2023Presentatie online partnerevent plenaire sessie 11 mei 2023
Presentatie online partnerevent plenaire sessie 11 mei 2023
 
Infosessie GIVE-metadata - partnerevent 11 mei 2023
Infosessie GIVE-metadata - partnerevent 11 mei 2023Infosessie GIVE-metadata - partnerevent 11 mei 2023
Infosessie GIVE-metadata - partnerevent 11 mei 2023
 
GIVE-Topstukkenproject 3D-scanning
GIVE-Topstukkenproject 3D-scanningGIVE-Topstukkenproject 3D-scanning
GIVE-Topstukkenproject 3D-scanning
 
GIVE-metadataproject
GIVE-metadataprojectGIVE-metadataproject
GIVE-metadataproject
 
Invulboeken voor Objecten en Publicaties
Invulboeken voor Objecten en PublicatiesInvulboeken voor Objecten en Publicaties
Invulboeken voor Objecten en Publicaties
 
Vlaamse erfgoeddatabanken
Vlaamse erfgoeddatabankenVlaamse erfgoeddatabanken
Vlaamse erfgoeddatabanken
 
Publiekdomeindag 2023 - Rechtenworkshop
Publiekdomeindag 2023 - RechtenworkshopPubliekdomeindag 2023 - Rechtenworkshop
Publiekdomeindag 2023 - Rechtenworkshop
 
Publiekdomeindag 2023
Publiekdomeindag 2023Publiekdomeindag 2023
Publiekdomeindag 2023
 
Inspiratiesessie: het groeipad sociale media
Inspiratiesessie: het groeipad sociale mediaInspiratiesessie: het groeipad sociale media
Inspiratiesessie: het groeipad sociale media
 
Presentatie online partnerevent 1 december 2022.pdf
Presentatie online partnerevent 1 december 2022.pdfPresentatie online partnerevent 1 december 2022.pdf
Presentatie online partnerevent 1 december 2022.pdf
 
20221110_PRESENTATIE Sectordag musea.pptx
20221110_PRESENTATIE Sectordag musea.pptx20221110_PRESENTATIE Sectordag musea.pptx
20221110_PRESENTATIE Sectordag musea.pptx
 
20220610_Info-sessie CP's.pptx
20220610_Info-sessie CP's.pptx20220610_Info-sessie CP's.pptx
20220610_Info-sessie CP's.pptx
 
Partnerevent 9 juni 2022 - plenair - voormiddag.pdf
Partnerevent 9 juni 2022 - plenair - voormiddag.pdfPartnerevent 9 juni 2022 - plenair - voormiddag.pdf
Partnerevent 9 juni 2022 - plenair - voormiddag.pdf
 

Cinematek presentation open data bootcamp

  • 2. Eén van de oudste en grootste filmarchieven ter wereld Ontstaan in 1938 Copies of negatieven van +-90.000 titels (170,000 copies) 60.000 Boeken over film 700.000 foto’s Gespecialiseerd in Belgische film (vanaf eerste bewegende beelden uit 1897), experimentele and avant-gardische films
  • 3. Veel geschiedenis dus, maar weinig digitale ontwikkelingen vanaf de jaren negentig.
  • 4. Ter herinnering. Dit is hoe Amazon eruitzag in 1995
  • 5. In 2012 begon onze nieuwe directeur de grondslagen van onze digitale toekomst uit te tekenen
  • 6.
  • 7.
  • 8. Vijf grondslagen voor onze toekomst 1. Vernieuwd restauratielabo 2. Versneld digitalizatie programma 3. Nieuwe database 4. Interactieve online onderzoeksinfrastructuur 5. Nieuwe interactieve elementen
  • 9.
  • 10. Cinematek had nog steeds dezelfde database software uit begin 2000
  • 11. Tijd voor vernieuwing, maar met enkele bepalingen • We zijn een klein archief qua mankracht • We hebben een beperkt budget • We gaan niet bijbenen, maar vooruitspringen • We willen onze databank openstellen naar verschillende doelgroepen • We willen ons archief openstellen voor connecties met andere collecties en archieven
  • 12. Waarom Linked data? 1. Connectie: mogelijkheden om makkelijk banden te leggen met andere databases (bvb. weg van exports) 2. Open: grote mogelijkheden om onze collecties open te stellen voor developers, andere archieven, researchers ... 3. Linked Open Data Services zoals Wikimedia, Geonames a) Automatische verrijking van onze metadata b) Multilinguale oplossingen c) The deus ex machina ‘Same-as’ oplossing 4. We zagen Europeana, Library of Congress, televisie-archieven de linked weg opgaan 5. We vonden een jong Gents bedrijf gespecialiseerd in Linked data met een open source software solution: Republic of Reinvention. https://www.reinvention.be/en/
  • 13. Stralo Film Database klaar 1. Ontologie gebaseerd op de FIAF catalogueing rules 2. Volledig Linked Database 3. Waar mogelijk gekoppeld aan LOD’s: Wikidata, Geonames en IMDB datasets • Keywords, Agents (regisseurs, acteurs ...) 4. Connectie gemaakt met de automatische analysetools van I-Media- Cities www.imediacities.eu en onze interne automatic enrichment tools
  • 15.
  • 16. Linked Data en vergeten straatnamen Projecten zoals I-Media-Cities hebben ons getoond dat historisch materiaal niet altijd door moderne tools kan worden geanalyseerd.
  • 17. Linked Data en verdwenen gebouwen North Station Bxl 1935 North Station Bxl 2015
  • 18. Linked Data en multilingualisme https://www.wikidata.org/wiki/Q79007
  • 19. Linked Data and gekoppelde concepten
  • 20. Linked Data en gekoppelde concepten
  • 21. Waarschuwing en Engagement • Wat als de informatie op de LOD source niet correct is? • Veel data ontbreekt nog steeds op LOD sources. Dit Cinematek zal zich vanaf 2020 gaan engageren om niet enkel eigen datasets als open datasets te gaan aanbieden, maar ook om informatie op Wikidata te corrigeren en toe te voegen. We hopen dit te doen in samenwerking met Packed en andere erfgoedinstellingen. Daarnaast wil Cinemetek ook belangrijke technische informatie als open data source referentie gaan publiceren, zodat die informatie vanuit officiële bronnen komt voor andere archieven en musea. Bvb. Framerate, kleurinformatie ...
  • 23.
  • 24.
  • 25.
  • 26.
  • 27. Waarschuwing en Engagement • Resultaten van deze tools zijn gigantische datafiles. Info op frame-level, wat een vertaling vergt om een human readable resultaat te krijgen. • We zitten vroeg in de evolutie van deze tools, dus die resultaten zijn vaak low level info die nog verder dient gecombineerd te worden om echt interessante informatie te krijgen • De resultaten zijn nooit 100% correct. Deze tools worden bovendien nu nog steeds voornamelijk door Computer engineers bedacht. We hebben erfgoedinstellingen en wetenschappers nodig om deze tools op ,een andere manier te benaderen. • Cinematek, Imec en Fraunhofer zijn het CHANGE netwerk gestart, waarbij we erfgoedspecialisten willen bekend maken met Machine learning en samen willen kijken hoe we nuttige resultaten kunnen halen uit deze tools. www.Changenet.be
  • 28.
  • 29. De moeilijkste punten bij overschakeling naar Linked data • Vergeet uw Ontologie niet uit het oog. • Cleaning van data vergt veel meer tijd dan je denkt • Vrije tekst velden • Linked data is geen ingeburgerd concept. Dit vergt een bepaald omdenken. Mensen zijn relationele databases gewoon. • LOD sources hebben slechts een 15-20% van de informatie waarnaar je wil doorkoppelen. • Specifieke search engines vergen bepaalde kennis. • Het langst hebben we gediscussieerd over de persistente identifiers
  • 30. Persistente ID’s • Data ontsluiten betkent een duidelijk URI-protocol. • We ontsluiten onze eigen data altijd onder ons eigen URI-domein: collection.cinematek.be. Vb. http://collection.cinematek.be/resource/1096505793698813506?lang =en • We vervolledigen dan met een subcategorie: hier ‘resource’ (wat bij ons breed is, kan slaan op film, agent, plaats, ... • Het kan ook gaan over een film (indien we daar een digitale versie van een bepaalde film publiceren, photo ...
  • 31. Persistente ID’s • Voor alle pagina’s gebruiken we dan een intern gestructureerde ID (de constructie van deze ID loopt volgens bepaalde regels. Wat misschien nog beter zou zijn zou zijn om de URI te vervolledigen met bvb. De titel van de film. Dat is een keuze. Vb. http://collection.cinematek.be/resource/1096505793698813506/work/Daens?lang=en • Bewaar de oorspronkelijke numerieke ID’s uit je oude database op de pagina van de resource in je nieuwe database. Dit bespaart je heel veel gedoe.