2. Eén van de oudste en grootste filmarchieven ter
wereld
Ontstaan in 1938
Copies of negatieven van +-90.000
titels (170,000 copies)
60.000 Boeken over film
700.000 foto’s
Gespecialiseerd in Belgische film (vanaf eerste bewegende
beelden uit 1897), experimentele and avant-gardische films
11. Tijd voor vernieuwing, maar met enkele bepalingen
• We zijn een klein archief qua mankracht
• We hebben een beperkt budget
• We gaan niet bijbenen, maar vooruitspringen
• We willen onze databank openstellen naar verschillende
doelgroepen
• We willen ons archief openstellen voor connecties met
andere collecties en archieven
12. Waarom Linked data?
1. Connectie: mogelijkheden om makkelijk banden te leggen met andere
databases (bvb. weg van exports)
2. Open: grote mogelijkheden om onze collecties open te stellen voor developers,
andere archieven, researchers ...
3. Linked Open Data Services zoals Wikimedia, Geonames
a) Automatische verrijking van onze metadata
b) Multilinguale oplossingen
c) The deus ex machina ‘Same-as’ oplossing
4. We zagen Europeana, Library of Congress, televisie-archieven de linked weg
opgaan
5. We vonden een jong Gents bedrijf gespecialiseerd in Linked data met een open
source software solution: Republic of Reinvention.
https://www.reinvention.be/en/
13. Stralo Film Database klaar
1. Ontologie gebaseerd op de FIAF catalogueing rules
2. Volledig Linked Database
3. Waar mogelijk gekoppeld aan LOD’s: Wikidata, Geonames en IMDB
datasets
• Keywords, Agents (regisseurs, acteurs ...)
4. Connectie gemaakt met de automatische analysetools van I-Media-
Cities
www.imediacities.eu en onze interne automatic enrichment tools
16. Linked Data en vergeten straatnamen
Projecten zoals I-Media-Cities hebben ons getoond dat historisch materiaal niet altijd door moderne tools kan
worden geanalyseerd.
17. Linked Data en verdwenen gebouwen
North Station Bxl 1935 North Station Bxl 2015
18. Linked Data en multilingualisme
https://www.wikidata.org/wiki/Q79007
21. Waarschuwing en Engagement
• Wat als de informatie op de LOD source niet correct is?
• Veel data ontbreekt nog steeds op LOD sources. Dit
Cinematek zal zich vanaf 2020 gaan engageren om niet enkel eigen datasets als
open datasets te gaan aanbieden, maar ook om informatie op Wikidata te
corrigeren en toe te voegen. We hopen dit te doen in samenwerking met Packed
en andere erfgoedinstellingen.
Daarnaast wil Cinemetek ook belangrijke technische informatie als open data
source referentie gaan publiceren, zodat die informatie vanuit officiële bronnen
komt voor andere archieven en musea. Bvb. Framerate, kleurinformatie ...
27. Waarschuwing en Engagement
• Resultaten van deze tools zijn gigantische datafiles. Info op frame-level, wat een
vertaling vergt om een human readable resultaat te krijgen.
• We zitten vroeg in de evolutie van deze tools, dus die resultaten zijn vaak low
level info die nog verder dient gecombineerd te worden om echt interessante
informatie te krijgen
• De resultaten zijn nooit 100% correct. Deze tools worden bovendien nu nog
steeds voornamelijk door Computer engineers bedacht. We hebben
erfgoedinstellingen en wetenschappers nodig om deze tools op ,een andere
manier te benaderen.
• Cinematek, Imec en Fraunhofer zijn het CHANGE netwerk gestart, waarbij we
erfgoedspecialisten willen bekend maken met Machine learning en samen willen
kijken hoe we nuttige resultaten kunnen halen uit deze tools.
www.Changenet.be
28.
29. De moeilijkste punten bij overschakeling naar Linked data
• Vergeet uw Ontologie niet uit het oog.
• Cleaning van data vergt veel meer tijd dan je denkt
• Vrije tekst velden
• Linked data is geen ingeburgerd concept. Dit vergt een bepaald
omdenken. Mensen zijn relationele databases gewoon.
• LOD sources hebben slechts een 15-20% van de informatie waarnaar
je wil doorkoppelen.
• Specifieke search engines vergen bepaalde kennis.
• Het langst hebben we gediscussieerd over de persistente identifiers
30. Persistente ID’s
• Data ontsluiten betkent een duidelijk URI-protocol.
• We ontsluiten onze eigen data altijd onder ons eigen URI-domein:
collection.cinematek.be. Vb.
http://collection.cinematek.be/resource/1096505793698813506?lang
=en
• We vervolledigen dan met een subcategorie: hier ‘resource’ (wat bij
ons breed is, kan slaan op film, agent, plaats, ...
• Het kan ook gaan over een film (indien we daar een digitale versie van
een bepaalde film publiceren, photo ...
31. Persistente ID’s
• Voor alle pagina’s gebruiken we dan een intern gestructureerde ID
(de constructie van deze ID loopt volgens bepaalde regels. Wat
misschien nog beter zou zijn zou zijn om de URI te vervolledigen met
bvb. De titel van de film. Dat is een keuze. Vb.
http://collection.cinematek.be/resource/1096505793698813506/work/Daens?lang=en
• Bewaar de oorspronkelijke numerieke ID’s uit je oude database op
de pagina van de resource in je nieuwe database. Dit bespaart je
heel veel gedoe.
Multilingualism. Translations of concepts in many different languages are present on the webpage belonging to the URI of the concept. This allows users to add keywords or information in their own language and other researchers to find the same content when searching for the concept in their own language.
Linked data namely also means that a specific search engine can search the entire page belonging to the URI of the concept. Not just the word.
Multilingualism. Translations of concepts in many different languages are present on the webpage belonging to the URI of the concept. This allows users to add keywords or information in their own language and other researchers to find the same content when searching for the concept in their own language.
Linked data namely also means that a specific search engine can search the entire page belonging to the URI of the concept. Not just the word.
Multilingualism. Translations of concepts in many different languages are present on the webpage belonging to the URI of the concept. This allows users to add keywords or information in their own language and other researchers to find the same content when searching for the concept in their own language.
Linked data namely also means that a specific search engine can search the entire page belonging to the URI of the concept. Not just the word.
Multilingualism. Translations of concepts in many different languages are present on the webpage belonging to the URI of the concept. This allows users to add keywords or information in their own language and other researchers to find the same content when searching for the concept in their own language.
Linked data namely also means that a specific search engine can search the entire page belonging to the URI of the concept. Not just the word.
And this is where my presentation finally gets started … In the hottest summer ever recorded, 2015, we went searching for the future
This is what happened when a computer views a video file. Which contains useful information for the archive but also for the researcher wanting to use the file with regards to film rates and playback choices
Problems with correctness
This is what happens when a computer watches a film