Begin april haalde Pieter Van Herrewegh de kranten met zijn infographic ‘Nergens heter dan Thuis’ (http://www.qsdf.be/thuisopeen/): wie deed het en wie doet het nog steeds? Pieter Van Herrewegh ontsloot een stuk informatie dat de gemiddelde Vlaming sterk interesseert. Dat doen informatiewerkers dagdagelijks. Bovendien zijn wij van nature geneigd om daarbij enkele richtlijnen in acht te nemen: informatie moet vrij zijn en - omdat we goed geluisterd hebben naar Sir Tim Berners-Lee - ook linkbaar zijn. Geen gesloten infographics zoals die van Van Herrewegh, maar open en linkable data.
Graag had ik een online hobbyclub opgericht van informatiewerkers die aan de slag willen met triples en Turtle, niet zozeer vanuit hun organisatie maar vanuit persoonlijke drijfveren. Geen herkauwing van grootschalige projecten à la DBpedia, geen data ontsluiten die al ontsloten is, maar kleine, fijne ontologieën opzetten die onze lokale gebruikers interesseren, dit volgens de principes van Linked Data en onder het motto ‘informatiewerker ben je altijd, of je nu aan het werk bent of niet’.
Ik zoek de bibliothecaris die graag de gemeenteraad in kaart wil brengen: wie deed het en wie doet het nog steeds? Een visualisatie rond de plaatselijke socio-culturele verenigingen? De Kinder- en jeugdjury? De stadsdichter? Alles kan. Welke hogeschoolbibliotheekmedewerker voelt zich geroepen om de opleidingen binnen het leercentrum te RDF’en? Welke archivaris wil iets meer doen met de kapellen van de naburige gemeenten?
Het manifest voor deze hobbyclub ligt klaar, nu nog leden ronselen op Informatie aan Zee.
Classificaties: een kerstverhaal voor webdesigners
Let's do the turtle
1.
2. • Sommige hobby’s lopen uit de hand
(Pieter Van Herreweghen, visual content creator, 2014).
• Informatie ontsluiten doen wij meerdere
dagen per week.
• Everyday I am a librarian?
• Op te richten hobbyclub voor
informatiewerkers die aan de slag willen met
(meta)data en de verbanden ertussen…
• Topics bepalen
• Informatie samenbrengen
• Resultaat visualiseren en publiceren
3.
4.
5. Closed infographics versus linked open data
• 5 open data / Tim Berners-Lee (2010)
• Data beschikbaar stellen voor hergebruik:
PDF -> XLS -> CSV -> RDF -> LOD
• Bestaande datasets hergebruiken:
DBPedia – AAT – Europeana – Geonames – VIAF – …
• Linked Data for Libraries, Archives and Museums : how to clean, link and publish
your metadata (book & website) / Seth van Hooland & Ruben Verborgh (2014)
• Ontologies and Linked Data (online course) / Library Juice Academy (2015)
6. Good practice: LinkedJazz.org
• interview transcripts used to create LOD: as people are mentioned by an
interviewee, simple RDF triples between interviewee and persons
mentioned are created in the form of “knowsOf”
• network visualization
• goal is to uncover meaningful connections between documents and data
relating to the personal and professional lives of musicians and to develop
tools and methods for working with Linked Open Data that can be applied
in broader environments
7. Let’s do the turtle: manifest voor een hobbyclub
• kleine, fijne ontologieën/datasets opzetten die onze lokale gebruikers interesseren,
• volgens de principes van Linked Open Data,
• onder het motto ‘informatiewerker ben je altijd, of je nu aan het werk bent of niet’.
• Bibliothecaris brengt gemeenteraad in kaart: wie deed het en wie doet het nog steeds?
• Informatiedeskundige visualiseert de verbanden tussen de plaatselijke socio-culturele
verenigingen, het stemgedrag van de Kinder- en Jeugdjury, de bibliografie van de stadsdichter
• Mediathecaris zet aanbod opleidingen binnen hogeschool om naar RDF triples
• Archivaris beschrijft de kenmerken van de kapellen in de naburige gemeenten met Turtle
• focus op plezier, inspiratie van elkaar, studie, resultaat
• veroveren we een plek in de LOD cloud?
• wie denkt mee?
• contact: eva.t.simon@gmail.com
Notes de l'éditeur
Begin april haalde Pieter Van Herrewegh de kranten met zijn infographic ‘Nergens heter dan Thuis’ (http://www.qsdf.be/thuisopeen/): wie deed het en wie doet het nog steeds? Pieter Van Herrewegh ontsloot een stuk informatie dat de gemiddelde Vlaming sterk interesseert. Dat doen informatiewerkers dagdagelijks.
Ik heb een uitgesproken inhoudelijke drive met sterke digitale en grafische competenties. Ik werk halftijds als docent aan Thomas More, binnen communicatiemanagement en journalistiek. Daar geef ik hoofdzakelijk "online productie"-vakken en begeleid ik studenten bij praktijkopdrachten.
Bovendien zijn wij van nature geneigd om daarbij enkele richtlijnen in acht te nemen: informatie moet vrij zijn en - omdat we goed geluisterd hebben naar Sir Tim Berners-Lee - ook linkbaar zijn. Geen gesloten infographics zoals die van Van Herrewegh, maar open en linkable data.
PDF-XLS-CSV-RDF-LOD
In the first phase of the project — funded through an OCLC/ALISE Library and Information Science Research grant — we experimented with the actual content of interview transcripts, generating new triples based on data rather than converting existing metadata. The 50+ interview transcripts we’ve used to create LOD come from the Rutgers Institute for Jazz Studies Archives, Smithsonian Jazz Oral Histories, the Hamilton College Jazz Archive, UCLA’s Central Avenue Sounds series, and the University of Michigan’s Nathaniel C. Standifer Video Archive of Oral History.
To create LOD, we developed a suite of tools: a transcript analyzer, name mapping and curator tool, and a crowdsourcing tool. These tools operate together to find names mentioned during the interview in order to assign a positive identification to each, disambiguating names using online resources like DBpedia and VIAF. The transcript analyzer also recognizes the question and answer structure of the oral history. As people are mentioned by an interviewee, simple RDF triples between interviewee and persons mentioned are created in the form of “knowsOf”.
In the next step, the interview question and answer blocks are passed to Linked Jazz 52nd Street, our crowdsourcing tool. Volunteers are presented with these snippets of interview text and asked to assign more granular terms to describe the relationship between the interviewee and the person mentioned. These relationships include:
has met, is an acquaintance of, is a friend of, is a close friend of, is influenced by, is a mentor of, collaborated with, was in a band together with, played with, was a member of the band of, toured with, was the bandleader for
In the last step of our data lifecycle, we pass the triples to a network visualization. At this moment, the visualization shows the knows of triples, not the triples generated by 52nd Street.
Although we have a much larger master list of musicians including names culled from sources like DBPedia, MusicBrainz, and more, only musicians who were mentioned in transcripts are included in the network visualization.
The size of a person’s node reflects how many times they were mentioned in various oral history transcripts.
In the upcoming phases of Linked Jazz, we plan to bring the tools we’ve developed from prototype stage to production, so linked data practitioners from other domains can make use of the tools we’ve developed. We are also continuing to investigate the topic of jazz, with a focus on how LOD can reveal information about female jazz musicians–an important but understudied element of jazz history.
Rice ontology
Emotion ontology
Ontologieën
Turtle biedt een systematiek om drie URI's steeds te groeperen tot een triple en op die manier informatie op te bouwen en de onderlinge relaties aan te geven.