1. Crowdsourcen van metadata
voor audiovisuele collecties
van vrije tekst annotaties naar semantische concepten
Lotte Belice Baltussen – Beeld en Geluid
Michiel Hildebrand – Vrije Universiteit Amsterdam
4 november 2011 | AVA_Net Najaarscongres
2.
3. Classificatie en tagging
Maakt het mogelijk om
spelenderwijs audiovisueel
archiefmateriaal te beschrijven
4. Meerwaarde
• Tijd-gerelateerde metadata
• Social tagging (overbruggen semantic gap)
• Interactie tussen archief / omroep en publiek
• Verzamelen van data voor verder onderzoek
• Efficiëntie?
• video annoteren duurt 5 x de lengte van de video
• Nieuw verdienmodel?
8
5. Partners pilot
• Nederlands Instituut voor Beeld en Geluid
(project management, content, research)
• KRO (concept, content, PR)
• VU (research binnen PrestoPRIME)
• Q42 (ontwikkelaar)
6. Man bijt hond Woordentikkertje
Na evaluatie:
• Verbeterde interface
• Nieuwe scoringmechanismes (semantiek)
• Nieuwe content
• Meer feedback
10. Hoe werkt het?
Scoren:
• Basisregel – spelers scoren
punten wanneer hun tag binnen
10 seconden exact overeenkomt
met die van een andere speler
• Meerdere andere scoring
mechanismen om taggen verder
te stimuleren
12. Uitdaging: constante stroom aan bezoekers genereren.
Belangrijk: Partners, vermeldingen op externe websites
met veel bezoekers
Voorbeeld BzV, in één week:
•Aantal tags verdrievoudigd
naar 160.000
• Aantal spelers verdubbeld
naar 362
14. Evaluatie
av-documentalist
• Tags beschrijven voornamelijk korte fragmenten en zijn vaak
niet erg specifiek. Ze beschrijven niet programma’s als
geheel.
• MAAR! Kan worden opgelost door te filteren en te mappen
naar bestaande vocabulaires.
• De WNW tags waren het meest bruikbaar en specifiek;
content beïnvloedt specificiteit.
• Tags kunnen op verschillende manieren worden ingezet en
hebben verschillende relevantie voor verschillende groepen.
• Documentalisten kijken uit naar verdere ontwikkelingen.
18. Waisda? Woordentikkertje
Maanden 8 3,5
Video’s 648 2.556
Spelers 2.435 537
Tags – totaal 428.832 327.935
Tags – uniek 48.242 (11%) 37.757 (12%)
Matches
• Spelers • 156.546 (37%) • 167.948 (51%)
• Geo. namen* • 6.089 (1,4%) • 20.213 (6,2%)
• Personen* • 107 (0,25%) • 2.122 (0,6%)
* Bij Waisda? is gekeken naar unieke tags, bij Woordentikkertje is gekeken naar totaal aantal tags
19. Tips en lessons learned
• Wat wil je bereiken?
• Bestaande rapporten en literatuur.
• Wat is je doelgroep?
• Hoe motiveer je gebruikers?
• Hoe evalueer je / succescriteria?
• Blijf verbeteren!