Data is de nieuwe haarlemmerolie. Organisaties willen datagedreven worden en hun beslissingen baseren op feiten. Ze willen kunstmatige intelligentie, machine learning en deep learning inzetten om diepere inzichten te halen uit hun data. Dit alles veronderstelt dat duidelijk is wat de data betekent en juist daar gaat het vaak fout. Woorden en hun definitie zijn de basis voor datamanagement. In deze presentatie geeft Danny een overzicht van datamanagement en de rol van thesauri daarbinnen.
3. Thesaurus als linked data
<skos:Concept rdf:about="https://begrippen.archixl.nl/archixl/nl/page/Thesaurus">
<skos:prefLabel xml:lang="nl">ArchiXL thesaurus</skos:prefLabel>
<skos:altLabel xml:lang="nl">Betekeniswoordenboek</skos:altLabel>
<skos:definition xml:lang="nl">Een verzameling begrippen uitgedrukt in termen,
definities en relaties.</skos:definition>
<skos:scopeNote xml:lang="nl">Een thesaurus verbindt begrippen door
hiërarchische, equivalente en associatieve relaties. Je kunt een thesaurus
gebruiken om het exacte woord voor een voorwerp of met de gewenste connotatie
te vinden.</skos:scopeNote>
<skos:example xml:lang="nl">Aquo, Brinkman trefwoorden thesaurus</skos:example>
<skos:exactMatch rdf:resource="http://dbpedia.org/page/Thesaurus"/>
</skos:Concept>
5. DAMA Datamanagement Body of Knowledge
Business Glossary
Enable common
understanding of the core
business concepts;
Associate data assets
with glossary terms;
Improve the alignment
between technology assets
and the business organization;
Maximize search capability and
enable access to knowledge.
Index, categorize, tag, sort, and
retrieve content through
browsing and searching;
Organize unstructured
content;
Uncover relationships between
content from different media;
Improve website navigation
& optimize search.
Thesaurus
6. Verbinden van begrippen aan andere objecten
Begrip
Document/ web content
Applicatie
Bedrijfsregel
API specificatie
Database definitie
Datamodel
Dataset
Dashboard/rapportage
7. Begrippen en data lineage - wat betekent de data?
Wet- en regelgeving zoals PERDARR/BCBS239 vraagt expliciet om
begrippen:
• As a precondition, a bank should have a “dictionary” of the concepts used, such that data
is defined consistently across an organization
• A bank should develop an inventory and classification of risk data items which includes a
reference to the concepts used to elaborate the reports.
Data Data Data
Begrippen Begrippen Begrippen
Rapportage
Horizontale data lineage
Verticaledatalineage
11. Samenvattend
• Een thesaurus geeft betekenis aan woorden
• Begrippen kun je verbinden zodat je
daarna dingen kunt vinden
• Data lineage geeft inzicht in betekenis
en herkomst van data
• Open data vraagt om een thesaurus
gebaseerd op open standaarden
• SKOS is de logische basis voor thesauri
• Laten we de term business glossary uit de
thesaurus verwijderen