SlideShare une entreprise Scribd logo
1  sur  14
Télécharger pour lire hors ligne
KAN IK OOIT OP MIJN DATA
VERTROUWEN?
27 nov 2019 | Heliview Dutch Data Forum | Erik Langius MSc | erik.langius@tno.nl
EVEN VOORSTELLEN…
Erik Langius MSc
ICT unit TNO – Researchafdeling Monitoring and Control Services
Integrator en projectleider: focus op multidisciplinaire integratie van kennis en
systemen.
Informatica & Technische Bedrijfskunde met IT specialisatie
System of System Engineering
LinkedIn: https://nl.linkedin.com/in/eriklangius
TNO ONDERZOEKSLIJNEN OP DATA GEBIED
5
Sharing Trust
Data
Value
Data interoperability
Controlled access
to available data
Sensemaking of Sensitive data
Reliable analysis of data
Digital validation
of information
HET BELANG VAN DATA QUALITY ASSURANCE (DQA)
Adviezen, besluitvorming en voorspellingen komen in toenemende mate uit datagedreven, complexe
en nauw verbonden IT-systemen
Data Quality Assurance gaat over zowel data kwaliteit als de kwaliteit van de dataverwerkende
systemen (analyses, modellen, etc)
Verificatie en Validatie
Past data en model bij het doel?
Is het systeem uitlegbaar? Zijn resultaten reproduceerbaar
en herleidbaar?
27 nov 2019 | Erik Langius | Kan ik ooit op mijn data vertrouwen?
KWALITEIT IN DE CONTEXT VAN DEZE PRESENTATIE
27 nov 2019 | Erik Langius | Kan ik ooit op mijn data vertrouwen?
Impactbijfalen
+
-
Analyse complexiteit
+
-
Complexe analyse
en data + hoge
impact bij falen:
rechtvaardigt
intensieve DQA
Eenvoudig data en
analyse:
minimale DQA
inrichten
De definitie van kwaliteit is
context afhankelijk en heeft een
sterke link met het doel van de
toepassing, is het fit-for-
purpose?
Bron: aangepast uit “The Aqua Book:
guidance on producing quality analysis
for government (2015)
NAUW VERBONDEN SYSTEMEN DOOR DATA
AFHANKELIJKHEDEN
Algemene trend: systeem complexiteit neemt toe, evenals de mate waarin we
moeten vertrouwen op deze data gedreven systemen.
Systemen krijgen eigenschappen die ontstaan door interactie (emergentie).
De inrichting van DQA moet volgen op de toegenomen complexiteit en emergente
eigenschappen kunnen monitoren.
Voorbeeld: bekend systeem in een nieuwe context
27 nov 2019 | Erik Langius | Kan ik ooit op mijn data vertrouwen?
INTERACTIES EN COMPLEXITEIT
27 nov 2019 | Erik Langius | Kan ik ooit op mijn data vertrouwen?
Bron: aangepast uit “Meltdown: Why
our systems fail and what we can do
about it” (2018: C Clearfield, A Tilcsik)
Matevanverbondenheid
+
-
Systeem complexiteit
+
-
Als er iets misgaat gaat
er snel meer mis.
Lage kans op falen
Data gedreven systemen raken
verbonden met hun omgeving
door gebruik van data
WAT KUNNEN WE DOEN?
Om complexiteit onder controle te houden moeten we monitoren op signalen die het systeem afgeeft
en continue de “fit” met de “purpose” controleren.
1) Is de data nog steeds geschikt voor ontworpen analyse/model ?
Continue monitoring op data eigenschappen en vereisten van de analyse
Fit-for-purpose van binnenkomende data
2) Is de analyse/model nog steeds passend bij de data?
Analyse is waarschijnlijk ontworpen op bestaande dataset
Is de analyse is het nog steeds fit-for-purpose met nieuwe data?
27 nov 2019 | Erik Langius | Kan ik ooit op mijn data vertrouwen?
Analyse lange
datareeksen en
verdeling van data
geeft snel overzicht
om eerste acties te
bepalen
350 SENSOREN, WELKE FUNCTIONEREN GOED?
27 nov 2019 | Erik Langius | Kan ik ooit op mijn data vertrouwen?
Analyse &
Model vereisten
EEN BETROUWBAAR DATASYSTEM VEREIST CONTINUE AANDACHT
27 nov 2019 | Erik Langius | Kan ik ooit op mijn data vertrouwen?
Complexe data verwerkingData door de tijd
Data Quality
Assurance
Indicators:
Trends:
!
Data geschikt
voor analyse?
Analyse geschikt
voor actuele data?
TAKEAWAYS…KAN IK OOIT OP MIJN DATA VERTROUWEN?
Fit-for-purpose DQA: inrichting proportioneel naar de potentiele impact van falen
Echter, “Fit-for-purpose” is geen statisch gegeven, DQA moet dan ook een continue en evaluerend
karakter hebben.
Is de binnenkomende data nog steeds geschikt voor de analyse?
Is de analyse nog steeds passend bij de binnenkomende data?
Resultaten zijn herleidbaar en traceerbaar: DQA inrichten voor de gehele levenscyclus van
ontwerp, resultaat en voor vragen na oplevering.
Versie beheer op code, data, configuratie en resultaten
Monitor data, analyse en realiteit geautomatiseerd om veranderende context en signalen te
detecteren om tijdig bij te kunnen sturen.
27 nov 2019 | Erik Langius | Kan ik ooit op mijn data vertrouwen?
GEVRAAGD!
TNO zoekt partners voor een gezamenlijk onderzoeksprogramma rondom monitoring van data kwaliteit
in continue (streaming) data
Doel: IT-tool ontwikkeling voor “Fit-for-purpose monitoring of timeserie data streams”
Interesse? contact: erik.langius@tno.nl
27 nov 2019 | Erik Langius | Kan ik ooit op mijn data vertrouwen?
WAAR WERKT TNO AAN?
https://www.tno.nl/nl/tno-insights/artikelen/hoe-controleer-je-de-betrouwbaarheid-van-data/
https://www.tno.nl/nl/samenwerken/expertise/early-research-programma/early-research-program-
making-sense-of-big-data/
https://www.tno.nl/nl/aandachtsgebieden/informatie-communicatie-technologie/roadmaps/data-
sharing/advanced-data-analytics/
https://www.tno.nl/nl/over-tno/nieuws/2019/3/tno-verbindt-nederland-met-europese-standaard-voor-
datadeling/
27 nov 2019 | Erik Langius | Kan ik ooit op mijn data vertrouwen?
BEDANKT VOOR UW AANDACHT
Voor meer inspiratie:
TNO.NL/TNO-INSIGHTS

Contenu connexe

Similaire à Kan ik ooit op mijn data vertrouwen?

20130527 jill dyche - im ronald [Dutch]
20130527   jill dyche - im ronald [Dutch]20130527   jill dyche - im ronald [Dutch]
20130527 jill dyche - im ronald [Dutch]Prudenza B.V
 
Politiedatamining met datadetective
Politiedatamining met datadetectivePolitiedatamining met datadetective
Politiedatamining met datadetectiveFrank Smilda
 
Software for big data - setting the scene
Software for big data -   setting the sceneSoftware for big data -   setting the scene
Software for big data - setting the sceneJurjen Helmus
 
Facto Congres 2017 - Big data en gebouwbeheer: een nieuwe werkelijkheid (Cas...
Facto Congres 2017 - Big data en gebouwbeheer: een nieuwe werkelijkheid  (Cas...Facto Congres 2017 - Big data en gebouwbeheer: een nieuwe werkelijkheid  (Cas...
Facto Congres 2017 - Big data en gebouwbeheer: een nieuwe werkelijkheid (Cas...Facto Magazine
 
De toekomst van datagedreven werken is nu
De toekomst van datagedreven werken is nuDe toekomst van datagedreven werken is nu
De toekomst van datagedreven werken is nuReinier Versluis
 
Digital twin by Özlem Avci
Digital twin by Özlem Avci Digital twin by Özlem Avci
Digital twin by Özlem Avci Özlem Avci
 
Fex 131104 - presentatie innervate - masterclass cloud ict flevum executive
Fex   131104 - presentatie innervate - masterclass cloud ict flevum executiveFex   131104 - presentatie innervate - masterclass cloud ict flevum executive
Fex 131104 - presentatie innervate - masterclass cloud ict flevum executiveFlevum
 
Digital twin (artificial intelligence)
Digital twin (artificial intelligence) Digital twin (artificial intelligence)
Digital twin (artificial intelligence) Özlem Avci
 
Software als enabler voor slimmer ondernemen in de KMO
Software als enabler voor slimmer ondernemen in de KMOSoftware als enabler voor slimmer ondernemen in de KMO
Software als enabler voor slimmer ondernemen in de KMOAlex Dossche
 
10 trend in IT automation
10 trend in IT automation10 trend in IT automation
10 trend in IT automationRob Akershoek
 
Posthuma Partners Data analyse software insurers
Posthuma Partners Data analyse software insurersPosthuma Partners Data analyse software insurers
Posthuma Partners Data analyse software insurersMarc Dijkstra
 
Informatiebroker voor betrouwbare en transparante stuurinformatie
Informatiebroker voor betrouwbare en transparante stuurinformatieInformatiebroker voor betrouwbare en transparante stuurinformatie
Informatiebroker voor betrouwbare en transparante stuurinformatieCarlijn Hoogvliet
 
Wat gebeurt er in “Data(keten)land”?
Wat gebeurt er in “Data(keten)land”?Wat gebeurt er in “Data(keten)land”?
Wat gebeurt er in “Data(keten)land”?Sjaak Wolfert
 
UvAConext en standaarden voor het primaire onderwijs proces
UvAConext en standaarden voor het primaire onderwijs procesUvAConext en standaarden voor het primaire onderwijs proces
UvAConext en standaarden voor het primaire onderwijs procesUniversity of Amsterdam
 
Toepassingen voor het onderwijs
Toepassingen voor het onderwijsToepassingen voor het onderwijs
Toepassingen voor het onderwijsDelta-N
 
ROC Aventus en Cloud Computing
ROC Aventus en Cloud ComputingROC Aventus en Cloud Computing
ROC Aventus en Cloud ComputingJoël Bruijn
 

Similaire à Kan ik ooit op mijn data vertrouwen? (20)

20130527 jill dyche - im ronald [Dutch]
20130527   jill dyche - im ronald [Dutch]20130527   jill dyche - im ronald [Dutch]
20130527 jill dyche - im ronald [Dutch]
 
Politiedatamining met datadetective
Politiedatamining met datadetectivePolitiedatamining met datadetective
Politiedatamining met datadetective
 
Smart lean introductie
Smart lean introductie Smart lean introductie
Smart lean introductie
 
Software for big data - setting the scene
Software for big data -   setting the sceneSoftware for big data -   setting the scene
Software for big data - setting the scene
 
Facto Congres 2017 - Big data en gebouwbeheer: een nieuwe werkelijkheid (Cas...
Facto Congres 2017 - Big data en gebouwbeheer: een nieuwe werkelijkheid  (Cas...Facto Congres 2017 - Big data en gebouwbeheer: een nieuwe werkelijkheid  (Cas...
Facto Congres 2017 - Big data en gebouwbeheer: een nieuwe werkelijkheid (Cas...
 
De toekomst van datagedreven werken is nu
De toekomst van datagedreven werken is nuDe toekomst van datagedreven werken is nu
De toekomst van datagedreven werken is nu
 
Digital twin by Özlem Avci
Digital twin by Özlem Avci Digital twin by Özlem Avci
Digital twin by Özlem Avci
 
Digital twin
Digital twinDigital twin
Digital twin
 
Digital twin
Digital twinDigital twin
Digital twin
 
Fex 131104 - presentatie innervate - masterclass cloud ict flevum executive
Fex   131104 - presentatie innervate - masterclass cloud ict flevum executiveFex   131104 - presentatie innervate - masterclass cloud ict flevum executive
Fex 131104 - presentatie innervate - masterclass cloud ict flevum executive
 
Digital twin (artificial intelligence)
Digital twin (artificial intelligence) Digital twin (artificial intelligence)
Digital twin (artificial intelligence)
 
Software als enabler voor slimmer ondernemen in de KMO
Software als enabler voor slimmer ondernemen in de KMOSoftware als enabler voor slimmer ondernemen in de KMO
Software als enabler voor slimmer ondernemen in de KMO
 
10 trend in IT automation
10 trend in IT automation10 trend in IT automation
10 trend in IT automation
 
Posthuma Partners Data analyse software insurers
Posthuma Partners Data analyse software insurersPosthuma Partners Data analyse software insurers
Posthuma Partners Data analyse software insurers
 
Informatiebroker voor betrouwbare en transparante stuurinformatie
Informatiebroker voor betrouwbare en transparante stuurinformatieInformatiebroker voor betrouwbare en transparante stuurinformatie
Informatiebroker voor betrouwbare en transparante stuurinformatie
 
Wat gebeurt er in “Data(keten)land”?
Wat gebeurt er in “Data(keten)land”?Wat gebeurt er in “Data(keten)land”?
Wat gebeurt er in “Data(keten)land”?
 
Iot in de zorg the next step - fit for purpose
Iot in de zorg   the next step - fit for purpose Iot in de zorg   the next step - fit for purpose
Iot in de zorg the next step - fit for purpose
 
UvAConext en standaarden voor het primaire onderwijs proces
UvAConext en standaarden voor het primaire onderwijs procesUvAConext en standaarden voor het primaire onderwijs proces
UvAConext en standaarden voor het primaire onderwijs proces
 
Toepassingen voor het onderwijs
Toepassingen voor het onderwijsToepassingen voor het onderwijs
Toepassingen voor het onderwijs
 
ROC Aventus en Cloud Computing
ROC Aventus en Cloud ComputingROC Aventus en Cloud Computing
ROC Aventus en Cloud Computing
 

Kan ik ooit op mijn data vertrouwen?

  • 1. KAN IK OOIT OP MIJN DATA VERTROUWEN? 27 nov 2019 | Heliview Dutch Data Forum | Erik Langius MSc | erik.langius@tno.nl
  • 2. EVEN VOORSTELLEN… Erik Langius MSc ICT unit TNO – Researchafdeling Monitoring and Control Services Integrator en projectleider: focus op multidisciplinaire integratie van kennis en systemen. Informatica & Technische Bedrijfskunde met IT specialisatie System of System Engineering LinkedIn: https://nl.linkedin.com/in/eriklangius
  • 3. TNO ONDERZOEKSLIJNEN OP DATA GEBIED 5 Sharing Trust Data Value Data interoperability Controlled access to available data Sensemaking of Sensitive data Reliable analysis of data Digital validation of information
  • 4. HET BELANG VAN DATA QUALITY ASSURANCE (DQA) Adviezen, besluitvorming en voorspellingen komen in toenemende mate uit datagedreven, complexe en nauw verbonden IT-systemen Data Quality Assurance gaat over zowel data kwaliteit als de kwaliteit van de dataverwerkende systemen (analyses, modellen, etc) Verificatie en Validatie Past data en model bij het doel? Is het systeem uitlegbaar? Zijn resultaten reproduceerbaar en herleidbaar? 27 nov 2019 | Erik Langius | Kan ik ooit op mijn data vertrouwen?
  • 5. KWALITEIT IN DE CONTEXT VAN DEZE PRESENTATIE 27 nov 2019 | Erik Langius | Kan ik ooit op mijn data vertrouwen? Impactbijfalen + - Analyse complexiteit + - Complexe analyse en data + hoge impact bij falen: rechtvaardigt intensieve DQA Eenvoudig data en analyse: minimale DQA inrichten De definitie van kwaliteit is context afhankelijk en heeft een sterke link met het doel van de toepassing, is het fit-for- purpose? Bron: aangepast uit “The Aqua Book: guidance on producing quality analysis for government (2015)
  • 6. NAUW VERBONDEN SYSTEMEN DOOR DATA AFHANKELIJKHEDEN Algemene trend: systeem complexiteit neemt toe, evenals de mate waarin we moeten vertrouwen op deze data gedreven systemen. Systemen krijgen eigenschappen die ontstaan door interactie (emergentie). De inrichting van DQA moet volgen op de toegenomen complexiteit en emergente eigenschappen kunnen monitoren. Voorbeeld: bekend systeem in een nieuwe context 27 nov 2019 | Erik Langius | Kan ik ooit op mijn data vertrouwen?
  • 7. INTERACTIES EN COMPLEXITEIT 27 nov 2019 | Erik Langius | Kan ik ooit op mijn data vertrouwen? Bron: aangepast uit “Meltdown: Why our systems fail and what we can do about it” (2018: C Clearfield, A Tilcsik) Matevanverbondenheid + - Systeem complexiteit + - Als er iets misgaat gaat er snel meer mis. Lage kans op falen Data gedreven systemen raken verbonden met hun omgeving door gebruik van data
  • 8. WAT KUNNEN WE DOEN? Om complexiteit onder controle te houden moeten we monitoren op signalen die het systeem afgeeft en continue de “fit” met de “purpose” controleren. 1) Is de data nog steeds geschikt voor ontworpen analyse/model ? Continue monitoring op data eigenschappen en vereisten van de analyse Fit-for-purpose van binnenkomende data 2) Is de analyse/model nog steeds passend bij de data? Analyse is waarschijnlijk ontworpen op bestaande dataset Is de analyse is het nog steeds fit-for-purpose met nieuwe data? 27 nov 2019 | Erik Langius | Kan ik ooit op mijn data vertrouwen?
  • 9. Analyse lange datareeksen en verdeling van data geeft snel overzicht om eerste acties te bepalen 350 SENSOREN, WELKE FUNCTIONEREN GOED? 27 nov 2019 | Erik Langius | Kan ik ooit op mijn data vertrouwen?
  • 10. Analyse & Model vereisten EEN BETROUWBAAR DATASYSTEM VEREIST CONTINUE AANDACHT 27 nov 2019 | Erik Langius | Kan ik ooit op mijn data vertrouwen? Complexe data verwerkingData door de tijd Data Quality Assurance Indicators: Trends: ! Data geschikt voor analyse? Analyse geschikt voor actuele data?
  • 11. TAKEAWAYS…KAN IK OOIT OP MIJN DATA VERTROUWEN? Fit-for-purpose DQA: inrichting proportioneel naar de potentiele impact van falen Echter, “Fit-for-purpose” is geen statisch gegeven, DQA moet dan ook een continue en evaluerend karakter hebben. Is de binnenkomende data nog steeds geschikt voor de analyse? Is de analyse nog steeds passend bij de binnenkomende data? Resultaten zijn herleidbaar en traceerbaar: DQA inrichten voor de gehele levenscyclus van ontwerp, resultaat en voor vragen na oplevering. Versie beheer op code, data, configuratie en resultaten Monitor data, analyse en realiteit geautomatiseerd om veranderende context en signalen te detecteren om tijdig bij te kunnen sturen. 27 nov 2019 | Erik Langius | Kan ik ooit op mijn data vertrouwen?
  • 12. GEVRAAGD! TNO zoekt partners voor een gezamenlijk onderzoeksprogramma rondom monitoring van data kwaliteit in continue (streaming) data Doel: IT-tool ontwikkeling voor “Fit-for-purpose monitoring of timeserie data streams” Interesse? contact: erik.langius@tno.nl 27 nov 2019 | Erik Langius | Kan ik ooit op mijn data vertrouwen?
  • 13. WAAR WERKT TNO AAN? https://www.tno.nl/nl/tno-insights/artikelen/hoe-controleer-je-de-betrouwbaarheid-van-data/ https://www.tno.nl/nl/samenwerken/expertise/early-research-programma/early-research-program- making-sense-of-big-data/ https://www.tno.nl/nl/aandachtsgebieden/informatie-communicatie-technologie/roadmaps/data- sharing/advanced-data-analytics/ https://www.tno.nl/nl/over-tno/nieuws/2019/3/tno-verbindt-nederland-met-europese-standaard-voor- datadeling/ 27 nov 2019 | Erik Langius | Kan ik ooit op mijn data vertrouwen?
  • 14. BEDANKT VOOR UW AANDACHT Voor meer inspiratie: TNO.NL/TNO-INSIGHTS