Nemo ontwikkelt niet-invasieve technologieën voor foetale monitoring. Haar oplossingen zijn gericht op veiligheid en comfort voor moeder en kind en de best mogelijke informatie op het juiste moment voor artsen. Nemo heeft Gimix gevraagd kunstmatige intelligentie te ontwikkelen om, in combinatie met hun technologie, gynaecologen te ondersteunen tijdens de bevalling.
Booking.com - Data science and experimentation at Booking.com: a data-driven ...
Gimix - A.I. kan levens redden door nood bij het ongeboren kind vroegtijdig te herkennen
1. A.I. KAN LEVENS REDDEN DOOR VROEGTIJDIGE
SIGNALERING VAN FOETALE NOOD
Big Data Expo 2018 – Rik Vullings (Nemo) & Martijn van Grieken (Gimix)
2. NEXT GENERATION FETAL MONITORING
A.I. kan levens redden
door vroegtijdige
detectie van foetale
nood
Dr.ir. R. Vullings
CSO Nemo Healthcare
Assistant Professor Eindhoven University of Technology
Big data expo 20-09-2018
3. 1 op 5 zwangerschappen is gecompliceerd:
• Vroeggeboorte
• Zuurstofnood
• Groeivertraging
• Aangeboren afwijkingen
• >2k gevallen per jaar in NL
• Overlevers afhankelijk van zorg gedurende rest
van hun leven 1M€ zorgkosten per overlever
Problemen tijdens zwangerschap
Bij tijdige diagnose kan schade door
zuurstoftekort voorkomen worden
A.I. kan levens redden – Big Data Expo 2018
4. Diagnose op basis van cardiotocogram (CTG)
4
10 minuten
A.I. kan levens redden – Big Data Expo 2018
5. CTG metingen
5
Externe methode
Externe methode:
Onbetrouwbaar en
onnauwkeurig
Inwendige methode:
risicovol en (te) laat
Inwendige methode
Tijdige diagnose is niet (altijd) mogelijk
met bestaande technologie
A.I. kan levens redden – Big Data Expo 2018
6. Gevolgen van slechte informatie
6
Onnodig medisch ingrijpen
Langdurige opnames
Duur
Kwaliteit van leven
Bedden in gebruik
Keizersnede
Hoge kosten
Hoge risico’s
Betere technologie is
dringend nodig:
• Betrouwbaar
• Veilig
• Extra informatie
A.I. kan levens redden – Big Data Expo 2018
7. Oplossing Nemo Healthcare
7
“Kwaliteit van inwendige methode met
comfort van externe methode”
• Ontstaan uit wetenschappelijk
onderzoek TU/e en MMC
• Nauwkeurig, veilig, breed toepasbaar,
comfortabel, draadloos, draagbaar,
waterbestendig, …
A.I. kan levens redden – Big Data Expo 2018
12. Is het probleem nu opgelost?
• Goede kwaliteit van informatie is slechts eerste deel van de oplossing
• Inter-observer (en zelfs intra-observer) variabiliteit: experts zijn het oneens
• CTG is niet specifiek genoeg
12
25 min later:
pHart = 7.05
BDecf = 16
A.I. kan levens redden – Big Data Expo 2018
13. Logische stappen naar een oplossing
1. Extra informatie toevoegen
– Foetaal electrocardiogram (“hartfilmpje)”
– Foetale hartritme variabiliteit
2. Objectieve en betere interpretatie van het CTG
–Voornamelijk conceptueel, geen strikte wiskundige regels
–Ervaring telt
–Onbekende patronen op lange/korte tijdschaal?
13
A.I.
A.I. kan levens redden – Big Data Expo 2018
18. Business
Understanding
CRISP-DM
Aanpak (concreet)
• Business case NEMO
• Huidige situatie
Hoe wordt momenteel gemonitord?
Toepassing van Machine Learning?
• Domeinkennis
Literatuurstudie Fetal monitoring,
CTG
Interviews met gynaecologen
Basiscursus verloskunde
Definitiestudie: gezond / ongezond /
pH / Apgar score
• Opstellen projectplan
19. Resultaten & uitdagingen
Business case
• Nemo CTG systeem nog
intelligenter maken
Doel
• Voorspellen van foetale
conditie op basis van CTG-
data: gezond/ongezond of
Apgar score (0 t/m 10)
Risico’s
• Meetbaarheid
• Beschikbaarheid voldoende
gelabelde data (met name de
“probleemsituaties”)
20. Data
Understanding
CRISP-DM
Dataset – CTG opnames
• 5889 CTG cases (FHR + TOCO)
• 1273 gelabeld (Apgar score + pH)
• 12 slechte gevallen (!)
Data kwaliteit
• Storingen: slechte verbinding, draaien
moeder, aanleggen apparatuur, kalibratie
• Onderbrekingen: bijv. toiletbezoek
moeder
• Begin/einde onduidelijk
• Niet representatief (ingreep)
Onderbrekingen in het FHR signaal
Onjuiste kalibratie van de TOCO meting
Geen signal, onduidelijk wanneer de geboorte plaatsvind
21. Uitdagingen
• Apgar score mogelijk niet
betrouwbaar
– bias, subjectieve methode
• Zit het antwoord altijd in de
data?
– Goede CTG/slechte uitkomst
– Risicovolle CTG met goede
uitkomst
• 12 slechte gevallen!
– Ongebalanceerde set
– Onvoldoende case voor
supervised machine learning
– Onvoldoende cases voor een
betrouwbare validatie van het
model
22. Data Preparation
CRISP-DM
Aanpak (concreet)
• Conversie:
CTG logs MatLab Numpy
• Opschonen
Uitsluiten hartfalen, medicatie,
Uitsluiten ingreep (mogelijk slechte uitkomst te
wijten aan de ingreep)
• Ontbrekende data ‘corrigeren’
Uitsluiten lang onderbroken CTG’s
Uitsluiten te korte CTG’s
• Normaliseren/schalen
FHR en TOCO interpoleren naar vaste
frequentie
• Construeren
Interpolatie van (kort) onderbroken signalen
Noise cancellation filter (meetfouten afvlakken)
23. Uitdagingen
• Is de validatie set nog wel
representatief na het
verwijderen en wijzigen van de
brondata?
• Er is mogelijk relevante
informatie verloren door het
interpoleren en het verwijderen
van noise in de signalen
• Het uitsluiten van de
irrelevante en onzekere
CTG’s, resulteert in slechts 12
bruikbare “slechte
uitkomsten”.
24. Modeling
CRISP-DM
Aanpak (concreet)
Bepalen van relevante features:
• Bekende features uit de literatuur
• Features uit interviews
• Enginered feature analysis
• Wavelet transformatie
• FFT/PSD (Power Spectral Density)/ Autocorrelation
• Correlatie met standard signal processing features
• Gegenereerde features d.m.v. een autoencoder
netwerk
Relevante features zijn gebruikt om een lage
Apgar score of een lage arteriële pH te
voorspellen obv:
• Machine Learning algoritme (RNN/CNN)
• Outlier detectie
• Combinatie van modellen (bijv. decision trees)
Features uit de literatuur
• FHR variantie
• Type (vroege en late) deceleratie
• Kenmerken van deceleratie (lengte, hoogte, oppervlakte)
• Aanwezigheid van acceleratie
• Aantal weeën in een bepaalde tijdsperiode
Features uit interviews
• Baseline drift FHR
Engineered features
• Verdeling van de FHR variantie
Baseline drift FHR versus FHR variantie
2 Features (onafhankelijk)
- 2,1% van gebruikte set
heeft slechte uitkomst
- 17,3% van gemarkeerde
set heeft slechte uitkomst
- Max TP / Min FN (SVM)
25. Conclusies en aanbevelingen
Beperkingen
• ML is niet mogelijk door het
beperkt aantal slechte
uitkomsten
• De kwaliteit van het algoritme
is lastig te beoordelen zonder
referentiekader
• Veel onderbrekingen en
storingen in de CTG’s
• Marktconforme features vaak
niet concreet/kwantitatief
Aanbevelingen
• De kwaliteit van het algoritme
toetsen door te vergelijken met
specialisten
• Gebruik maken van
probleemgebieden in de CTG’s
• Gebruik maken van kennis van
(meerdere) specialisten
• Combineren van features (bv
long term/ short term)
26. Next steps in
our journey
• Meer ‘reguliere’ data
• Data van Nemo-
apparatuur
• Voorspellen van arteriële
pH en niet Apgar score
• Objectieve toetsing hoe
“goed” het algoritme is
(bijv. beter dan een
gynaecoloog met >2 jaar
ervaring)
28. BEDANKT
Big Data Expo 2018
Rik Vullings (Nemo) & Martijn van Grieken (Gimix)
Dappre MvG
Notes de l'éditeur
Waarom extra informatie? Daar kom ik zo op terug
Heb dit CTG eerder aan een publiek van de meest vooraanstaande gynaecologen van de wereld laten zien met de vraag wat zij zouden doen op dit moment. Ze waren het veelal oneens, maar niemand zou op dit moment ingrijpen. Helaas bleek 25 minuten later….
Leg kort uit wat pH en BD betekenen en dat dit kwantitatieve uitkomstmaten voor zuurstofnood zijn (heeft Martijn daarna waarschijnlijk nodig)
Cross Industry Standard Process for Data Mining
Business Understanding: Wat is het doel, de situatie en het plan?
Data Understanding: Data verzamelen, verkennen en kwaliteit verifiëren
Data Preperation: Data converteren, schalen, selecteren en opschonen
Modelling: Selecteren van techniek (Signal Processing, Machine Learning) en toetsingsmethodiek
Evaluation: Laboratorium testen
Deployment: Integratie in de bedrijfsprocessen
https://www.youtube.com/watch?v=nNc_q08yWxw
https://data.sngular.team/en/art/48/crisp-dm-phase-i-business-understanding
https://www.the-modeling-agency.com/crisp-dm.pdf
https://www.youtube.com/watch?v=civLio11SjQ
Cross Industry Standard Process for Data Mining
Business Understanding: Wat is het doel, de situatie en het plan?
Data Understanding: Data verzamelen, verkennen en kwaliteit verifiëren
Data Preperation: Data converteren, schalen, selecteren en opschonen
Modelling: Selecteren van techniek (Signal Processing, Machine Learning) en toetsingsmethodiek
Evaluation: Laboratorium testen
Deployment: Integratie in de bedrijfsprocessen
https://www.youtube.com/watch?v=nNc_q08yWxw
https://data.sngular.team/en/art/48/crisp-dm-phase-i-business-understanding
https://www.the-modeling-agency.com/crisp-dm.pdf
https://www.youtube.com/watch?v=civLio11SjQ
Cross Industry Standard Process for Data Mining
Business Understanding: Wat is het doel, de situatie en het plan?
Data Understanding: Data verzamelen, verkennen en kwaliteit verifiëren
Data Preperation: Data converteren, schalen, selecteren en opschonen
Modelling: Selecteren van techniek (Signal Processing, Machine Learning) en toetsingsmethodiek
Evaluation: Laboratorium testen
Deployment: Integratie in de bedrijfsprocessen
https://www.youtube.com/watch?v=nNc_q08yWxw
https://data.sngular.team/en/art/48/crisp-dm-phase-i-business-understanding
https://www.the-modeling-agency.com/crisp-dm.pdf
https://www.youtube.com/watch?v=civLio11SjQ
Cross Industry Standard Process for Data Mining
Business Understanding: Wat is het doel, de situatie en het plan?
Data Understanding: Data verzamelen, verkennen en kwaliteit verifiëren
Data Preperation: Data converteren, schalen, selecteren en opschonen
Modelling: Selecteren van techniek (Signal Processing, Machine Learning) en toetsingsmethodiek
Evaluation: Laboratorium testen
Deployment: Integratie in de bedrijfsprocessen
https://www.youtube.com/watch?v=nNc_q08yWxw
https://data.sngular.team/en/art/48/crisp-dm-phase-i-business-understanding
https://www.the-modeling-agency.com/crisp-dm.pdf
https://www.youtube.com/watch?v=civLio11SjQ
Cross Industry Standard Process for Data Mining
Business Understanding: Wat is het doel, de situatie en het plan?
Data Understanding: Data verzamelen, verkennen en kwaliteit verifiëren
Data Preperation: Data converteren, schalen, selecteren en opschonen
Modelling: Selecteren van techniek (Signal Processing, Machine Learning) en toetsingsmethodiek
Evaluation: Laboratorium testen
Deployment: Integratie in de bedrijfsprocessen
https://www.youtube.com/watch?v=nNc_q08yWxw
https://data.sngular.team/en/art/48/crisp-dm-phase-i-business-understanding
https://www.the-modeling-agency.com/crisp-dm.pdf
https://www.youtube.com/watch?v=civLio11SjQ