In deze lezing lichten we aan de hand van twee compleet verschillende use cases toe hoe CZ data science inzet. Van het destilleren van zorgpaden tot aan het routeren van een inkomende adreswijziging. Op deze wijze geven we invulling aan onze missie ‘alles voor betere zorg’.
10. Voorbeeldmail
10
Onderwerp: Toestemmingsformulier J. Jansen
Body: Geachte heer, mevrouw, Als financieel dienstverlener ben ik betrokken
bij de financiële administratie van: J. Jansen wonende te Dorpstraat 1, 1234 AB,
Oss. Geboortedatum: 01/02/1980, telefoonnummer 06-12345678. Het XXXXXX
is een instelling die cliënten onder andere begeleidt bij het scheppen van orde in
hun financiële administratie en die samen met de cliënten naar een oplossing
zoekt voor hun schuldenproblematiek. Vanuit deze betrokkenheid zal ik dan ook
op korte termijn contact met u opnemen. Omdat ik weet dat hiervoor een
machtiging van de heer Jansen noodzakelijk is, stuur ik u deze in de bijlage toe
ter verwerking in zijn dossier.
Met vriendelijke groet,
Marjan de Beer Financieel Dienstverlener
Voorbeeld bevat geen
echte klantgegevens!
11. Een eerste stap is het opschonen van de teksten van de emails
11
Onderwerp: toestemmingsformulier naam
Body: geachte heer mevrouw als financieel dienstverlener ben ik betrokken bij
de financiële administratie van naam wonende te adres postcode woonplaats
geboortedatum geb_datum telefoonnummer tel_nummer het xxxxxx is een
instelling die cliënten onder andere begeleidt bij het scheppen van orde in hun
financiële administratie en die samen met de cliënten naar een oplossing zoekt
voor hun schuldenproblematiek vanuit deze betrokkenheid zal ik dan ook op
korte termijn contact met u opnemen omdat ik weet dat hiervoor een machtiging
van de naam noodzakelijk is stuur ik u deze in de bijlage toe ter verwerking in
zijn dossier met vriendelijke groet marjan de beer financieel dienstverlener
Voorbeeld bevat geen
echte klantgegevens!
15. De resultaten van dit prototype hebben er toe geleid dat algoritme wordt
geimplementeerd binnen CZ
• 80% accuracy predicting target mail box
• 68% customer correctly identified (Humans scored: 81% )
Goedemorgen CZ Team, Hierbij delen wij u mee dat onderstaande verzekerde bij ons uit dienst is gegaan per
03.09.2017 wegens pensionering. polisnummer 123456789 tnv C van den Hout Wilt u zo vriendelijk zijn de
verzekering voor de heer van den Hout in onze collectieve verzekering te stoppen voor de resterende periode van dit
jaar? Met vriendelijke groet, Elly Jansen Sr Specialist
Verzekerden
22. Drie verschillende methodes geëxploreerd
22
Vergelijking met
andere groep patiënten
Met medische kennis
groepen vergelijken
Datagedreven groepen
vergelijken
23. In de eerste methode hebben we gezocht naar een vergelijkbare groep
patiënten en gefocust op de verschillen
Conclusies:
• De statistische methode is simpel en redelijk
snel
• Er is nog veel domeinkennis voor nodig
• Het vinden van een vergelijkbare groep is
lastig met onze data
• Resultaten geven inzicht in wat er in
zorgpad zit
23
Vergelijking met
andere groep patiënten
24. Daarna hebben we met input van MA gekeken naar verschillende
groepen van patienten
24
Met medische kennis
groepen vergelijken
Conclusies:
• Clusters vergelijken met behulp van
maximum common subgraph
• Makkelijk vinden van relevante declaraties
• Veel domeinkennis nodig
• Geeft veel informatie over
• type zorg,
• hoeveelheid per type,
• hoeveelheid patienten
• enigzins de volgorde
25. Tot slot hebben we het maken van de groepen geautomatiseerd
door een clustering techniek
25
Datagedreven groepen
vergelijken
Conclusies:
• Eerst datadriven clusteren per ziekte
• Daarna maar maximum common subgraph
net als bij methode 2
• Minder tot geen domeinkennis door inzet
van spectral clustering
• Kan ook andere inzichten geven