1. B2B DATA QUALITY
DM Update Seminar
12 maart 2010
Presentation given by Spectron Business SolutionsmaartDM Institute
B2B Data Quality DM Update Seminar 12 for 2010 1
2. AGENDA
• Wat is Data Quality?
• B2B markt in België
• Veranderingen in B2B gegevens
• Oplossingen intern en extern
B2B Data Quality DM Update Seminar 12 maart 2010 2
3. WAT IS DATA QUALITY?
• Algemene definitie
• Oorzaken
• Problemen
• Uitdagingen
B2B Data Quality DM Update Seminar 12 maart 2010 3
4. Algemene definitie
DATA QUALITY
2. The state of completeness, validity, consistency, timelessness and accuracy that
makes data appropriate for specific use.
B2B Data Quality DM Update Seminar 12 maart 2010 4
5. Algemene definitie
DATA QUALITY
• Completeness (volledigheid): is alle nodige informatie
aanwezig?
Jur. Vorm Bedrijfsnaam Taal Straat Huisnr Postcode Woonplaats Ond. Nr Tel.
Kellogs Benelux NL Belgicastraat 7/10 1930 Zaventem
SA Delhaize Group FR Rue Osseghem 53 1080 Bruxelles 546.99.99.001
NV Copimex NL Bilkensveld 2 1500 Halle 2899999999
Restaurant Torenhuyze NL Rijkestraat 10 9968 Oost-Eeklo 09/373.43.63
Statu Quo FR rue de Schaerbeek 42 6660 Houffalize +32/61.28.97.23
NV DKV Belgium Bisschofsheimlaan 1-8 1000 Brussel
NV Fortis Bank NL Warandeberg 1000 Brussel 403.199.702
SA AG Insurance NL E.Jacqmainlaan 53 1000 Bruxelles 0404494849
NV KBC Autolease NL Telecomlaan 8 1831 Diegem 02/722.77.77
Source: The Data Warehousing Institute, 2002
B2B Data Quality DM Update Seminar 12 maart 2010 5
6. Algemene definitie
DATA QUALITY
• Validity (validiteit): vallen de data waarden binnen de
aanvaardbare normen van uw business/sector?
Jur. Vorm Bedrijfsnaam Taal Straat Huisnr Postcode Woonplaats Ond. Nr Tel.
Kellogs Benelux Belgicastraat 7/10 1930 Zaventem
SA Delhaize Group FR Rue Osseghem 53 1080 Bruxelles 546.99.99.001
NV Copimex NL Bilkensveld 2 1500 Halle 2899999999
Restaurant Torenhuyze NL Rijkestraat 10 9968 Oost-Eeklo 09/373.43.63
Statu Quo FR rue de Schaerbeek 42 6660 Houffalize +32/61.28.97.23
NV DKV Belgium Bisschofsheimlaan 1-8 1000 Brussel
NV Fortis Bank Warandeberg 1000 Brussel 403.199.702
SA AG Insurance NL E.Jacqmainlaan 53 1000 Bruxelles 0404494849
NV KBC Autolease Telecomlaan 8 1831 Diegem 02/722.77.77
Source: The Data Warehousing Institute, 2002
B2B Data Quality DM Update Seminar 12 maart 2010 6
7. Algemene definitie
DATA QUALITY
• Consistency (consistentie): worden de data elementen
voortdurend gedefinieerd, onderhouden en begrepen?
Jur. Vorm Bedrijfsnaam Taal Straat Huisnr Postcode Woonplaats Ond. Nr Tel.
Kellogs Benelux Belgicastraat 7/10 1930 Zaventem
SA Delhaize Group FR Rue Osseghem 53 1080 Bruxelles 546.99.99.001
NV Copimex NL Bilkensveld 2 1500 Halle 2899999999
Restaurant Torenhuyze NL Rijkestraat 10 9968 Oost-Eeklo 09/373.43.63
Statu Quo FR rue de Schaerbeek 42 6660 Houffalize +32/61.28.97.23
NV DKV Belgium Bisschofsheimlaan 1-8 1000 Brussel
NV Fortis Bank Warandeberg 1000 Brussel 403.199.702
SA AG Insurance NL E.Jacqmainlaan 53 1000 Bruxelles 0404494849
NV KBC Autolease Telecomlaan 8 1831 Diegem 02/722.77.77
Source: The Data Warehousing Institute, 2002
B2B Data Quality DM Update Seminar 12 maart 2010 7
8. Algemene definitie
DATA QUALITY
• Accuracy (accuraatheid): reflecteert de data de huidige
realiteit?
Jur. Vorm Bedrijfsnaam Taal Straat Huisnr Postcode Woonplaats Ond. Nr Tel.
Kellogs Benelux NL Belgicastraat 7/10 1930 Zaventem
SA Delhaize Group FR Rue Osseghem 53 1080 Bruxelles 546.99.99.001
NV Copimex NL Bilkensveld 2 1500 Halle 2899999999
Restaurant Torenhuyze NL straat 10 9968 Oost-Eeklo 09/373.43.63
Statu Quo FR rue de Schaerbeek 42 6660 Houffalize +32/61.28.97.23
NV DKV Belgium Bisschofsheimlaan 1-8 1000 Brussel
NV Generale Bank NL Warandeberg 1000 Brussel 403.199.702
SA AG Insurance NL E.Jacqmainlaan 53 1000 Bruxelles 0404494849
NV KBC Autolease NL Telecomlaan 8 1831 Diegem 02/722.77.77
Verhuisd => Diestesteenweg, Leuven
Source: The Data Warehousing Institute, 2002
B2B Data Quality DM Update Seminar 12 maart 2010 8
9. Algemene definitie
DATA QUALITY
• Timeless (tijdloos): is de data beschikbaar indien
nodig (en up-to-date)?
• Accessibility (beschikbaarheid): is de data
eenvoudig beschikbaar en eenvoudig te gebruiken?
Source: The Data Warehousing Institute, 2002
B2B Data Quality DM Update Seminar 12 maart 2010 9
10. Oorzaken
DATA QUALITY PROBLEMEN
data entry by employees 76%
changes to source systems 53%
data migration project 48%
mixed expectations by users 46%
external data 34%
system errors 26%
data entry by customers 25%
other 12%
0% 10% 20% 30% 40% 50% 60% 70% 80%
Source: The Data Warehousing Institute, 2002 + study Capscan Aug. 2008 confirms
B2B Data Quality DM Update Seminar 12 maart 2010 10
11. Problemen
SLECHTE DATA QUALITY
take extra time to reconciliate data 87%
loss of credibility 81%
extra costs (dupl., post return) 72%
delay in deploying a new system 64%
customer dissatisfaction 62%
lost revenu 54%
compliance problems 38%
other 5%
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
Source: The Data Warehousing Institute, 2002 + study Capscan Ltd. Aug. 2008 confirms
B2B Data Quality DM Update Seminar 12 maart 2010 11
12. Grootste data uitdagingen
VANDAAG
Source: Graham Rhind, Capscan Ltd. Aug. 2008, perception versus reality
B2B Data Quality DM Update Seminar 12 maart 2010 12
13. AGENDA
• Wat is Data Quality?
• B2B markt in België
• Veranderingen in B2B gegevens
• Oplossingen intern en extern
• Case: fusie 2 bedrijven
• Vragen
B2B Data Quality DM Update Seminar 12 maart 2010 13
15. AGENDA
• Wat is Data Quality?
• B2B markt in België
• Veranderingen in B2B gegevens
• Oplossingen intern en extern
• Case: fusie 2 bedrijven
• Vragen
B2B Data Quality DM Update Seminar 12 maart 2010 15
16. VERANDERINGEN IN
B2B DATA
• Bedrijfsnaam
• Adres
• Ondernemingsnummer
• Juridische vorm
• Juridische status
• Contactgegevens:
– Telefoonnummer, faxnummer, e-mailadres
– Contactpersonen
B2B Data Quality DM Update Seminar 12 maart 2010 16
18. Adres
• Verhuizingen
• Straatnamen in 2 talen
• Afkortingen
• Maatschappelijke zetel vs vestiging
België:
- 140.000 straten in België
- 5 Mio adressen
B2B Data Quality DM Update Seminar 12 maart 2010 18
19. Ondernemingsnummer
• Uniek nummer
• Niet voor iedere entiteit/natuurlijk persoon
• Voordelen en nadelen van
ondernemingsnummer?
– Hoe gegevens ingebracht?
– Maatschappelijke zetel (= ondernemingsnummer)
vs vestiging (geen ondernemingsnummer)
B2B Data Quality DM Update Seminar 12 maart 2010 19
20. Juridische vorm
• Zelfstandigen
• N.V.
• B.V.B.A.
• C.V.
• VZW
• …
B2B Data Quality DM Update Seminar 12 maart 2010 20
21. Juridische toestand
Code Definitie
A Actief
C Concordaat
F Faillissement
G Geannuleerd dossier
I Intrekking faillissement of
concordaat
N Niet actief (natuurlijke personen)
O Opschorting of uitstel van betaling
S Ontbinding of vereffening
U Fusie, splitsing of verzameling van
aandelen
V Niet actieve vestiging
Z Stopzetting activiteiten
B2B Data Quality DM Update Seminar 12 maart 2010 21
22. Contactgegevens
• Telefoonnummer
• Faxnummer
• E-mail adres:
– Soft bounces – hard bounces
– Veranderen van e-mailadres
Source: NFO Worldgroup
B2B Data Quality DM Update Seminar 12 maart 2010 22
23. Contactpersonen
• Job veranderingen:
– van bedrijf veranderen
– van functie veranderen
• “What’s in a title?”
• Grote vs. kleine bedrijven
• Wat te doen met post voor een contactpersoon
uit dienst?
– doorgeven aan nieuwe contactpersoon?
– signaleren?
– vuilbak?
B2B Data Quality DM Update Seminar 12 maart 2010 23
24. AGENDA
• Wat is Data Quality?
• B2B markt in België
• Veranderingen in B2B gegevens
• Oplossingen intern en extern
• Case: fusie 2 bedrijven
• Vragen
B2B Data Quality DM Update Seminar 12 maart 2010 24
25. OPLOSSINGEN INTERN
Hoe aanpakken?
1. Preventief:
v vermijden dat fouten in systeem komen
2. Behandeling:
v analyseren en opkuisen van de bestaande
gegevens in database
3. Schade beperking:
v verbeteren op basis van gebruik foute gegevens
B2B Data Quality DM Update Seminar 12 maart 2010 25
26. 1. Preventief
vermijden dat fouten in systeem komen
• bij data entry:
v Gebruik masks (bv: )
v Optimaliseer formaten (bv: …………………………@................)
v Gebruik referentie data (bv: straatreferentie bestand)
v Gebruik DQ software (bv: QAS)
v Gebruik ASP-tools
• wanneer externe data wordt toegevoegd aan uw DB:
v Gebruik ETL (Extract, Transform and Load)-tools, om compliance met
uw beheersregels te garanderen
B2B Data Quality DM Update Seminar 12 maart 2010 26
27. 2. Behandeling
analyseren en verbeteren bestaande gegevens
• gebruik analyse (statistieken, formules, …) om lege velden,
abnormale waarden en inconsistente structuren te
identificeren (bv. SAS)
• gebruik DQ software (in-source)
• gebruik batch opkuis in service bureau (out-source, e.g. WDM
Belgium, Spectron, …)
B2B Data Quality DM Update Seminar 12 maart 2010 27
28. 3. Schade beperking
verbeteren door gebruik foutieve gegevens
• Encodering van Mail-ID feedback (De Post)
• Encodering van post retours (bv. De Post)
• Call center (klachten, …)
• Cfr. Data Entry technieken
B2B Data Quality DM Update Seminar 12 maart 2010 28
29. OPLOSSINGEN EXTERN
1. Hoe kwaliteit van data meten?
2. Data Quality traject
3. ROI en Data Quality
B2B Data Quality DM Update Seminar 12 maart 2010 29
30. OPLOSSINGEN EXTERN
Hoe kwaliteit van data meten?
1. Interne audit via externe software
(SAS, Siebel, Oracle, …)
2. Externe audit:
v Kwaliteit NAW en Ondernemingsnummer
v Actief of niet-actief
v Dubbels
v Consistentie alle gegevens samen
B2B Data Quality DM Update Seminar 12 maart 2010 30
31. OPLOSSINGEN EXTERN
Data Quality traject?
ACE principe:
3 stappen om
uw datakwaliteit
te verbeteren
B2B Data Quality DM Update Seminar 12 maart 2010 31
32. Data Quality traject
AUDIT
AUDIT: wat is de huidige datakwaliteit van uw
bestand?
v structuur van het bestand
v foutieve adressen (adres, naam, BTW, …)
v inactieve bedrijven (faling, stopzetting, …)
v aantal dubbels
v profiel op basis van omzet/WN/activiteit
B2B Data Quality DM Update Seminar 12 maart 2010 32
33. Data Quality traject
CLEAN
CLEAN: opkuisen van uw bestand?
v herstructureren (alles in het juiste veld)
v standaardiseren (schrijfwijze adres, …)
v opsporen dubbele adressen
v valideren van gegevens op juistheid
B2B Data Quality DM Update Seminar 12 maart 2010 33
34. Data Quality traject
CLEAN: herstructureren
input bestand
BEDRIJF CONTACT STRAAT WOONPLAATS
BVBA Molop Jan Peters Wetstraat 15 1000 Brussel
herstructuring
JURIDISCHE VORM BVBA
NAAM BEDRIJF Molop
VOORNAAM Jan
NAAM Peters
AANSPREKING Dhr
STRAAT Wetstraat BVBA Molop
HUISNR 15 Dhr Jan Peters
Wetstraat 15
POSTCODE 1000
1000 Brussel
PLAATS Brussel
TAAL NL
B2B Data Quality DM Update Seminar 12 maart 2010 34
35. Data Quality traject
CLEAN: standaardiseren
...
Wetstr. 10 1070
Wetstraat, 123 B 1040 Bruxelles
Bestand = Wettstraat 123 1040 Etterbeek
Wet 21 Brux.
Wetstr. 10 1040
resultaat data Rue de loi 54 1040 Bruxelles
verzameling via La loi 89 Bruxelles
verschillende r. Loi 42 B09 Brussels
Rue de la loi 1040 Etterbeek
kanalen Loi 204 Etterbeek
78, r. de la loi Bruxelles (1040)
Bruxelles R. de Loi 22
...
B2B Data Quality DM Update Seminar 12 maart 2010 35 35
36. Data Quality traject
CLEAN: standaardiseren
standaardisatie adressen
...
Wetstraat 10 1040 Brussels
Wetstraat 123 B 1040 Brussels
Wetstraat 123 1040 Brussels
Wetstraat 1040 Brussels
Wetstraat 10 1040 Brussels
Rue de la Loi 54 1040 Bruxelles
Rue de la Loi 89 1040 Bruxelles
Rue de la Loi 42 B09 1040 Bruxelles
Rue de la Loi 1040 Bruxelles
Rue de la Loi 204 1040 Bruxelles
Rue de la Loi 78 1040 Bruxelles
Rue de la Loi 22 1040 Bruxelles
...
B2B Data Quality DM Update Seminar 12 maart 2010 36 36
37. Data Quality traject
CLEAN: ontdubbelen
• Hoe ontstaan dubbels?
1) Bij fusies en overnames
2) Input medewerkers
3) Beperkte visibiliteit en linken tussen
verschillende systemen
4) Externe bestanden
Source: Business objects. Data Quality: A survival guide for marketing, 2008
B2B Data Quality DM Update Seminar 12 maart 2010 37
38. Data Quality traject
CLEAN: ontdubbelen
• Ontdubbelen: wat heb ik? wat wil ik?
vmeerdere contactpersonen binnen bedrijf?
vmeerdere adressen van bedrijf
(leveringsadres, facturatie-adres, exploitatie-adres, …)
vverschillende bedrijfsnamen:
afkorting, maatschappelijke naam, commerciële naam, …
vprospecten versus klanten
vmarketing campagne versus operationeel
vunderkill versus overkill
B2B Data Quality DM Update Seminar 12 maart 2010 38
39. Data Quality traject
CLEAN: ontdubbelen
• Ontdubbelen: hoe?
vop niveau van bedrijf-adres
vop niveau van contactpersoon-adres
vop niveau van bedrijf + historieken
vop niveau van ondernemingsnummer
v op niveau van adres
v…
B2B Data Quality DM Update Seminar 12 maart 2010 39
40. Data Quality traject
CLEAN: valideren
Spectron Business Solutions NV
Verlatstraat 10
2000 ANTWERPEN
referentiebestand
Arvato Services NV
Satenrozen 2 vergelijken
2550 KONTICH
Op basis van gegevens in input: NAW, BTW, telefoon, …
=> t.o.v. historieken en huidige gegevens
B2B Data Quality DM Update Seminar 12 maart 2010 40
41. Data Quality traject
ENRICH
ENRICH: toevoegen van relevante informatie
over uw klanten en prospecten aan uw bestand
v contactgegevens (telefoon, fax, URL, e-mailadres, …)
v bedrijfseconomische gegevens
(BTW, omzet, faillissement, …)
v geografische gegevens (industriezone, …)
v sector, activiteit
B2B Data Quality DM Update Seminar 12 maart 2010 41
42. Data Quality traject
ENRICH
SILOMAT
Wetstraat 1
1000 Brussel
Vergelijken referentiebestand
SILOMAT NV
Haachtsesteenweg 2 bus 5
1210 Brussel
Tel 02/241.07.07
Zaakvoerder Mevr. Linda De Roover
verrijkte
Activiteitscode Juwelier
Aantal werknemers 1-5
gegevens
Omzet 750.000 euro
B2B Data Quality DM Update Seminar 12 maart 2010 42
43. ROI en DATA QUALITY
• Kosten die “eenvoudig” te meten zijn:
v verbetering klantenbehoud
v vermindering mailing kosten
v vermindering post retour
v verbetering mailing succes ratio
v vermindering telemarketing kosten
v vluggere verwerking van klantengegevens
v churn analyse
v fraude detectie
v…
B2B Data Quality DM Update Seminar 12 maart 2010 43
44. ROI en DATA QUALITY
• Kosten die “moeilijk” te meten zijn:
v accuratere analyse zal beslissingsproces
vergemakkelijken
v verlies van geloofwaardigheid
v klantenontevredenheid
v ontevredenheid werknemers
v imagoverlies
v dalende concurrentiële positie
v…
B2B Data Quality DM Update Seminar 12 maart 2010 44
45. “For data to be truly pervasive it cannot be
limited to a single business domain such as
customer, financial, product or asset data but
must be applied across the organisation to all
areas.”
Philip Howard, Pervasive Data Quality, Bloor Research, Oct. 2009
B2B Data Quality DM Update Seminar 12 maart 2010 45
46. BESLUIT
• DQ = strategie (LT, gans het bedrijf)
• Goed begonnen, half gewonnen
• Ken uw bestand (objectieven)
• 100% kwaliteit bestaat niet
• Gebruik elk contact de klant om data te
controleren
B2B Data Quality DM Update Seminar 12 maart 2010 46
47. VRAGEN
Spectron Business Solutions
Katie Smekens
katie.smekens@spectronbs.be
www.spectron.be
03/610.33.00
Stratics
Kris Vranken
kris@stratics.be
www.linkedin.com/in/krisvranken
B2B Data Quality DM Update Seminar 12 maart 2010 47