Data Pioneers - Dorine van Mullem-Ale (SBS Broadcasting) - Social media (rese...
Data Pioneers - Remco Wilting (VODW) - Mythes en feiten rondom big data
1. Mythes en feitenMythes en feiten
vvanan
Big DataBig Data
DataData PioneersPioneers
26 september 201226 september 2012
Remco WiltingRemco Wilting
Big DataBig Data
2. Big DataBig Data
•• Data gebruik neemtData gebruik neemt exponentieelexponentieel toetoe
HeelHeel veelveel datadata
tijdtijd
ddataatagebruikgebruik
•• Data gebruik neemtData gebruik neemt exponentieelexponentieel toetoe
•• Meer danMeer dan 90%90% is vanafis vanaf 20102010 gecreëerdgecreëerd
•• InIn 20202020 is de hoeveelheid datais de hoeveelheid data 44x44x zozo
groot als ingroot als in 20092009
HeelHeel veelveel datadata
3. Big DataBig Data
Door deDoor de explosieveexplosieve toename vantoename van datadata doordoor
de digitale revolutie, voldoende digitale revolutie, voldoen regulierereguliere
databasedatabase-- enen analyseanalyse oplossingen niet meeroplossingen niet meer
om hier op eenom hier op een goede wijzegoede wijze mee om te gaan.mee om te gaan.om hier op eenom hier op een goede wijzegoede wijze mee om te gaan.mee om te gaan.
EenEen andereandere manier vanmanier van werkenwerken is vereist.is vereist.
6. Voorbeeld GoogleVoorbeeld Google
•• GoogleGoogle’s’s primaire dienst isprimaire dienst is Big DataBig Data
•• Search,Search, MapsMaps,, EarthEarth,, AnalyticsAnalytics,, YouTubeYouTube
•• Meer danMeer dan 1 miljard1 miljard zoek opdrachten enzoek opdrachten en 2424
petabytespetabytes useruser--generatedgenerated--contentcontent per dagper dag
•• Google’sGoogle’s Big DataBig Data toolstools zijn openzijn open sourcesource•• Google’sGoogle’s Big DataBig Data toolstools zijn openzijn open sourcesource
beschikbaar (beschikbaar (HadoopHadoop,, DremelDremel))
8. De hoeveelheid data neemt ongelofelijk snel toe...De hoeveelheid data neemt ongelofelijk snel toe...
144,8 miljard144,8 miljard emailsemails
340 miljoen340 miljoen tweetstweets
684.000684.000 stukjesstukjes contentcontent opop FacebookFacebook
571571 nieuwe websitesnieuwe websites
72 uur72 uur video opvideo op YouTubeYouTube
3.6003.600 foto’s Instagramfoto’s Instagram
9. …en kan niet allemaal worden opgeslagen…en kan niet allemaal worden opgeslagen
MeerMeer datadata dan kan wordendan kan worden opgeslagenopgeslagen..
DeDe uitdaginguitdaging is hetis het prioriterenprioriteren van de data dievan de data die
moet worden opgeslagenmoet worden opgeslagen
DeDe wenswens en deen de mogelijkhedenmogelijkheden om hierom hier inzichteninzichten
uit te halen blijft enuit te halen blijft en neemtneemt alleen maaralleen maar toetoe..
12. De tools zijn beschikbaar
DeDe toolstools zijn beschikbaar en zelfs via openzijn beschikbaar en zelfs via open sourcesource
ITIT is niet het issue…is niet het issue…
13. Het is een business issue
DeDe vraagvraag is:is:
•• WatWat kankan ik ermee?ik ermee?
•• WatWat levertlevert het mehet me opop??
•• Zitten mijnZitten mijn klantenklanten hierophierop te wachtente wachten??•• Zitten mijnZitten mijn klantenklanten hierophierop te wachtente wachten??
…het is een…het is een businessbusiness issue.issue.
14. FeitFeit
Big DataBig Data vraagt eenvraagt een
andereandere aanpakaanpak dandanandereandere aanpakaanpak dandan
traditionele datatraditionele data
15. Big Data vraagt om een andere aanpakBig Data vraagt om een andere aanpak
Data bronnenData bronnen
FormatFormat van devan de
datadata
TraditioneelTraditioneel Big dataBig data
Basis + businessBasis + business Basis, business,Basis, business,
web en socialweb en social
GestructureerdGestructureerd OngestructureerdOngestructureerd
KoppelenKoppelen van datavan data
AnalyseAnalyse aanbodaanbod
AnalyseAnalyse omgevingomgeving
StatischStatisch Dynamisch, event drivenDynamisch, event driven
Periodieke rapportage,Periodieke rapportage,
prepre--formattedformatted
RealReal--time,time,
analytics in war roomanalytics in war room
DatawarehouseDatawarehouse Distributiemodel en cloudDistributiemodel en cloud
16. FeitFeit
Big DataBig Data vraagt eenvraagt een
geïntegreerdegeïntegreerde aanpakaanpak
van organisatie,van organisatie,
analyticsanalytics en ITen IT
19. McKinsey onderzoek:McKinsey onderzoek:
““71 procent71 procent van de organisaties aan datvan de organisaties aan dat
datagedreven inzichten erg tot extreemdatagedreven inzichten erg tot extreem
belangrijkbelangrijk worden voorworden voor concurrentievoordeelconcurrentievoordeel,,
maar daar nogmaar daar nog zeer weinigzeer weinig mee doen”mee doen”
De meeste organisatie doen weinig met Big DataDe meeste organisatie doen weinig met Big Data
maar daar nogmaar daar nog zeer weinigzeer weinig mee doen”mee doen”
Toch is hetToch is het geen complexegeen complexe totaaloplossing,totaaloplossing,
maar een manier van werken datmaar een manier van werken dat gradueelgradueel kankan
wordenworden ingevoerdingevoerd..
21. •• Gestalte geven aanGestalte geven aan éénéén--opop--éénéén marketingmarketing
•• Vroegtijdig deVroegtijdig de vraagvraag voorspellenvoorspellen
Enkele voorbeelden
•• Vroegtijdig deVroegtijdig de vraagvraag voorspellenvoorspellen
•• Richting geven aanRichting geven aan productontwikkelingproductontwikkeling
22. Aan de slagAan de slag
HoeHoe beginbegin je hier nuje hier nu
mee?mee?
23. Beginnen
• Neem de business als startpunt en niet
de data
• Ga niet zonder duidelijk doel analyseren
• Niet direct in een totaaloplossing denken,• Niet direct in een totaaloplossing denken,
maar neem kleine overzichtelijke stappen
• Toon de toegevoegde waarde aan