SlideShare une entreprise Scribd logo
1  sur  30
Télécharger pour lire hors ligne
GoDataDriven
PROUDLY PART OF THE XEBIA GROUP
@ivoeverts
ivoeverts@godatadriven.com
GoDataDriven @ HvA
Gastcollege minor online management,Amsterdam, 15/05/2017
Ivo Everts
Data Scientist
Wat gaan we doen
•GoDataDriven: wat doen we, waarom doen we
het, hoe doen we het.
•Wat doe ik daar. En wat doe ik hier.
•Uitdiepen van client cases.
•Google Analytics op GoDataDriven.com.
•Zelf code schrijven voor data verwerking en
analyse.
Ik hoop dat jullie enthousiast
raken over data-gedreven
werken in het algemeen want dat
is de toekomst.
GoDataDriven
Knowledge mile
GoDataDriven
•We zijn een groep van ~30 data specialisten
•5 chiefs: ops, tech, marketing, sales, general
•Technical consultants:
•~50% data engineers
•~50% data scientists
•Dochterbedrijf van Xebia, groot geworden in
software ontwikkeling en consultancy
? Wat is het verschil tussen een data engineer en een data scientist ?
GoDataDriven
•Als gevolg van de automatisering hebben
bedrijven te maken met steeds meer data
•Veel bedrijven bewegen nu van data opslag naar
beschrijvende en voorspellende data verwerking
? Wat voor data hebben deze bedrijven en wat kan je daarmee ?
GoDataDriven
•Bij de klant zien we vaak de volgende fases:
•Inspiratie: workshops om de data-driven use-
cases te ontdekken
•Transpiratie: de rest :)
•Infrastructuur aanleggen
•Statistische modellen testen
•Software in productie nemen
? Hoe zou je het voorspellend vermogen van een model testen ?
GoDataDriven
Typische data science workflow
GoDataDriven
Typische data science workflow
real-time aanbevelingen online retailer
clickstreams
user profiles
geo-filtering
missing data
item features
user features
item similarity
user similarity
sales, CTR
user satisfaction
GoDataDriven
? Waar zit jij en waar wil je zitten ?
Ivo @ GoDataDriven
•Ik werk hier nu ~3 jaar als data scientist
•Grote projecten voor ING en NS
•Trainingen, workshops, presentaties, PoC's,
hackathons
•Gewerkt voor een startup vanuit de
onderzoeksgroep (SightCorp)
•Eigen bedrijfje voor bouwen van webapplicaties
•BSc + MSc + PhD in beeldverwerking en
toegepaste kunstmatige intelligentie
Ivo @ GoDataDriven
•Filmpjes kijken
•Afstudeeropdracht: object tracking with
multiple cameras
•Deel van proefschrift: human activity
recognition
•Werk bij SightCorp:
•InSight
•CrowdSight
Ivo @ GoDataDriven
Gezichtsherkenning
Jack, Marie, John, Kim,Ann
?
John
? Heb ik al gezegd dat dit machine learning heet ?
Ivo @ GoDataDriven
Typische data science workflow
human activity recognition in video
youtube
videos
formaat
converteren
beweging,
kleur, vorm
support vector
machine
accuracy
Ivo @ GoDataDriven
Wat is nou een machine learning model
Support vector machine
Decision tree / random forest
Ivo @ GoDataDriven
State of the art machine learning: Deep Learning
Ivo @ GoDataDriven
Client case: NPO
•Gepersonaliseerd nieuws en video aanbod op
basis van surf gedrag
•Clickstream data afgevangen met Divolte, onze
eigen in-house opensource tool
•Hadoop data platform ontworpen en ingericht
•Team en werkwijze opgestart
Client case: NPO
•Hoe goed kunnen we het aantal lezers van een
artikel voorspellen?
? Wat voor impact heeft dit op de advertentie verkoop ?
Client case: NPO
•Hoe verhoudt de lengte van een video zich tot
het percentage van mensen dat niet wegklikt?
? Zou dit gevolgen kunnen hebben voor de business ?
Client case: NPO
•Verdeling over jaartal van bekeken content op
basis van rule-based aanbevelingen vs
algoritmische aanbevelingen
? Wie worden hier blij van en waarom ?
Client case: NPO
•Mik niet alleen op CTR: vaak is je doel niet een op dit moment zo hoog
mogelijke CTR te halen, maar ligt dat (veel) hoger. Zo is het op een site als de
NPO heel makkelijk om een hoge CTR te halen met een zeker fragment dat
draait om de voorgevel van Katja Schuurman, maar is dat natuurlijk juist niet wat
je wil tonen. — Copyright Vincent.
•Realiseer je goed wat je meet. Een CTR kan je makkelijk definiëren als “aantal
keer getoond” gedeeld door “aantal keer geklikt”, maar als je zoals bij de NPO
elke keer als een stream gepauzeerd wordt als “een keer getoond” rekent dan
ben je in feite de CTR maal (1+”aantal keer gepauzeerd”) aan het meten. Dat
scheelt al snel een factor vier.
•Realiseer je goed waar je data vandaan komt, en dat deze soms heel vies is. Bij
eBay komt ruim 1/3 van alle searchqueries van bots vandaan. Als je dan
geïnteresseerd bent in waar men naar zoekt zal je die eerst weg moeten filteren.
Client case:Transavia
•Zeer vergelijkbaar met de NPO case
•Persoonlijke aanbevelingen op basis van jouw
surfgedrag
•Opbouwen van een gedragsprofiel
Client case:Transavia
•Integreren van machine learning
Client case:Transavia
? Wat is 'oude' technologie en wat is 'nieuwe' technologie ?
Client case: Bakkersland
•Mooi voorbeeld van hoe steeds meer 'normale'
bedrijven data gedreven gaan werken
•Bakkersland bakt brood en levert aan de
supermarkt
•De data bestaat uit kassa bonnetjes die 's avonds
naar een ftp server worden gekopieerd
? Wat is de case ?
Client case: Bakkersland
Google Analytics
•GA @ GoDataDriven.com
•Kunnen we GA gebruiken om de aandacht voor
ons werk in de luchtvaart industrie te vergroten?
•Zoek op 'case' in Behavior :: Site Content ::
Content Drilldown.Transavia op no. 9
•We hebben de case al als eerste staan op de
homepage
? Wat zou je je nog meer kunnen afvragen ?
Zelf coden
•Data van wikipedia
•Jupyter notebook
GoDataDriven
PROUDLY PART OF THE XEBIA GROUP
@ivoeverts
ivoeverts@godatadriven.com
GoDataDriven @ HvA
Gastcollege minor online management,Amsterdam, 15/05/2017
Dank!
Laat wat van je horen als je voor ons coole dingen wil doen met GA en social media
Ivo Everts
Data Scientist

Contenu connexe

Similaire à GoDataDriven op de hogeschool van Amsterdam: gastcollege door Ivo Everts

Website conversie optimalisatie
Website conversie optimalisatieWebsite conversie optimalisatie
Website conversie optimalisatieGuido X Jansen
 
Big Data presentatie #dido12 - Arend Zwaneveld
Big Data presentatie #dido12 - Arend ZwaneveldBig Data presentatie #dido12 - Arend Zwaneveld
Big Data presentatie #dido12 - Arend ZwaneveldOnline Dialogue
 
Marketing_Trend_Event_2022_-_De_wereld_van_Data_en_Technologie.pdf
Marketing_Trend_Event_2022_-_De_wereld_van_Data_en_Technologie.pdfMarketing_Trend_Event_2022_-_De_wereld_van_Data_en_Technologie.pdf
Marketing_Trend_Event_2022_-_De_wereld_van_Data_en_Technologie.pdfOrangeValley
 
VINT Symposium 2012: Recorded Future | Harrie Vollaard (Rabobank)
VINT Symposium 2012: Recorded Future | Harrie Vollaard (Rabobank)VINT Symposium 2012: Recorded Future | Harrie Vollaard (Rabobank)
VINT Symposium 2012: Recorded Future | Harrie Vollaard (Rabobank)VINTlabs | The Sogeti Trendlab
 
Big Data in Retail: too big to ignore
Big Data in Retail: too big to ignoreBig Data in Retail: too big to ignore
Big Data in Retail: too big to ignorevalantic NL
 
3D lab gebruikersonderzoeken seriousources
3D lab gebruikersonderzoeken seriousources3D lab gebruikersonderzoeken seriousources
3D lab gebruikersonderzoeken seriousources3Dproject
 
3D lab gebruikersonderzoeken seriousources
3D lab gebruikersonderzoeken seriousources3D lab gebruikersonderzoeken seriousources
3D lab gebruikersonderzoeken seriousourcesanke_eyck
 
Big Data Expo 2015 - GoDataDriven Vier Big Data Trends
Big Data Expo 2015 - GoDataDriven Vier Big Data TrendsBig Data Expo 2015 - GoDataDriven Vier Big Data Trends
Big Data Expo 2015 - GoDataDriven Vier Big Data TrendsBigDataExpo
 
Big Data Expo - Friso van Vollenhoven - Vier Big Data Trends
Big Data Expo - Friso van Vollenhoven - Vier Big Data TrendsBig Data Expo - Friso van Vollenhoven - Vier Big Data Trends
Big Data Expo - Friso van Vollenhoven - Vier Big Data TrendsGoDataDriven
 
Training Analytics 2017 - basics and importance of metrics
Training Analytics 2017 - basics and importance of metricsTraining Analytics 2017 - basics and importance of metrics
Training Analytics 2017 - basics and importance of metrics➚ Mike van Hoenselaar
 
Masterclass Analytics voor USG People door Mike van Hoenselaar
Masterclass Analytics voor USG People door Mike van HoenselaarMasterclass Analytics voor USG People door Mike van Hoenselaar
Masterclass Analytics voor USG People door Mike van Hoenselaar➚ Mike van Hoenselaar
 
ICT & Logistiek 2019 - Tradecloud en HAN over de zelfsturende supply chain
ICT & Logistiek 2019 - Tradecloud en HAN over de zelfsturende supply chainICT & Logistiek 2019 - Tradecloud en HAN over de zelfsturende supply chain
ICT & Logistiek 2019 - Tradecloud en HAN over de zelfsturende supply chainTradecloud supply chain platform
 
The Talent Institute - Analytics (mike van hoenselaar) januari 2017
The Talent Institute - Analytics (mike van hoenselaar) januari 2017The Talent Institute - Analytics (mike van hoenselaar) januari 2017
The Talent Institute - Analytics (mike van hoenselaar) januari 2017➚ Mike van Hoenselaar
 
Marketing and Digital Analytics door Mike van Hoenselaar bi The talent institute
Marketing and Digital Analytics door Mike van Hoenselaar bi The talent instituteMarketing and Digital Analytics door Mike van Hoenselaar bi The talent institute
Marketing and Digital Analytics door Mike van Hoenselaar bi The talent instituteOnline Boswachters
 
Foundation of Analytics (Mike van Hoenselaar) april 2017
Foundation of Analytics (Mike van Hoenselaar) april 2017Foundation of Analytics (Mike van Hoenselaar) april 2017
Foundation of Analytics (Mike van Hoenselaar) april 2017Online Boswachters
 
Analytics Fundamentals The Talent Institute
Analytics Fundamentals The Talent InstituteAnalytics Fundamentals The Talent Institute
Analytics Fundamentals The Talent InstituteOnline Boswachters
 

Similaire à GoDataDriven op de hogeschool van Amsterdam: gastcollege door Ivo Everts (20)

Website conversie optimalisatie
Website conversie optimalisatieWebsite conversie optimalisatie
Website conversie optimalisatie
 
Big Data presentatie #dido12 - Arend Zwaneveld
Big Data presentatie #dido12 - Arend ZwaneveldBig Data presentatie #dido12 - Arend Zwaneveld
Big Data presentatie #dido12 - Arend Zwaneveld
 
Marketing_Trend_Event_2022_-_De_wereld_van_Data_en_Technologie.pdf
Marketing_Trend_Event_2022_-_De_wereld_van_Data_en_Technologie.pdfMarketing_Trend_Event_2022_-_De_wereld_van_Data_en_Technologie.pdf
Marketing_Trend_Event_2022_-_De_wereld_van_Data_en_Technologie.pdf
 
VINT Symposium 2012: Recorded Future | Harrie Vollaard (Rabobank)
VINT Symposium 2012: Recorded Future | Harrie Vollaard (Rabobank)VINT Symposium 2012: Recorded Future | Harrie Vollaard (Rabobank)
VINT Symposium 2012: Recorded Future | Harrie Vollaard (Rabobank)
 
Loyall: Cloud computing
Loyall: Cloud computingLoyall: Cloud computing
Loyall: Cloud computing
 
Loyall: Cloud computing
Loyall: Cloud computingLoyall: Cloud computing
Loyall: Cloud computing
 
ICT Trends in 2013
ICT Trends in 2013ICT Trends in 2013
ICT Trends in 2013
 
Big Data in Retail: too big to ignore
Big Data in Retail: too big to ignoreBig Data in Retail: too big to ignore
Big Data in Retail: too big to ignore
 
3D lab gebruikersonderzoeken seriousources
3D lab gebruikersonderzoeken seriousources3D lab gebruikersonderzoeken seriousources
3D lab gebruikersonderzoeken seriousources
 
3D lab gebruikersonderzoeken seriousources
3D lab gebruikersonderzoeken seriousources3D lab gebruikersonderzoeken seriousources
3D lab gebruikersonderzoeken seriousources
 
Big Data Expo 2015 - GoDataDriven Vier Big Data Trends
Big Data Expo 2015 - GoDataDriven Vier Big Data TrendsBig Data Expo 2015 - GoDataDriven Vier Big Data Trends
Big Data Expo 2015 - GoDataDriven Vier Big Data Trends
 
Big Data Expo - Friso van Vollenhoven - Vier Big Data Trends
Big Data Expo - Friso van Vollenhoven - Vier Big Data TrendsBig Data Expo - Friso van Vollenhoven - Vier Big Data Trends
Big Data Expo - Friso van Vollenhoven - Vier Big Data Trends
 
Seo Vision
Seo VisionSeo Vision
Seo Vision
 
Training Analytics 2017 - basics and importance of metrics
Training Analytics 2017 - basics and importance of metricsTraining Analytics 2017 - basics and importance of metrics
Training Analytics 2017 - basics and importance of metrics
 
Masterclass Analytics voor USG People door Mike van Hoenselaar
Masterclass Analytics voor USG People door Mike van HoenselaarMasterclass Analytics voor USG People door Mike van Hoenselaar
Masterclass Analytics voor USG People door Mike van Hoenselaar
 
ICT & Logistiek 2019 - Tradecloud en HAN over de zelfsturende supply chain
ICT & Logistiek 2019 - Tradecloud en HAN over de zelfsturende supply chainICT & Logistiek 2019 - Tradecloud en HAN over de zelfsturende supply chain
ICT & Logistiek 2019 - Tradecloud en HAN over de zelfsturende supply chain
 
The Talent Institute - Analytics (mike van hoenselaar) januari 2017
The Talent Institute - Analytics (mike van hoenselaar) januari 2017The Talent Institute - Analytics (mike van hoenselaar) januari 2017
The Talent Institute - Analytics (mike van hoenselaar) januari 2017
 
Marketing and Digital Analytics door Mike van Hoenselaar bi The talent institute
Marketing and Digital Analytics door Mike van Hoenselaar bi The talent instituteMarketing and Digital Analytics door Mike van Hoenselaar bi The talent institute
Marketing and Digital Analytics door Mike van Hoenselaar bi The talent institute
 
Foundation of Analytics (Mike van Hoenselaar) april 2017
Foundation of Analytics (Mike van Hoenselaar) april 2017Foundation of Analytics (Mike van Hoenselaar) april 2017
Foundation of Analytics (Mike van Hoenselaar) april 2017
 
Analytics Fundamentals The Talent Institute
Analytics Fundamentals The Talent InstituteAnalytics Fundamentals The Talent Institute
Analytics Fundamentals The Talent Institute
 

GoDataDriven op de hogeschool van Amsterdam: gastcollege door Ivo Everts

  • 1. GoDataDriven PROUDLY PART OF THE XEBIA GROUP @ivoeverts ivoeverts@godatadriven.com GoDataDriven @ HvA Gastcollege minor online management,Amsterdam, 15/05/2017 Ivo Everts Data Scientist
  • 2. Wat gaan we doen •GoDataDriven: wat doen we, waarom doen we het, hoe doen we het. •Wat doe ik daar. En wat doe ik hier. •Uitdiepen van client cases. •Google Analytics op GoDataDriven.com. •Zelf code schrijven voor data verwerking en analyse.
  • 3. Ik hoop dat jullie enthousiast raken over data-gedreven werken in het algemeen want dat is de toekomst.
  • 5. GoDataDriven •We zijn een groep van ~30 data specialisten •5 chiefs: ops, tech, marketing, sales, general •Technical consultants: •~50% data engineers •~50% data scientists •Dochterbedrijf van Xebia, groot geworden in software ontwikkeling en consultancy ? Wat is het verschil tussen een data engineer en een data scientist ?
  • 6. GoDataDriven •Als gevolg van de automatisering hebben bedrijven te maken met steeds meer data •Veel bedrijven bewegen nu van data opslag naar beschrijvende en voorspellende data verwerking ? Wat voor data hebben deze bedrijven en wat kan je daarmee ?
  • 7. GoDataDriven •Bij de klant zien we vaak de volgende fases: •Inspiratie: workshops om de data-driven use- cases te ontdekken •Transpiratie: de rest :) •Infrastructuur aanleggen •Statistische modellen testen •Software in productie nemen ? Hoe zou je het voorspellend vermogen van een model testen ?
  • 9. GoDataDriven Typische data science workflow real-time aanbevelingen online retailer clickstreams user profiles geo-filtering missing data item features user features item similarity user similarity sales, CTR user satisfaction
  • 10. GoDataDriven ? Waar zit jij en waar wil je zitten ?
  • 11. Ivo @ GoDataDriven •Ik werk hier nu ~3 jaar als data scientist •Grote projecten voor ING en NS •Trainingen, workshops, presentaties, PoC's, hackathons •Gewerkt voor een startup vanuit de onderzoeksgroep (SightCorp) •Eigen bedrijfje voor bouwen van webapplicaties •BSc + MSc + PhD in beeldverwerking en toegepaste kunstmatige intelligentie
  • 12. Ivo @ GoDataDriven •Filmpjes kijken •Afstudeeropdracht: object tracking with multiple cameras •Deel van proefschrift: human activity recognition •Werk bij SightCorp: •InSight •CrowdSight
  • 13. Ivo @ GoDataDriven Gezichtsherkenning Jack, Marie, John, Kim,Ann ? John ? Heb ik al gezegd dat dit machine learning heet ?
  • 14. Ivo @ GoDataDriven Typische data science workflow human activity recognition in video youtube videos formaat converteren beweging, kleur, vorm support vector machine accuracy
  • 15. Ivo @ GoDataDriven Wat is nou een machine learning model Support vector machine Decision tree / random forest
  • 16. Ivo @ GoDataDriven State of the art machine learning: Deep Learning
  • 18. Client case: NPO •Gepersonaliseerd nieuws en video aanbod op basis van surf gedrag •Clickstream data afgevangen met Divolte, onze eigen in-house opensource tool •Hadoop data platform ontworpen en ingericht •Team en werkwijze opgestart
  • 19. Client case: NPO •Hoe goed kunnen we het aantal lezers van een artikel voorspellen? ? Wat voor impact heeft dit op de advertentie verkoop ?
  • 20. Client case: NPO •Hoe verhoudt de lengte van een video zich tot het percentage van mensen dat niet wegklikt? ? Zou dit gevolgen kunnen hebben voor de business ?
  • 21. Client case: NPO •Verdeling over jaartal van bekeken content op basis van rule-based aanbevelingen vs algoritmische aanbevelingen ? Wie worden hier blij van en waarom ?
  • 22. Client case: NPO •Mik niet alleen op CTR: vaak is je doel niet een op dit moment zo hoog mogelijke CTR te halen, maar ligt dat (veel) hoger. Zo is het op een site als de NPO heel makkelijk om een hoge CTR te halen met een zeker fragment dat draait om de voorgevel van Katja Schuurman, maar is dat natuurlijk juist niet wat je wil tonen. — Copyright Vincent. •Realiseer je goed wat je meet. Een CTR kan je makkelijk definiëren als “aantal keer getoond” gedeeld door “aantal keer geklikt”, maar als je zoals bij de NPO elke keer als een stream gepauzeerd wordt als “een keer getoond” rekent dan ben je in feite de CTR maal (1+”aantal keer gepauzeerd”) aan het meten. Dat scheelt al snel een factor vier. •Realiseer je goed waar je data vandaan komt, en dat deze soms heel vies is. Bij eBay komt ruim 1/3 van alle searchqueries van bots vandaan. Als je dan geïnteresseerd bent in waar men naar zoekt zal je die eerst weg moeten filteren.
  • 23. Client case:Transavia •Zeer vergelijkbaar met de NPO case •Persoonlijke aanbevelingen op basis van jouw surfgedrag
  • 24. •Opbouwen van een gedragsprofiel Client case:Transavia
  • 25. •Integreren van machine learning Client case:Transavia ? Wat is 'oude' technologie en wat is 'nieuwe' technologie ?
  • 26. Client case: Bakkersland •Mooi voorbeeld van hoe steeds meer 'normale' bedrijven data gedreven gaan werken •Bakkersland bakt brood en levert aan de supermarkt •De data bestaat uit kassa bonnetjes die 's avonds naar een ftp server worden gekopieerd ? Wat is de case ?
  • 28. Google Analytics •GA @ GoDataDriven.com •Kunnen we GA gebruiken om de aandacht voor ons werk in de luchtvaart industrie te vergroten? •Zoek op 'case' in Behavior :: Site Content :: Content Drilldown.Transavia op no. 9 •We hebben de case al als eerste staan op de homepage ? Wat zou je je nog meer kunnen afvragen ?
  • 29. Zelf coden •Data van wikipedia •Jupyter notebook
  • 30. GoDataDriven PROUDLY PART OF THE XEBIA GROUP @ivoeverts ivoeverts@godatadriven.com GoDataDriven @ HvA Gastcollege minor online management,Amsterdam, 15/05/2017 Dank! Laat wat van je horen als je voor ons coole dingen wil doen met GA en social media Ivo Everts Data Scientist