SlideShare une entreprise Scribd logo
1  sur  26
Introduzione al corso Datawarehouse e fonti informative aziendali DATA MINING Luca Molteni
Programma e obiettivi del corso Il corso propone di introdurre il concetto di Data Mining e di presentare le principali tecniche statistiche che possono essere utilmente impiegate in quest’ambito per la soluzione di problemi aziendali E’ strutturato in due principali moduli: Il primo è incentrato sul tema delle previsioni delle vendite: saranno presentati, a questo proposito, i metodi di decomposizione classica, di attenuazione esponenziale (Holt-Winters) e la modellistica ARIMA  La seconda parte del corso è dedicata al Customer Relationship Management ed in particolare ai temi legati alla profilazione della clientela, all’analisi del comportamento d’acquisto dei consumatori e allo scoring della clientela
Programma e obiettivi del corso Numerose sono le tecniche statistiche multivariate che è possibile impiegare per rispondere agli obiettivi conoscitivi indicati Il corso di Data Mining propone: algoritmi di classificazione ad albero, regressione lineare multipla, reti neurali, mappe di Kohonen, market basket analysis, analisi discriminante lineare e regressione logistica Il corso è caratterizzato da un alternarsi di lezioni di natura metodologica e di lezioni di natura più applicativa, mediante ricorso a una serie di casi aziendali e all’uso di specifici software diffusi sul mercato (SPSS e Modeler).
Materiale didattico ,[object Object],Paolo Giudici “Data Mining”, McGraw-Hill, 2005 John Hanke & Dean Wichern “Business forecasting” – EightEdition, Prentice Hall, 2005
MODULO UNOPrevisioni delle vendite Il corso prevede lo studio di tecniche di previsione quantitative che si basano proprio sull’uso di dati storici, dai quali l’analista cerca di comprendere la struttura sottostante il fenomeno per poi utilizzarla a scopi previsivi Alla base dell’analisi delle serie storiche vi è l’assunzione secondo cui i fattori che hanno influenzato l’andamento della serie nel passato e nel presente continuino a esercitare effetti analoghi anche nel futuro SOFTWARE UTILIZZATI Excel SPSS Clementine (reti neurali)
6 Metodi e algoritmi di previsione
MODULO DUEData Mining 	“Per Data Mining si intende il processo di selezione, esplorazione e modellazione di grandi masse di dati, al fine di scoprire regolarità o relazioni non note a priori, e allo scopo di ottenere un risultato chiaro e utile” “Processo di esplorazione ed analisi, in modo totalmente o parzialmente automatizzato, di una grande quantità di dati al fine di individuare schemi e regole significativi (non noti a priori).“ (Berry, Linoff, 1997) Data Mining come parte di un processo più generale definito Knowledge Discovery in Database (KDD)  I temi di Data Mining saranno affrontati a partire dalla lezione numero 10
Knowledge Discovery in Database (KDD) 	Il termineKDDindical’interoprocessodiestrazionedellaconoscenzada un database, dall’individuazionedegliobiettividi business inizialifinoall’applicazionedelleregoledecisionalitrovate 	In quest’ambito, iltermine Data Mining è statoimpiegato per descrivere la fase del processodi KDD nelqualeglialgoritmidiapprendimentovengonoapplicatiaidati ,[object Object],[object Object]
Knowledge Discovery in Database (KDD)
Data Warehouse e fonti informative aziendali L’implementazione corretta di metodologie di Data Mining non è sufficiente per garantire il raggiungimento di risultati attendibili e duraturi nel tempo  vale la regola del “garbage in - garbage out”: per quanto un modello sia corretto e affinato non potrà mai sopperire alla scarsa correttezza/distorsione delle informazioni fornite in input al modello A monte dei modelli ci deve essere perciò un’ambiente dati robusto eaffidabile per evitare che informazioni errate in ingresso conducano e risultati altrettanto errati Tale ambiente è identificabile nel Data Warehouse (DWH), ossia in un unico, completo e consistente “contenitore” di dati ottenuti da fonti eterogenee, costruito per gli utenti finali in modo che essi possano realizzare analisi finalizzate al raggiungimento degli obiettivi di business preposti
Data Warehouse e fonti informative aziendali Il Data Warehausing si configura quindi come quel processo volto alla raccolta e alla gestione di dati da diverse fonti informative aziendali con il fine di rispondere alle diverse domande di business Il risultato di tale processo è un ambiente dati (Bill Inmon, 1996): Integrato: le diverse fonti confluiscono in un unico “contenitore” omogeneo al suo interno Orientato ai soggetti: il DWH incentrato sui principali temi d’interesse aziendale (clienti, prodotti, canali, etc.) e non sulle singole applicazioni/processi (vendite, prestiti, traffico in uscita, etc.) Non volatile: i dati contenuti nel DWH sono soggetti ad aggiornamenti periodici (generalmente mensili), che ne determinano la crescita continua, ma di fatto sono dati “statici” e non modificabili dagli utenti finali (accesso solo in lettura) Variabile nel tempo: i dati archiviati nel DWH rappresentano una “fotografia” periodica della situazione dell’aziendale e coprono un orizzonte temporale di diversi anni (storicità estesa)
Data Warehouse: Architettura Sistemi ERP  (Enterprise Resource Planning) ProcessiETL (Estrazione, Trasformazione e Caricamento) Ambienti e Motore  del Data Warehouse   Database  Operazionali DatiEsterni Metadati  (informazioni sui dati: tipo, origine, utilizzo, etc.) Fonti informative aziendali Query &  Reporting Data  Mining
Data Warehouse:i Data Mart Nelle aziende più grandi e articolate, l’ambiente centrale del DWH può essere suddiviso in più Data Mart, ossia in sotto ambienti alimentati dal DWH e dedicati ad una singola funzione aziendale: ,[object Object],Data Warehouse Data Mart 1 Marketing Data Mart 3 … Data Mart 2 Finanza
Data Warehouse vs. Database Operazionali I Database Operazionali (o Transazionali) sono ambienti.. ,[object Object]
Utilizzati per l’operatività quotidiana dell’azienda (transazioni, produzione, contatti, …)
Contengono in maniera dettagliata i dati attuali dell’azienda (aggiornamento real-time)
I dati sono normalizzati (non presentano ridondanze) ma la sintesi delle informazioni non è immediata in quanto richiede ulteriori passaggiIl Data Warehouse è un ambiente.. ,[object Object]
Utilizzato per analizzare il business (OLAP, Reporting, Data Mining) a supporto dei processi decisionali
Contiene in maniera aggregata i dati storici dell’azienda secondo fotografie
I dati sono denormalizzati (presentano ridondanze) ma la sintesi delle informazioni è immediata,[object Object]
Data MiningObiettivi e Tecniche Market basket analysis GRANDE DISTRIBUZIONE 		WEBMINING Click stream analysis WEBMINING Descrizione e sintesi Profiling eSegmentazione Fidelizzazione e abbandono  (Retention e Churn) Propensione e Scoring Risk management
Data MiningEsempio 1: Market Basket Analysis e GDO La MBA indaga quanto l’acquisto di un prodotto influenzi l’acquisto di un altro (o anche quanto l’acquisto in un reparto porti poi all’acquisto in un altro reparto) e permette di capire: ,[object Object]
quando sono vendute
in quale sequenzaQueste informazioni permettono di capire i prodotti più profittevoli e incoraggiare l’acquisto di prodotti che potrebbero essere altrimenti poco visti o difficili da ricordare per il consumatore. Per le analisi svolte a livello di reparto le implicazioni sono sulla vicinanza o lontananza di reparti che per i consumatori, in base al loro comportamento, sono connessi Utilizzando i risultati della MBA, i manager della GDO possono: ,[object Object]
trovare la gestione ottimale dei reparti e/o dei prodotti sugli scaffali (category management),[object Object]
Quando sono vendute

Contenu connexe

Tendances

Big Data: Analisi del Sentiment
Big Data: Analisi del SentimentBig Data: Analisi del Sentiment
Big Data: Analisi del SentimentMiriade Spa
 
Misurare e valutare le iniziative web: introduzione alla Web Analytics
Misurare e valutare le iniziative web: introduzione alla Web AnalyticsMisurare e valutare le iniziative web: introduzione alla Web Analytics
Misurare e valutare le iniziative web: introduzione alla Web AnalyticsAlberto Rota
 
Big Data & Data Mining
Big Data  & Data MiningBig Data  & Data Mining
Big Data & Data MiningAndrea Frison
 
Noovle: Big Data & BI
Noovle: Big Data & BINoovle: Big Data & BI
Noovle: Big Data & BILorenzo Ridi
 
Big Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social MediaBig Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social MediaValerio Torriero
 
Offering - Business Intelligence: il nostro approccio
Offering - Business Intelligence: il nostro approccioOffering - Business Intelligence: il nostro approccio
Offering - Business Intelligence: il nostro approccioXenesys
 
Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)
Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)
Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)Keen Consulting
 
Business intelligence: Un approccio Quick & Dirty
Business intelligence: Un approccio Quick & Dirty Business intelligence: Un approccio Quick & Dirty
Business intelligence: Un approccio Quick & Dirty SMAU
 
Smau Bologna 2015 - Paolo Pasini
Smau Bologna 2015 - Paolo PasiniSmau Bologna 2015 - Paolo Pasini
Smau Bologna 2015 - Paolo PasiniSMAU
 
Big data e data analitycs come e cosa fare dei dati raccolti
Big data e data analitycs come e cosa fare dei dati raccoltiBig data e data analitycs come e cosa fare dei dati raccolti
Big data e data analitycs come e cosa fare dei dati raccoltiDelta Sales
 
Smau Bologna 2014 - Business Intelligence, Analytics e Big Data: una guida pe...
Smau Bologna 2014 - Business Intelligence, Analytics e Big Data: una guida pe...Smau Bologna 2014 - Business Intelligence, Analytics e Big Data: una guida pe...
Smau Bologna 2014 - Business Intelligence, Analytics e Big Data: una guida pe...SMAU
 
Social Media Marketing 2014
Social Media Marketing 2014Social Media Marketing 2014
Social Media Marketing 2014Valerio Torriero
 
AISM_Lazzarini_Bologna_2015_v3
AISM_Lazzarini_Bologna_2015_v3AISM_Lazzarini_Bologna_2015_v3
AISM_Lazzarini_Bologna_2015_v3Fabio Lazzarini
 
Smau Bologna 2015 - AISM
Smau Bologna 2015 - AISMSmau Bologna 2015 - AISM
Smau Bologna 2015 - AISMSMAU
 

Tendances (20)

Big Data: Analisi del Sentiment
Big Data: Analisi del SentimentBig Data: Analisi del Sentiment
Big Data: Analisi del Sentiment
 
Misurare e valutare le iniziative web: introduzione alla Web Analytics
Misurare e valutare le iniziative web: introduzione alla Web AnalyticsMisurare e valutare le iniziative web: introduzione alla Web Analytics
Misurare e valutare le iniziative web: introduzione alla Web Analytics
 
Big Data & Data Mining
Big Data  & Data MiningBig Data  & Data Mining
Big Data & Data Mining
 
Big data
Big dataBig data
Big data
 
Noovle: Big Data & BI
Noovle: Big Data & BINoovle: Big Data & BI
Noovle: Big Data & BI
 
Big data e Business Intelligence | presentazione open day @Fondazione Kennedy...
Big data e Business Intelligence | presentazione open day @Fondazione Kennedy...Big data e Business Intelligence | presentazione open day @Fondazione Kennedy...
Big data e Business Intelligence | presentazione open day @Fondazione Kennedy...
 
Big Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social MediaBig Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social Media
 
Offering - Business Intelligence: il nostro approccio
Offering - Business Intelligence: il nostro approccioOffering - Business Intelligence: il nostro approccio
Offering - Business Intelligence: il nostro approccio
 
Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)
Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)
Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
Business intelligence: Un approccio Quick & Dirty
Business intelligence: Un approccio Quick & Dirty Business intelligence: Un approccio Quick & Dirty
Business intelligence: Un approccio Quick & Dirty
 
Smau Bologna 2015 - Paolo Pasini
Smau Bologna 2015 - Paolo PasiniSmau Bologna 2015 - Paolo Pasini
Smau Bologna 2015 - Paolo Pasini
 
Zeebra big dataanalytics_v1.1
Zeebra big dataanalytics_v1.1Zeebra big dataanalytics_v1.1
Zeebra big dataanalytics_v1.1
 
Big data e data analitycs come e cosa fare dei dati raccolti
Big data e data analitycs come e cosa fare dei dati raccoltiBig data e data analitycs come e cosa fare dei dati raccolti
Big data e data analitycs come e cosa fare dei dati raccolti
 
Big data
Big dataBig data
Big data
 
Smau Bologna 2014 - Business Intelligence, Analytics e Big Data: una guida pe...
Smau Bologna 2014 - Business Intelligence, Analytics e Big Data: una guida pe...Smau Bologna 2014 - Business Intelligence, Analytics e Big Data: una guida pe...
Smau Bologna 2014 - Business Intelligence, Analytics e Big Data: una guida pe...
 
Social Media Marketing 2014
Social Media Marketing 2014Social Media Marketing 2014
Social Media Marketing 2014
 
AISM_Lazzarini_Bologna_2015_v3
AISM_Lazzarini_Bologna_2015_v3AISM_Lazzarini_Bologna_2015_v3
AISM_Lazzarini_Bologna_2015_v3
 
Smau Bologna 2015 - AISM
Smau Bologna 2015 - AISMSmau Bologna 2015 - AISM
Smau Bologna 2015 - AISM
 

En vedette

Price assessment of discontinuous innovation CucinaBarilla
Price assessment of discontinuous innovation CucinaBarillaPrice assessment of discontinuous innovation CucinaBarilla
Price assessment of discontinuous innovation CucinaBarillaTarget Research
 
Building a semantic website
Building a semantic websiteBuilding a semantic website
Building a semantic websiteCJ Jenkins
 
Developing A Semantic Web Application - ISWC 2008 tutorial
Developing A Semantic Web Application -  ISWC 2008 tutorialDeveloping A Semantic Web Application -  ISWC 2008 tutorial
Developing A Semantic Web Application - ISWC 2008 tutorialEmanuele Della Valle
 
Case Study in Linked Data and Semantic Web: Human Genome
Case Study in Linked Data and Semantic Web: Human GenomeCase Study in Linked Data and Semantic Web: Human Genome
Case Study in Linked Data and Semantic Web: Human GenomeDavid Portnoy
 
Data Mining e Open Data
Data Mining e Open Data Data Mining e Open Data
Data Mining e Open Data Duccio Schiavon
 
L'applicazione delle tecniche di data mining alla personalizzazione dei siti ...
L'applicazione delle tecniche di data mining alla personalizzazione dei siti ...L'applicazione delle tecniche di data mining alla personalizzazione dei siti ...
L'applicazione delle tecniche di data mining alla personalizzazione dei siti ...Tiziana Capozzoli
 
Semantic web application architecture
Semantic web   application architectureSemantic web   application architecture
Semantic web application architectureDon Willems
 

En vedette (8)

Price assessment of discontinuous innovation CucinaBarilla
Price assessment of discontinuous innovation CucinaBarillaPrice assessment of discontinuous innovation CucinaBarilla
Price assessment of discontinuous innovation CucinaBarilla
 
Ascoltere la rete: la sentiment analysis
Ascoltere la rete: la sentiment analysisAscoltere la rete: la sentiment analysis
Ascoltere la rete: la sentiment analysis
 
Building a semantic website
Building a semantic websiteBuilding a semantic website
Building a semantic website
 
Developing A Semantic Web Application - ISWC 2008 tutorial
Developing A Semantic Web Application -  ISWC 2008 tutorialDeveloping A Semantic Web Application -  ISWC 2008 tutorial
Developing A Semantic Web Application - ISWC 2008 tutorial
 
Case Study in Linked Data and Semantic Web: Human Genome
Case Study in Linked Data and Semantic Web: Human GenomeCase Study in Linked Data and Semantic Web: Human Genome
Case Study in Linked Data and Semantic Web: Human Genome
 
Data Mining e Open Data
Data Mining e Open Data Data Mining e Open Data
Data Mining e Open Data
 
L'applicazione delle tecniche di data mining alla personalizzazione dei siti ...
L'applicazione delle tecniche di data mining alla personalizzazione dei siti ...L'applicazione delle tecniche di data mining alla personalizzazione dei siti ...
L'applicazione delle tecniche di data mining alla personalizzazione dei siti ...
 
Semantic web application architecture
Semantic web   application architectureSemantic web   application architecture
Semantic web application architecture
 

Similaire à Data Mining

Seminario Di Data Mining
Seminario Di Data MiningSeminario Di Data Mining
Seminario Di Data Miningvaluccia84
 
4a Data Mining e motori computazionali
4a Data Mining e motori computazionali4a Data Mining e motori computazionali
4a Data Mining e motori computazionaliMau-Messenger
 
Strumenti digitali professionisti - Gestione del dato
Strumenti digitali professionisti - Gestione del datoStrumenti digitali professionisti - Gestione del dato
Strumenti digitali professionisti - Gestione del datoFabio Tonini
 
Se la meta è la Self-Service Analytics, il Logical Data Warehouse ne è la rotta
Se la meta è la Self-Service Analytics, il Logical Data Warehouse ne è la rottaSe la meta è la Self-Service Analytics, il Logical Data Warehouse ne è la rotta
Se la meta è la Self-Service Analytics, il Logical Data Warehouse ne è la rottaDenodo
 
Potenzialità degli strumenti di gestione del portafoglio ICT
Potenzialità degli strumenti di gestione del portafoglio ICTPotenzialità degli strumenti di gestione del portafoglio ICT
Potenzialità degli strumenti di gestione del portafoglio ICTAgenda digitale Umbria
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligencelukic83
 
6 informatica per_azienda
6 informatica per_azienda6 informatica per_azienda
6 informatica per_aziendaJacques Bottel
 
Introduzione al Data Warehousing ed alla Progettazione di Data Warehouse Dime...
Introduzione al Data Warehousing ed alla Progettazione di Data Warehouse Dime...Introduzione al Data Warehousing ed alla Progettazione di Data Warehouse Dime...
Introduzione al Data Warehousing ed alla Progettazione di Data Warehouse Dime...Davide Ciambelli
 
I Software passano, i Dati restano.pdf
I Software passano, i Dati restano.pdfI Software passano, i Dati restano.pdf
I Software passano, i Dati restano.pdfAndrea Gioia
 
Business Intelligence & Analytics
Business Intelligence & AnalyticsBusiness Intelligence & Analytics
Business Intelligence & AnalyticsDavide Mauri
 
White Paper - L'analisi dei dati
White Paper - L'analisi dei datiWhite Paper - L'analisi dei dati
White Paper - L'analisi dei datiSogesi
 
2014 ottobre Big Data per Madee 6
2014 ottobre Big Data per Madee 62014 ottobre Big Data per Madee 6
2014 ottobre Big Data per Madee 6Gianluigi Cogo
 
White Paper Business Intelligence
White Paper Business IntelligenceWhite Paper Business Intelligence
White Paper Business IntelligenceGiovanni Rota
 
Basi di dati e gis n
Basi di dati e gis nBasi di dati e gis n
Basi di dati e gis nimartini
 
Estrazione della conoscenza dalla documentazione tecnica e di progetto
Estrazione della conoscenza dalla documentazione tecnica e di progettoEstrazione della conoscenza dalla documentazione tecnica e di progetto
Estrazione della conoscenza dalla documentazione tecnica e di progettoAMALITA MODENA
 
Data Mining per il supporto alle decisioni aziendali (Presentazione Tesi di L...
Data Mining per il supporto alle decisioni aziendali (Presentazione Tesi di L...Data Mining per il supporto alle decisioni aziendali (Presentazione Tesi di L...
Data Mining per il supporto alle decisioni aziendali (Presentazione Tesi di L...Alexandru Dinu
 
Strumenti di Business Intellingence 1: introduzione al data warehouse
Strumenti di Business Intellingence 1: introduzione al data warehouseStrumenti di Business Intellingence 1: introduzione al data warehouse
Strumenti di Business Intellingence 1: introduzione al data warehouseDatamaze
 

Similaire à Data Mining (20)

Seminario Di Data Mining
Seminario Di Data MiningSeminario Di Data Mining
Seminario Di Data Mining
 
4a Data Mining e motori computazionali
4a Data Mining e motori computazionali4a Data Mining e motori computazionali
4a Data Mining e motori computazionali
 
Strumenti digitali professionisti - Gestione del dato
Strumenti digitali professionisti - Gestione del datoStrumenti digitali professionisti - Gestione del dato
Strumenti digitali professionisti - Gestione del dato
 
CFO Analytics
CFO AnalyticsCFO Analytics
CFO Analytics
 
2470620 data-warehouse
2470620 data-warehouse2470620 data-warehouse
2470620 data-warehouse
 
Se la meta è la Self-Service Analytics, il Logical Data Warehouse ne è la rotta
Se la meta è la Self-Service Analytics, il Logical Data Warehouse ne è la rottaSe la meta è la Self-Service Analytics, il Logical Data Warehouse ne è la rotta
Se la meta è la Self-Service Analytics, il Logical Data Warehouse ne è la rotta
 
Potenzialità degli strumenti di gestione del portafoglio ICT
Potenzialità degli strumenti di gestione del portafoglio ICTPotenzialità degli strumenti di gestione del portafoglio ICT
Potenzialità degli strumenti di gestione del portafoglio ICT
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
6 informatica per_azienda
6 informatica per_azienda6 informatica per_azienda
6 informatica per_azienda
 
Introduzione al Data Warehousing ed alla Progettazione di Data Warehouse Dime...
Introduzione al Data Warehousing ed alla Progettazione di Data Warehouse Dime...Introduzione al Data Warehousing ed alla Progettazione di Data Warehouse Dime...
Introduzione al Data Warehousing ed alla Progettazione di Data Warehouse Dime...
 
I Software passano, i Dati restano.pdf
I Software passano, i Dati restano.pdfI Software passano, i Dati restano.pdf
I Software passano, i Dati restano.pdf
 
Business Intelligence & Analytics
Business Intelligence & AnalyticsBusiness Intelligence & Analytics
Business Intelligence & Analytics
 
White Paper - L'analisi dei dati
White Paper - L'analisi dei datiWhite Paper - L'analisi dei dati
White Paper - L'analisi dei dati
 
2014 ottobre Big Data per Madee 6
2014 ottobre Big Data per Madee 62014 ottobre Big Data per Madee 6
2014 ottobre Big Data per Madee 6
 
White Paper Business Intelligence
White Paper Business IntelligenceWhite Paper Business Intelligence
White Paper Business Intelligence
 
Basi di dati e gis n
Basi di dati e gis nBasi di dati e gis n
Basi di dati e gis n
 
Estrazione della conoscenza dalla documentazione tecnica e di progetto
Estrazione della conoscenza dalla documentazione tecnica e di progettoEstrazione della conoscenza dalla documentazione tecnica e di progetto
Estrazione della conoscenza dalla documentazione tecnica e di progetto
 
Bi perchè 2010
Bi perchè 2010Bi perchè 2010
Bi perchè 2010
 
Data Mining per il supporto alle decisioni aziendali (Presentazione Tesi di L...
Data Mining per il supporto alle decisioni aziendali (Presentazione Tesi di L...Data Mining per il supporto alle decisioni aziendali (Presentazione Tesi di L...
Data Mining per il supporto alle decisioni aziendali (Presentazione Tesi di L...
 
Strumenti di Business Intellingence 1: introduzione al data warehouse
Strumenti di Business Intellingence 1: introduzione al data warehouseStrumenti di Business Intellingence 1: introduzione al data warehouse
Strumenti di Business Intellingence 1: introduzione al data warehouse
 

Plus de Target Research

Il significato intergenerazionale attribuito ai fiori
Il significato intergenerazionale attribuito ai fioriIl significato intergenerazionale attribuito ai fiori
Il significato intergenerazionale attribuito ai fioriTarget Research
 
Come Gardaland può vincere la sfida dei grandi parchi tematici internazional...
 Come Gardaland può vincere la sfida dei grandi parchi tematici internazional... Come Gardaland può vincere la sfida dei grandi parchi tematici internazional...
Come Gardaland può vincere la sfida dei grandi parchi tematici internazional...Target Research
 
Analisi ristoranti in zona Uni. Bocconi
Analisi ristoranti in zona Uni. BocconiAnalisi ristoranti in zona Uni. Bocconi
Analisi ristoranti in zona Uni. BocconiTarget Research
 
Competizione nel mercato delle TV a grande schermo
Competizione nel mercato delle TV a grande schermoCompetizione nel mercato delle TV a grande schermo
Competizione nel mercato delle TV a grande schermoTarget Research
 
Mobilità a Milano: Car sharing o possesso dell’auto?
Mobilità  a  Milano: Car sharing  o  possesso dell’auto?Mobilità  a  Milano: Car sharing  o  possesso dell’auto?
Mobilità a Milano: Car sharing o possesso dell’auto?Target Research
 
Marvel e DC Comics, conflitto negli universi cinematografici
Marvel e DC Comics, conflitto negli universi cinematograficiMarvel e DC Comics, conflitto negli universi cinematografici
Marvel e DC Comics, conflitto negli universi cinematograficiTarget Research
 
Drinks, food, social e location: i must per aprire un ristorante di sushi oggi
Drinks, food, social e location: i must per aprire un ristorante di sushi oggiDrinks, food, social e location: i must per aprire un ristorante di sushi oggi
Drinks, food, social e location: i must per aprire un ristorante di sushi oggiTarget Research
 
CASEVACANZA.IT E HOMEAWAY CONTRO I COLOSSI DELLE PRENOTAZIONI ONLINE.
  CASEVACANZA.IT E HOMEAWAY CONTRO I COLOSSI DELLE PRENOTAZIONI ONLINE.  CASEVACANZA.IT E HOMEAWAY CONTRO I COLOSSI DELLE PRENOTAZIONI ONLINE.
CASEVACANZA.IT E HOMEAWAY CONTRO I COLOSSI DELLE PRENOTAZIONI ONLINE.Target Research
 
DIRITTI SERIE A 2018: L’OFFERTA DI INTRATTENIMENTO IDEALE NEL NUOVO SCENARIO ...
DIRITTI SERIE A 2018: L’OFFERTA DI INTRATTENIMENTO IDEALE NEL NUOVO SCENARIO ...DIRITTI SERIE A 2018: L’OFFERTA DI INTRATTENIMENTO IDEALE NEL NUOVO SCENARIO ...
DIRITTI SERIE A 2018: L’OFFERTA DI INTRATTENIMENTO IDEALE NEL NUOVO SCENARIO ...Target Research
 
McDonald's e i fast food in Italia
McDonald's e i fast food in ItaliaMcDonald's e i fast food in Italia
McDonald's e i fast food in ItaliaTarget Research
 
Futuro della personal mobility oppure giocattolo di puro divertimento?
Futuro della personal mobility oppure giocattolo di puro divertimento?Futuro della personal mobility oppure giocattolo di puro divertimento?
Futuro della personal mobility oppure giocattolo di puro divertimento?Target Research
 
Adaptive choice based conjoint analysis vs full profile conjoint analysis
Adaptive choice based conjoint analysis vs full profile conjoint analysisAdaptive choice based conjoint analysis vs full profile conjoint analysis
Adaptive choice based conjoint analysis vs full profile conjoint analysisTarget Research
 
Il ruolo delle guide per ristoranti nell’era digitale
Il ruolo delle guide per ristoranti nell’era digitaleIl ruolo delle guide per ristoranti nell’era digitale
Il ruolo delle guide per ristoranti nell’era digitaleTarget Research
 
PREVENZIONE E RIDUZIONE DELLO SPRECO ALIMENTARE
PREVENZIONE E RIDUZIONE DELLO SPRECO ALIMENTAREPREVENZIONE E RIDUZIONE DELLO SPRECO ALIMENTARE
PREVENZIONE E RIDUZIONE DELLO SPRECO ALIMENTARETarget Research
 
Cross fit vs palestre tradizionali
Cross fit vs palestre tradizionaliCross fit vs palestre tradizionali
Cross fit vs palestre tradizionaliTarget Research
 
Caffè e capsule: Il caso Lavazza
Caffè e capsule: Il caso LavazzaCaffè e capsule: Il caso Lavazza
Caffè e capsule: Il caso LavazzaTarget Research
 
Lo scooter ideale per i giovani
Lo scooter ideale per i giovaniLo scooter ideale per i giovani
Lo scooter ideale per i giovaniTarget Research
 
Centri wellness: come attrarre i giovani
Centri wellness: come attrarre i giovaniCentri wellness: come attrarre i giovani
Centri wellness: come attrarre i giovaniTarget Research
 

Plus de Target Research (20)

Il significato intergenerazionale attribuito ai fiori
Il significato intergenerazionale attribuito ai fioriIl significato intergenerazionale attribuito ai fiori
Il significato intergenerazionale attribuito ai fiori
 
Evoluzione Sky - NOW
Evoluzione Sky - NOWEvoluzione Sky - NOW
Evoluzione Sky - NOW
 
Come Gardaland può vincere la sfida dei grandi parchi tematici internazional...
 Come Gardaland può vincere la sfida dei grandi parchi tematici internazional... Come Gardaland può vincere la sfida dei grandi parchi tematici internazional...
Come Gardaland può vincere la sfida dei grandi parchi tematici internazional...
 
Analisi ristoranti in zona Uni. Bocconi
Analisi ristoranti in zona Uni. BocconiAnalisi ristoranti in zona Uni. Bocconi
Analisi ristoranti in zona Uni. Bocconi
 
Competizione nel mercato delle TV a grande schermo
Competizione nel mercato delle TV a grande schermoCompetizione nel mercato delle TV a grande schermo
Competizione nel mercato delle TV a grande schermo
 
Mobilità a Milano: Car sharing o possesso dell’auto?
Mobilità  a  Milano: Car sharing  o  possesso dell’auto?Mobilità  a  Milano: Car sharing  o  possesso dell’auto?
Mobilità a Milano: Car sharing o possesso dell’auto?
 
Marvel e DC Comics, conflitto negli universi cinematografici
Marvel e DC Comics, conflitto negli universi cinematograficiMarvel e DC Comics, conflitto negli universi cinematografici
Marvel e DC Comics, conflitto negli universi cinematografici
 
Drinks, food, social e location: i must per aprire un ristorante di sushi oggi
Drinks, food, social e location: i must per aprire un ristorante di sushi oggiDrinks, food, social e location: i must per aprire un ristorante di sushi oggi
Drinks, food, social e location: i must per aprire un ristorante di sushi oggi
 
CASEVACANZA.IT E HOMEAWAY CONTRO I COLOSSI DELLE PRENOTAZIONI ONLINE.
  CASEVACANZA.IT E HOMEAWAY CONTRO I COLOSSI DELLE PRENOTAZIONI ONLINE.  CASEVACANZA.IT E HOMEAWAY CONTRO I COLOSSI DELLE PRENOTAZIONI ONLINE.
CASEVACANZA.IT E HOMEAWAY CONTRO I COLOSSI DELLE PRENOTAZIONI ONLINE.
 
DIRITTI SERIE A 2018: L’OFFERTA DI INTRATTENIMENTO IDEALE NEL NUOVO SCENARIO ...
DIRITTI SERIE A 2018: L’OFFERTA DI INTRATTENIMENTO IDEALE NEL NUOVO SCENARIO ...DIRITTI SERIE A 2018: L’OFFERTA DI INTRATTENIMENTO IDEALE NEL NUOVO SCENARIO ...
DIRITTI SERIE A 2018: L’OFFERTA DI INTRATTENIMENTO IDEALE NEL NUOVO SCENARIO ...
 
McDonald's e i fast food in Italia
McDonald's e i fast food in ItaliaMcDonald's e i fast food in Italia
McDonald's e i fast food in Italia
 
Futuro della personal mobility oppure giocattolo di puro divertimento?
Futuro della personal mobility oppure giocattolo di puro divertimento?Futuro della personal mobility oppure giocattolo di puro divertimento?
Futuro della personal mobility oppure giocattolo di puro divertimento?
 
Adaptive choice based conjoint analysis vs full profile conjoint analysis
Adaptive choice based conjoint analysis vs full profile conjoint analysisAdaptive choice based conjoint analysis vs full profile conjoint analysis
Adaptive choice based conjoint analysis vs full profile conjoint analysis
 
Il ruolo delle guide per ristoranti nell’era digitale
Il ruolo delle guide per ristoranti nell’era digitaleIl ruolo delle guide per ristoranti nell’era digitale
Il ruolo delle guide per ristoranti nell’era digitale
 
PREVENZIONE E RIDUZIONE DELLO SPRECO ALIMENTARE
PREVENZIONE E RIDUZIONE DELLO SPRECO ALIMENTAREPREVENZIONE E RIDUZIONE DELLO SPRECO ALIMENTARE
PREVENZIONE E RIDUZIONE DELLO SPRECO ALIMENTARE
 
Cross fit vs palestre tradizionali
Cross fit vs palestre tradizionaliCross fit vs palestre tradizionali
Cross fit vs palestre tradizionali
 
Caffè e capsule: Il caso Lavazza
Caffè e capsule: Il caso LavazzaCaffè e capsule: Il caso Lavazza
Caffè e capsule: Il caso Lavazza
 
Lo scooter ideale per i giovani
Lo scooter ideale per i giovaniLo scooter ideale per i giovani
Lo scooter ideale per i giovani
 
Il futuro del cinema
Il futuro del cinemaIl futuro del cinema
Il futuro del cinema
 
Centri wellness: come attrarre i giovani
Centri wellness: come attrarre i giovaniCentri wellness: come attrarre i giovani
Centri wellness: come attrarre i giovani
 

Data Mining

  • 1. Introduzione al corso Datawarehouse e fonti informative aziendali DATA MINING Luca Molteni
  • 2. Programma e obiettivi del corso Il corso propone di introdurre il concetto di Data Mining e di presentare le principali tecniche statistiche che possono essere utilmente impiegate in quest’ambito per la soluzione di problemi aziendali E’ strutturato in due principali moduli: Il primo è incentrato sul tema delle previsioni delle vendite: saranno presentati, a questo proposito, i metodi di decomposizione classica, di attenuazione esponenziale (Holt-Winters) e la modellistica ARIMA La seconda parte del corso è dedicata al Customer Relationship Management ed in particolare ai temi legati alla profilazione della clientela, all’analisi del comportamento d’acquisto dei consumatori e allo scoring della clientela
  • 3. Programma e obiettivi del corso Numerose sono le tecniche statistiche multivariate che è possibile impiegare per rispondere agli obiettivi conoscitivi indicati Il corso di Data Mining propone: algoritmi di classificazione ad albero, regressione lineare multipla, reti neurali, mappe di Kohonen, market basket analysis, analisi discriminante lineare e regressione logistica Il corso è caratterizzato da un alternarsi di lezioni di natura metodologica e di lezioni di natura più applicativa, mediante ricorso a una serie di casi aziendali e all’uso di specifici software diffusi sul mercato (SPSS e Modeler).
  • 4.
  • 5. MODULO UNOPrevisioni delle vendite Il corso prevede lo studio di tecniche di previsione quantitative che si basano proprio sull’uso di dati storici, dai quali l’analista cerca di comprendere la struttura sottostante il fenomeno per poi utilizzarla a scopi previsivi Alla base dell’analisi delle serie storiche vi è l’assunzione secondo cui i fattori che hanno influenzato l’andamento della serie nel passato e nel presente continuino a esercitare effetti analoghi anche nel futuro SOFTWARE UTILIZZATI Excel SPSS Clementine (reti neurali)
  • 6. 6 Metodi e algoritmi di previsione
  • 7. MODULO DUEData Mining “Per Data Mining si intende il processo di selezione, esplorazione e modellazione di grandi masse di dati, al fine di scoprire regolarità o relazioni non note a priori, e allo scopo di ottenere un risultato chiaro e utile” “Processo di esplorazione ed analisi, in modo totalmente o parzialmente automatizzato, di una grande quantità di dati al fine di individuare schemi e regole significativi (non noti a priori).“ (Berry, Linoff, 1997) Data Mining come parte di un processo più generale definito Knowledge Discovery in Database (KDD) I temi di Data Mining saranno affrontati a partire dalla lezione numero 10
  • 8.
  • 9. Knowledge Discovery in Database (KDD)
  • 10. Data Warehouse e fonti informative aziendali L’implementazione corretta di metodologie di Data Mining non è sufficiente per garantire il raggiungimento di risultati attendibili e duraturi nel tempo  vale la regola del “garbage in - garbage out”: per quanto un modello sia corretto e affinato non potrà mai sopperire alla scarsa correttezza/distorsione delle informazioni fornite in input al modello A monte dei modelli ci deve essere perciò un’ambiente dati robusto eaffidabile per evitare che informazioni errate in ingresso conducano e risultati altrettanto errati Tale ambiente è identificabile nel Data Warehouse (DWH), ossia in un unico, completo e consistente “contenitore” di dati ottenuti da fonti eterogenee, costruito per gli utenti finali in modo che essi possano realizzare analisi finalizzate al raggiungimento degli obiettivi di business preposti
  • 11. Data Warehouse e fonti informative aziendali Il Data Warehausing si configura quindi come quel processo volto alla raccolta e alla gestione di dati da diverse fonti informative aziendali con il fine di rispondere alle diverse domande di business Il risultato di tale processo è un ambiente dati (Bill Inmon, 1996): Integrato: le diverse fonti confluiscono in un unico “contenitore” omogeneo al suo interno Orientato ai soggetti: il DWH incentrato sui principali temi d’interesse aziendale (clienti, prodotti, canali, etc.) e non sulle singole applicazioni/processi (vendite, prestiti, traffico in uscita, etc.) Non volatile: i dati contenuti nel DWH sono soggetti ad aggiornamenti periodici (generalmente mensili), che ne determinano la crescita continua, ma di fatto sono dati “statici” e non modificabili dagli utenti finali (accesso solo in lettura) Variabile nel tempo: i dati archiviati nel DWH rappresentano una “fotografia” periodica della situazione dell’aziendale e coprono un orizzonte temporale di diversi anni (storicità estesa)
  • 12. Data Warehouse: Architettura Sistemi ERP (Enterprise Resource Planning) ProcessiETL (Estrazione, Trasformazione e Caricamento) Ambienti e Motore del Data Warehouse Database Operazionali DatiEsterni Metadati (informazioni sui dati: tipo, origine, utilizzo, etc.) Fonti informative aziendali Query & Reporting Data Mining
  • 13.
  • 14.
  • 15. Utilizzati per l’operatività quotidiana dell’azienda (transazioni, produzione, contatti, …)
  • 16. Contengono in maniera dettagliata i dati attuali dell’azienda (aggiornamento real-time)
  • 17.
  • 18. Utilizzato per analizzare il business (OLAP, Reporting, Data Mining) a supporto dei processi decisionali
  • 19. Contiene in maniera aggregata i dati storici dell’azienda secondo fotografie
  • 20.
  • 21. Data MiningObiettivi e Tecniche Market basket analysis GRANDE DISTRIBUZIONE WEBMINING Click stream analysis WEBMINING Descrizione e sintesi Profiling eSegmentazione Fidelizzazione e abbandono (Retention e Churn) Propensione e Scoring Risk management
  • 22.
  • 24.
  • 25.
  • 27.
  • 29. In quale sequenzaLe regole a livello di reparto, possono avere implicazioni importanti a livello di layout del punto vendita. Reparti connessi andranno posizionati vicini o lontani Le regole a livello di marca offrono informazioni sulle relazioni tra marche utili nelle scelte di composizione dello scaffale
  • 30. Data MiningEsempio 2: Customer Churn e settore Energy L’anticipazione del fenomeno dell’abbandono da parte dei propri clienti rappresenta per le imprese un elemento importante nel complesso delle azioni volte a stabilire un rapporto privilegiato e duraturo nel tempo con la clientela medesima L’implementazione di modelli di Churn porta allo sviluppo di un processo operativo che prevede: l’assegnazione ad ogni cliente di una probabilità di abbandono su un orizzonte temporale definito la selezione di una lista di nominativi ad “alto rischio” l’attivazione di un’azione volta alla retention, che utilizza i canali ritenuti più opportuni per contattare i suddetti nominativi la formulazione di proposte di prodotti/ servizi in grado di soddisfare le esigenze fino a quel momento non soddisfatte   la verifica a posteriori della riduzione ottenuta nel tasso di “Customer Attrition” 
  • 31.
  • 32. Gli utilizzatori sono alla ricerca di fornitori in grado di dimostrarsi flessibili nell’offerta ed efficienti nella gestione dei problemi tecnici
  • 33. L’insoddisfazione per queste ed altre dimensioni, in un contesto dove le barriere all’uscita si stanno sempre di più assottigliando, spinge l’utente a rivolgersi verso altri fornitori
  • 34. A seguito della liberalizzazione del mercato, il livello di Customer Churn del settore a livello europeo si è spinto oltre il 15% e L’Italia è un dei paesi dove il fenomeno è più accentuato
  • 36. Fornire una stima dell’abbandono dei clienti attraverso la previsione della loro propensione a migrare verso i competitor
  • 37. Implementazione di campagne di retention efficaci in modo da prevenire il churn prima che esso si manifesti
  • 38.
  • 39. Dopo aver raccolto internamente i dati sui clienti che nel passato hanno cambiato fornitore, è possibile creare un modello di scoring ad hoc che relazioni il fenomeno dell’abbandono alle altre informazioni presenti nel database aziendale (tipo di contratto stipulato, utilizzo, rapporti con l’assistenza tecnica, altre problematicità, etc.)
  • 40. I modelli generati attraverso algoritmi complessi (come reti neurali, alberi di classificazione e regressione logistica) permettono di classificare sia i clienti acquisiti sia i nuovi in funzione della loro probabilità di abbandono
  • 41.
  • 42. Targeting della clientela offerte mirate e ottimizzazione delle campagne
  • 43. Riduzione del tasso di abbandono
  • 44. Valorizzazione dei clienti più profittevoli e incremento della marginalità
  • 45. Il peggior 20% di clienti (in termini di probabilità di abbandono stimata dal modello) comprende quasi il 60% degli effettivi churners
  • 46.
  • 47. Gli algoritmi di Data Mining forniscono strumenti per la misurazione del rischio di credito che risultano fondamentali per ottenere in maniera rigorosa una grande molteplicità di informazioni e soluzioni statisticamente robuste, da coniugare con l'esperienza e la valutazione umana nei processi di decisione
  • 48.