Supply Chain: Attori, gestione e dati di un progetto di Supply Chain
La tesi in slide
1. L’applicazione del data mining ai siti web di e-commerce Dal web usage mining al social data mining
2.
3.
4.
5.
6.
7.
8.
9.
10. Esempio m … … … Classe (y i ) x ij Esempio i … … .. … Esempio4 Classe1 Esempio3 Classe2 Esempio2 Classe1 Esempio1 Classe Attributo n Attributo2 Attributo1
11. Classificazione Il caso Carla è rappresentato dal punto nero in uno spazio a quattro dimensioni. La posizione nello spazio è determinata dai valori assunti da Carla rispetto ai quattro attributi .
24. Curva ROC Questa curva ha come coordinate in ascisse (1- la specificità, cioè la probabilità dell’errore di secondo tipo) e in ordinata la sensitività, cioè (1-la probabilità dell’errore di primo tipo) 1- la probabilità dell’errore di secondo tipo (falsi negativi)
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35. Il processo di personalizzazione Analisi dei dati Raccolta dei web data User profiling e User profiling Collaborative filtering Content based filtering Web usage mining Scelta del tipo di personalizzazione Contenuto Interfaccia Presentazione
36.
37.
38.
39.
40.
41.
42.
43.
44. User profile Fonte: adattamento da (van Dijk et alt., 2005, p.13) … . … .. Expertise: fisica quantistica, giardinaggio, motori, etc Conosco Comportamento: lavoro, ascolto musica, etc Faccio Obiettivi: carriera, vita sociale, etc Voglio Circostanze: studio, cerco casa/lavoro/un’auto, organizzo un viaggio, etc Possiedo Interessi: pittura, immersioni, internet, etc Mi piace Preferenze: musica, arte, notizie, cibo, viaggi, etc Preferisco Me: personalità, Io sono + Identificatori: nome utente, password, domande segrete,etc Io sono
45.
46.
47.
48. Preparazione dei dati Usage Mining File del sito e metadati Server Log Pulizia dei dati Identificazione degli utenti e delle transazioni Statistiche d’uso File delle transazioni utente Transaction clustering Usage clustering Association rule discovery Itemset frequenti Cluster di URL Motore di Raccomandazione Sessione attiva Client browser Raccomandazioni Web server Componente off line Componente on line Struttura del Web Personalizer Fonte: adattamento da (Mobasher et al., 2000)
49.
50.
51.
52.
53.
54.
55.
56.
57. Web Logs Contenuto del sito web Tassonomia Tesaurus Clusters dei documenti Usage pattern C- Logs Web Log Preprocessati Motore di raccomandazione Meccanismo di pubblicazione Preprocessing dei dati Web Usage Mining Clustering dei documenti Creazione dei C-Logs Fonte: Adattamento da (Eirinaki et al., 2003)
58.
59. Il web semantico URI UNICODE XML + NAMESPACE + XML SCHEMA RDF + RDF SCHEMA FIRMA DIGITALE OWL LOGICA PROVA FIDUCIA D O M A N I O G G I I E R I Fonte: adattamento da (Berners-Lee, 2001)
60.
61. RDF (Berners-Lee et al., 2001). La frase “Ora Lassila è il creatore della pagina http://www.w3c.org/home/Lassila, http://www.w3.org/Home/Lassila Ora Lassila Creator
62.
63.
64.
65.
66. Struttura del sistema di personalizzazione che integra conoscenza di dominio e profili d’uso Fonte: adattamento da (Dai e Mobasher, 2002) Preparazione dei dati Usage Mining Files del sito e metadati Usage data Conoscenza di dominio Preprocessing dei dati Identificazione delle pageviews, sessioni, utenti e transazioni File delle transazioni utente Derivazione dei profili aggregati Transaction clustering pageview/item clustering Association rule discovery Sequential pattern discovery Profili d’uso
67. Fase di raccomandazione Conoscenza di dominio Profili d’uso aggregati Profilo d’uso individuale Motore di Raccomandazione Profilo utente integrato Sessione attiva Client browser Raccomandazioni Web server Fonte: adattamento da Dai e Mobasher, 2002
89. Small World In un network Small World ci si aspetta di trovare un gruppo ampiamente unificato, un network in cui sia impossibile nascondersi per quanto è interconnesso.
101. Sistema di analisi del linguaggio naturale Fonte: adattamento da (Glance et al., 2005).
102.
103.
104.
105.
106.
107.
108.
109.
110.
111. Bridging the gap between on-line shoppers and online shopping websites. A user centered analysis
112.
113.
114. Lo studio pilota Analisi dettagliata di tutte le caratteristiche di 30 siti web di e-commerce considerati. Individuazione di sezioni comuni tra i vari siti Analisi delle caratteristiche di 20 siti web riconducibili alle sezioni individuate Sintesi delle caratteristiche nella scheda di valutazione con diversi livelli di astrazione