SlideShare une entreprise Scribd logo
1  sur  42
Télécharger pour lire hors ligne
!
Trend Analysis @ SenTaClAus!
Pisa – Dipartimento di Informatica!
23/03/2015!
!
Luca De Santis – desantis@netseven.it - @lucadex!
!
In principio… era il Social Proxy!!
•  Nasce da l’esigenza di
COOP Italia di
integrare i propri
sistemi con i Social
Network!
–  Non a caso proxy…!
–  2010 inizio
progettazione!
–  2011 primo rilascio!
•  Enfasi su funzionalità
“editoriali”!
•  Business Logic
implementata via ESB!
!
In principio… era il Social Proxy!!
•  Nasce da l’esigenza di
COOP Italia di
integrare i propri
sistemi con i Social
Network!
–  Non a caso proxy…!
–  2010 inizio
progettazione!
–  2011 primo rilascio!
•  Enfasi su funzionalità
“editoriali”!
•  Business Logic
implementata via ESB!
!
In principio… era il Social Proxy!!
•  Nasce da l’esigenza di
COOP Italia di
integrare i propri
sistemi con i Social
Network!
–  Non a caso proxy…!
–  2010 inizio
progettazione!
–  2011 primo rilascio!
•  Enfasi su funzionalità
“editoriali”!
•  Business Logic
implementata via ESB!
!
In principio… era il Social Proxy!!
•  Nasce da l’esigenza di
COOP Italia di
integrare i propri
sistemi con i Social
Network!
–  Non a caso proxy…!
–  2010 inizio
progettazione!
–  2011 primo rilascio!
•  Enfasi su funzionalità
“editoriali”!
•  Business Logic
implementata via ESB!
!
•  Regole parametriche per
recuperare contenuti da molteplici
fonti!
–  Facebook (pagine, accounts, gruppi, ricerca,
timeline dell’utente)!
–  Twitter (ricerca, ricerca geografica, accounts,
timeline dell’utente)!
–  Instagram (ricerca, ricerca geografica,
accounts, timeline dell’utente)!
–  LinkedIn (gruppi, companies, persone,
aggiornamenti del network)!
–  YouTube (ricerche, canali) !
–  Foursquare (tips delle venues)!
–  Pinterest (utenti, boards)!
–  Feed RSS/Atom (siti web, blog)!
•  I contenuti recuperati possono
essere indicizzati su un motore di
ricerca locale (Apache Solr) per
ulteriori filtraggi.!
Versione 2.0 – Funzionalità di ascolto!
!
•  Regole parametriche per
recuperare contenuti da molteplici
fonti!
–  Facebook (pagine, accounts, gruppi, ricerca,
timeline dell’utente)!
–  Twitter (ricerca, ricerca geografica, accounts,
timeline dell’utente)!
–  Instagram (ricerca, ricerca geografica,
accounts, timeline dell’utente)!
–  LinkedIn (gruppi, companies, persone,
aggiornamenti del network)!
–  YouTube (ricerche, canali) !
–  Foursquare (tips delle venues)!
–  Pinterest (utenti, boards)!
–  Feed RSS/Atom (siti web, blog)!
•  I contenuti recuperati possono
essere indicizzati su un motore di
ricerca locale (Apache Solr) per
ulteriori filtraggi.!
Versione 2.0 – Funzionalità di ascolto!
!
•  Regole parametriche per
recuperare contenuti da molteplici
fonti!
–  Facebook (pagine, accounts, gruppi, ricerca,
timeline dell’utente)!
–  Twitter (ricerca, ricerca geografica, accounts,
timeline dell’utente)!
–  Instagram (ricerca, ricerca geografica,
accounts, timeline dell’utente)!
–  LinkedIn (gruppi, companies, persone,
aggiornamenti del network)!
–  YouTube (ricerche, canali) !
–  Foursquare (tips delle venues)!
–  Pinterest (utenti, boards)!
–  Feed RSS/Atom (siti web, blog)!
•  I contenuti recuperati possono
essere indicizzati su un motore di
ricerca locale (Apache Solr) per
ulteriori filtraggi.!
Versione 2.0 – Funzionalità di ascolto!
!
•  Regole parametriche per
recuperare contenuti da molteplici
fonti!
–  Facebook (pagine, accounts, gruppi, ricerca,
timeline dell’utente)!
–  Twitter (ricerca, ricerca geografica, accounts,
timeline dell’utente)!
–  Instagram (ricerca, ricerca geografica,
accounts, timeline dell’utente)!
–  LinkedIn (gruppi, companies, persone,
aggiornamenti del network)!
–  YouTube (ricerche, canali) !
–  Foursquare (tips delle venues)!
–  Pinterest (utenti, boards)!
–  Feed RSS/Atom (siti web, blog)!
•  I contenuti recuperati possono
essere indicizzati su un motore di
ricerca locale (Apache Solr) per
ulteriori filtraggi.!
Versione 2.0 – Funzionalità di ascolto!
!
•  Regole parametriche per
recuperare contenuti da molteplici
fonti!
–  Facebook (pagine, accounts, gruppi, ricerca,
timeline dell’utente)!
–  Twitter (ricerca, ricerca geografica, accounts,
timeline dell’utente)!
–  Instagram (ricerca, ricerca geografica,
accounts, timeline dell’utente)!
–  LinkedIn (gruppi, companies, persone,
aggiornamenti del network)!
–  YouTube (ricerche, canali) !
–  Foursquare (tips delle venues)!
–  Pinterest (utenti, boards)!
–  Feed RSS/Atom (siti web, blog)!
•  I contenuti recuperati possono
essere indicizzati su un motore di
ricerca locale (Apache Solr) per
ulteriori filtraggi.!
Versione 2.0 – Funzionalità di ascolto!
!
•  Usare strumenti di Named Entity Extraction per identificare i
concetti nel testo!
–  Uso di TagMe!!
•  Nasce il servizio di Trend Analysis!
•  Analisi in tempo pressoché reale: identifico i concetti man
mano che recupero i post!
Come fare una sintesi di tutto ciò?!
!
•  Usare strumenti di Named Entity Extraction per identificare i
concetti nel testo!
–  Uso di TagMe!!
•  Nasce il servizio di Trend Analysis!
•  Analisi in tempo pressoché reale: identifico i concetti man
mano che recupero i post!
Come fare una sintesi di tutto ciò?!
!
•  Usare strumenti di Named Entity Extraction per identificare i
concetti nel testo!
–  Uso di TagMe!!
•  Nasce il servizio di Trend Analysis!
•  Analisi in tempo pressoché reale: identifico i concetti man
mano che recupero i post!
Come fare una sintesi di tutto ciò?!
!
•  Usare strumenti di Named Entity Extraction per identificare i
concetti nel testo!
–  Uso di TagMe!!
•  Nasce il servizio di Trend Analysis!
•  Analisi in tempo pressoché reale: identifico i concetti man
mano che recupero i post!
Come fare una sintesi di tutto ciò?!
Conce&o	
  X	
   Conce&o	
  Z	
  
!
Il lavoro in SenTaClAus!
•  Estensioni della Trend Analysis!
–  Miglioramenti nell’efficacia, grazie alle corrispondenti evoluzioni nella
Text Analysis!
–  Nuove analisi (e corrispondenti interfacce grafiche)!
•  Link Analysis!
•  Analisi geografiche!
•  Analisi degli Influencers!
•  Sperimentazioni sulla Sentiment Analysis!
–  Si sfrutta la logica di elaborazione “a catena di montaggio” dell’ESB!
! Enterprise	
  Service	
  Bus	
  
Immagini © http://ecquire.com/blog/social-media-sales-funnel/ - http://rvtechsolutions.com/socialmediabreakfast/willmar-lakes-area/
Esempi di Trend Analysis: menzioni @Unipisa!
Esempi di Trend Analysis: menzioni @Unipisa!
Esempi di Trend Analysis: menzioni @Unipisa!
Esempi di Trend Analysis: menzioni @Unipisa!
Ricerca #serviziopubblico!
Ricerca #serviziopubblico!
Ricerca #serviziopubblico!
Disambiguazione hashtags !
Link Analysis!
Link Analysis!
Mappe!
Mappe!
!
•  Tecnica ispirata dall’articolo
Identification of influential spreaders in
complex networks (Kitsal et al, 2010)!
–  Il grado con cui una persona riesce a
diffondere qualcosa (anche un virus!)
non dipende tanto dal numero dei suoi
collegamenti ma da dove è posizionata
nel grafo. !
–  Se si trova al centro diffonde molto di
più di una in periferia, anche se
quest'ultima ha molti più contatti.!
–  Inoltre le persone nel centro diffondono
con la stessa efficacia,
indipendentemente dai collegamenti
che hanno.!
Analisi degli influencers!
!
•  Tecnica ispirata dall’articolo
Identification of influential spreaders in
complex networks (Kitsal et al, 2010)!
–  Il grado con cui una persona riesce a
diffondere qualcosa (anche un virus!)
non dipende tanto dal numero dei suoi
collegamenti ma da dove è posizionata
nel grafo. !
–  Se si trova al centro diffonde molto di
più di una in periferia, anche se
quest'ultima ha molti più contatti.!
–  Inoltre le persone nel centro diffondono
con la stessa efficacia,
indipendentemente dai collegamenti
che hanno.!
Analisi degli influencers!
!
•  Tecnica ispirata dall’articolo
Identification of influential spreaders in
complex networks (Kitsal et al, 2010)!
–  Il grado con cui una persona riesce a
diffondere qualcosa (anche un virus!)
non dipende tanto dal numero dei suoi
collegamenti ma da dove è posizionata
nel grafo. !
–  Se si trova al centro diffonde molto di
più di una in periferia, anche se
quest'ultima ha molti più contatti.!
–  Inoltre le persone nel centro diffondono
con la stessa efficacia,
indipendentemente dai collegamenti
che hanno.!
Analisi degli influencers!
!
Sentiment Analysis!
•  Sperimentazione fatta utilizzando
sia i risultati di SenTaClAus che
servizi commerciali!
–  Integrazione servizi AlchemyAPI!
–  Integrazione Sentistrength!
•  Risultati… luci e ombre!
–  Necessita di tanti dati: sconsigliata
per “conversazioni” con pochi post!
–  Adatta solo a contesti di
conversazione “generalistici”!
–  Necessità di configurare bene le
fonti; decidere bene come e
quando applicarla!
!
Sentiment Analysis!
•  Sperimentazione fatta utilizzando
sia i risultati di SenTaClAus che
servizi commerciali!
–  Integrazione servizi AlchemyAPI!
–  Integrazione Sentistrength!
•  Risultati… luci e ombre!
–  Necessita di tanti dati: sconsigliata
per “conversazioni” con pochi post!
–  Adatta solo a contesti di
conversazione “generalistici”!
–  Necessità di configurare bene le
fonti; decidere bene come e
quando applicarla!
!
Sentiment Analysis!
•  Sperimentazione fatta utilizzando
sia i risultati di SenTaClAus che
servizi commerciali!
–  Integrazione servizi AlchemyAPI!
–  Integrazione Sentistrength!
•  Risultati… luci e ombre!
–  Necessita di tanti dati: sconsigliata
per “conversazioni” con pochi post!
–  Adatta solo a contesti di
conversazione “generalistici”!
–  Necessità di configurare bene le
fonti; decidere bene come e
quando applicarla!
!
Sentiment Analysis!
•  Sperimentazione fatta utilizzando
sia i risultati di SenTaClAus che
servizi commerciali!
–  Integrazione servizi AlchemyAPI!
–  Integrazione Sentistrength!
•  Risultati… luci e ombre!
–  Necessita di tanti dati: sconsigliata
per “conversazioni” con pochi post!
–  Adatta solo a contesti di
conversazione “generalistici”!
–  Necessità di configurare bene le
fonti; decidere bene come e
quando applicarla!
!
Sentiment Analysis!
•  Sperimentazione fatta utilizzando
sia i risultati di SenTaClAus che
servizi commerciali!
–  Integrazione servizi AlchemyAPI!
–  Integrazione Sentistrength!
•  Risultati… luci e ombre!
–  Necessita di tanti dati: sconsigliata
per “conversazioni” con pochi post!
–  Adatta solo a contesti di
conversazione “generalistici”!
–  Necessità di configurare bene le
fonti; decidere bene come e
quando applicarla!
!
Architettura Software!
•  Architettura
Multilayer!
–  Data Layer: !
•  MariaDB!
•  Solr!
–  Presentation!
•  PHP/
Symfony!
–  Business!
•  ESB !
•  Java!
•  Enterprise
Integration
Pattern!
Logica di elaborazione “a catena di
montaggio”!
Logica di elaborazione “a catena di
montaggio”!
Logica di elaborazione “a catena di
montaggio”!
!
Validazione!
•  3 tipologie di focus group !
•  Funzionale!
–  Questionario sui servizi del sistema!
–  Target: utenti, clienti!
•  Architetturale!
–  Evoluzioni, in particolare in ottica di
elaborazione di Big Data!
–  Partner tecnici per possibili progetti!
•  Marketing!
–  Modalità di proposizione del servizio, analisi
della concorrenza!
–  Consulenti aziendali!
!
Lessons Learned!
•  Punti di forza!!
•  Posizionamento non ottimale!
–  Report finale più apprezzato di piattaforma di analisi!
•  Architettura facilmente estendibile per processare grandi quantità
di dati!
–  Da ESB ad Apache Storm!
–  Da DB relazionali a DB NOSQL!
–  Da Solr ad ElasticSearch!
•  Sentiment is… King!!
!
http://www.netseven.it!
!
http://spaziodati.eu!
!
http://www.studioflu.it/!
!
http://acube.di.unipi.it/!

Contenu connexe

En vedette

Smau Firenze 2014 - Business Intelligence, Analytics e Big Data: una guida pe...
Smau Firenze 2014 - Business Intelligence, Analytics e Big Data: una guida pe...Smau Firenze 2014 - Business Intelligence, Analytics e Big Data: una guida pe...
Smau Firenze 2014 - Business Intelligence, Analytics e Big Data: una guida pe...SMAU
 
Digital Innovation for Pharma & Healthcare - Overview and Portfolio
Digital Innovation for Pharma & Healthcare - Overview and PortfolioDigital Innovation for Pharma & Healthcare - Overview and Portfolio
Digital Innovation for Pharma & Healthcare - Overview and PortfolioVidiemme Consulting srl
 
IDC Big Data & Analytics Conference 2014
IDC Big Data & Analytics Conference 2014IDC Big Data & Analytics Conference 2014
IDC Big Data & Analytics Conference 2014IDC Italy
 
Data Mining and Big Data Analytics in Pharma
Data Mining and Big Data Analytics in Pharma Data Mining and Big Data Analytics in Pharma
Data Mining and Big Data Analytics in Pharma Ankur Khanna
 
Big Data in Pharma - Overview and Use Cases
Big Data in Pharma - Overview and Use CasesBig Data in Pharma - Overview and Use Cases
Big Data in Pharma - Overview and Use CasesJosef Scheiber
 
Assignment Advance Quantitative Methods Casolat
Assignment Advance Quantitative Methods   CasolatAssignment Advance Quantitative Methods   Casolat
Assignment Advance Quantitative Methods Casolatlanuz
 
Healthcare and disintermediation: the opportunity
Healthcare and disintermediation: the opportunityHealthcare and disintermediation: the opportunity
Healthcare and disintermediation: the opportunityMatteo Sarzana
 

En vedette (9)

Project work ipe pw c
Project work ipe   pw cProject work ipe   pw c
Project work ipe pw c
 
Smau Firenze 2014 - Business Intelligence, Analytics e Big Data: una guida pe...
Smau Firenze 2014 - Business Intelligence, Analytics e Big Data: una guida pe...Smau Firenze 2014 - Business Intelligence, Analytics e Big Data: una guida pe...
Smau Firenze 2014 - Business Intelligence, Analytics e Big Data: una guida pe...
 
Digital Innovation for Pharma & Healthcare - Overview and Portfolio
Digital Innovation for Pharma & Healthcare - Overview and PortfolioDigital Innovation for Pharma & Healthcare - Overview and Portfolio
Digital Innovation for Pharma & Healthcare - Overview and Portfolio
 
IDC Big Data & Analytics Conference 2014
IDC Big Data & Analytics Conference 2014IDC Big Data & Analytics Conference 2014
IDC Big Data & Analytics Conference 2014
 
Data Mining and Big Data Analytics in Pharma
Data Mining and Big Data Analytics in Pharma Data Mining and Big Data Analytics in Pharma
Data Mining and Big Data Analytics in Pharma
 
Big Data in Pharma - Overview and Use Cases
Big Data in Pharma - Overview and Use CasesBig Data in Pharma - Overview and Use Cases
Big Data in Pharma - Overview and Use Cases
 
Assignment Advance Quantitative Methods Casolat
Assignment Advance Quantitative Methods   CasolatAssignment Advance Quantitative Methods   Casolat
Assignment Advance Quantitative Methods Casolat
 
Healthcare and disintermediation: the opportunity
Healthcare and disintermediation: the opportunityHealthcare and disintermediation: the opportunity
Healthcare and disintermediation: the opportunity
 
Analytics in Pharmaceutical Industry
Analytics in Pharmaceutical IndustryAnalytics in Pharmaceutical Industry
Analytics in Pharmaceutical Industry
 

Similaire à Trend Analysis sui Social Network - I risultati del progetto SenTaClAus

La semantica per automatizzare una redazione web: l’esperienza di Innolabspl...
La semantica per automatizzare una redazione web: l’esperienza di Innolabspl...La semantica per automatizzare una redazione web: l’esperienza di Innolabspl...
La semantica per automatizzare una redazione web: l’esperienza di Innolabspl...Net7
 
La semantica per automatizzare una redazione web: l'esperienza di Innolabplus.eu
La semantica per automatizzare una redazione web: l'esperienza di Innolabplus.euLa semantica per automatizzare una redazione web: l'esperienza di Innolabplus.eu
La semantica per automatizzare una redazione web: l'esperienza di Innolabplus.euDrupalDay
 
Real-time discovery e sentiment analysis su Twitter: BlogmeterNow - Vittorio ...
Real-time discovery e sentiment analysis su Twitter: BlogmeterNow - Vittorio ...Real-time discovery e sentiment analysis su Twitter: BlogmeterNow - Vittorio ...
Real-time discovery e sentiment analysis su Twitter: BlogmeterNow - Vittorio ...Codemotion
 
Presentazione Cama_Primiceri_Atro
Presentazione Cama_Primiceri_AtroPresentazione Cama_Primiceri_Atro
Presentazione Cama_Primiceri_AtroBernadetteCama
 
Il web intelligente
Il web intelligenteIl web intelligente
Il web intelligenteDavide Cerbo
 
Smau Milano 2016 - Sara Borghi
Smau Milano 2016 - Sara BorghiSmau Milano 2016 - Sara Borghi
Smau Milano 2016 - Sara BorghiSMAU
 
[SMAU 2016] Screaming Frog: Come utilizzare questo strumento all'interno di u...
[SMAU 2016] Screaming Frog: Come utilizzare questo strumento all'interno di u...[SMAU 2016] Screaming Frog: Come utilizzare questo strumento all'interno di u...
[SMAU 2016] Screaming Frog: Come utilizzare questo strumento all'interno di u...Sara Borghi
 
C'è semantica in questo web
C'è semantica in questo webC'è semantica in questo web
C'è semantica in questo webNet7
 
Anahita jd10 it
Anahita jd10 itAnahita jd10 it
Anahita jd10 itbeyounic
 
Antichi Generazione Web - part 5 Tools Aggregare risorse
Antichi Generazione Web - part 5 Tools Aggregare risorseAntichi Generazione Web - part 5 Tools Aggregare risorse
Antichi Generazione Web - part 5 Tools Aggregare risorseLaura Antichi
 
Web 2.0 & Library 2.0: un'introduzione
Web 2.0 & Library 2.0: un'introduzioneWeb 2.0 & Library 2.0: un'introduzione
Web 2.0 & Library 2.0: un'introduzioneAndrea Marchitelli
 
IBM Watson Conversation: machine learning tools, artificial intelligence capa...
IBM Watson Conversation: machine learning tools, artificial intelligence capa...IBM Watson Conversation: machine learning tools, artificial intelligence capa...
IBM Watson Conversation: machine learning tools, artificial intelligence capa...Codemotion
 
Social Network: guida ad un utilizzo consapevole
Social Network: guida ad un utilizzo consapevoleSocial Network: guida ad un utilizzo consapevole
Social Network: guida ad un utilizzo consapevoleAlessandro Grechi
 
Lezione sul Web content management
Lezione sul Web content managementLezione sul Web content management
Lezione sul Web content managementGiacomo Mason
 
educare alla ricerca
educare alla ricercaeducare alla ricerca
educare alla ricercaMadiaA
 

Similaire à Trend Analysis sui Social Network - I risultati del progetto SenTaClAus (20)

La semantica per automatizzare una redazione web: l’esperienza di Innolabspl...
La semantica per automatizzare una redazione web: l’esperienza di Innolabspl...La semantica per automatizzare una redazione web: l’esperienza di Innolabspl...
La semantica per automatizzare una redazione web: l’esperienza di Innolabspl...
 
La semantica per automatizzare una redazione web: l'esperienza di Innolabplus.eu
La semantica per automatizzare una redazione web: l'esperienza di Innolabplus.euLa semantica per automatizzare una redazione web: l'esperienza di Innolabplus.eu
La semantica per automatizzare una redazione web: l'esperienza di Innolabplus.eu
 
Real-time discovery e sentiment analysis su Twitter: BlogmeterNow - Vittorio ...
Real-time discovery e sentiment analysis su Twitter: BlogmeterNow - Vittorio ...Real-time discovery e sentiment analysis su Twitter: BlogmeterNow - Vittorio ...
Real-time discovery e sentiment analysis su Twitter: BlogmeterNow - Vittorio ...
 
Semantic Search Engine
Semantic Search EngineSemantic Search Engine
Semantic Search Engine
 
Presentazione Cama_Primiceri_Atro
Presentazione Cama_Primiceri_AtroPresentazione Cama_Primiceri_Atro
Presentazione Cama_Primiceri_Atro
 
Il web intelligente
Il web intelligenteIl web intelligente
Il web intelligente
 
SEO & Editoria
SEO & EditoriaSEO & Editoria
SEO & Editoria
 
Smau Milano 2016 - Sara Borghi
Smau Milano 2016 - Sara BorghiSmau Milano 2016 - Sara Borghi
Smau Milano 2016 - Sara Borghi
 
[SMAU 2016] Screaming Frog: Come utilizzare questo strumento all'interno di u...
[SMAU 2016] Screaming Frog: Come utilizzare questo strumento all'interno di u...[SMAU 2016] Screaming Frog: Come utilizzare questo strumento all'interno di u...
[SMAU 2016] Screaming Frog: Come utilizzare questo strumento all'interno di u...
 
C'è semantica in questo web
C'è semantica in questo webC'è semantica in questo web
C'è semantica in questo web
 
Anahita jd10 it
Anahita jd10 itAnahita jd10 it
Anahita jd10 it
 
Antichi Generazione Web - part 5 Tools Aggregare risorse
Antichi Generazione Web - part 5 Tools Aggregare risorseAntichi Generazione Web - part 5 Tools Aggregare risorse
Antichi Generazione Web - part 5 Tools Aggregare risorse
 
Ascoltere la rete: la sentiment analysis
Ascoltere la rete: la sentiment analysisAscoltere la rete: la sentiment analysis
Ascoltere la rete: la sentiment analysis
 
Web 2.0 & Library 2.0: un'introduzione
Web 2.0 & Library 2.0: un'introduzioneWeb 2.0 & Library 2.0: un'introduzione
Web 2.0 & Library 2.0: un'introduzione
 
IBM Watson Conversation: machine learning tools, artificial intelligence capa...
IBM Watson Conversation: machine learning tools, artificial intelligence capa...IBM Watson Conversation: machine learning tools, artificial intelligence capa...
IBM Watson Conversation: machine learning tools, artificial intelligence capa...
 
LinkedIn per giornalisti
LinkedIn per giornalistiLinkedIn per giornalisti
LinkedIn per giornalisti
 
Social Network: guida ad un utilizzo consapevole
Social Network: guida ad un utilizzo consapevoleSocial Network: guida ad un utilizzo consapevole
Social Network: guida ad un utilizzo consapevole
 
Lezione sul Web content management
Lezione sul Web content managementLezione sul Web content management
Lezione sul Web content management
 
BibliotecaAccessibile
BibliotecaAccessibileBibliotecaAccessibile
BibliotecaAccessibile
 
educare alla ricerca
educare alla ricercaeducare alla ricerca
educare alla ricerca
 

Plus de Net7

E-RIHS Heritage Hub
E-RIHS Heritage HubE-RIHS Heritage Hub
E-RIHS Heritage HubNet7
 
Net7 @ Master Big Data 2017
Net7 @ Master Big Data 2017Net7 @ Master Big Data 2017
Net7 @ Master Big Data 2017Net7
 
Presentation of context: Web Annotations (& Pundit) during the StoM Project (...
Presentation of context: Web Annotations (& Pundit) during the StoM Project (...Presentation of context: Web Annotations (& Pundit) during the StoM Project (...
Presentation of context: Web Annotations (& Pundit) during the StoM Project (...Net7
 
iAnnotate 2016 - Demo Pundit web annotator
iAnnotate 2016 - Demo Pundit web annotatoriAnnotate 2016 - Demo Pundit web annotator
iAnnotate 2016 - Demo Pundit web annotatorNet7
 
Pundit at Digital Humanities Austria 2015
Pundit at Digital Humanities Austria 2015Pundit at Digital Humanities Austria 2015
Pundit at Digital Humanities Austria 2015Net7
 
Pundit at DINI Jahrestagungen, 2015 "Linked Data – Vision und Wirklichkeit"
Pundit at DINI Jahrestagungen, 2015 "Linked Data – Vision und Wirklichkeit"Pundit at DINI Jahrestagungen, 2015 "Linked Data – Vision und Wirklichkeit"
Pundit at DINI Jahrestagungen, 2015 "Linked Data – Vision und Wirklichkeit"Net7
 
Muruca at DiXiT Convention 1: Technology, Software, Standards
Muruca at DiXiT Convention 1: Technology, Software, StandardsMuruca at DiXiT Convention 1: Technology, Software, Standards
Muruca at DiXiT Convention 1: Technology, Software, StandardsNet7
 
Pundit workshop tutorial at DiXiT Convention 1: Technology, Software, Standards
Pundit workshop tutorial at DiXiT Convention 1: Technology, Software, StandardsPundit workshop tutorial at DiXiT Convention 1: Technology, Software, Standards
Pundit workshop tutorial at DiXiT Convention 1: Technology, Software, StandardsNet7
 
Pundit at DiXiT Convention 1: Technology, Software, Standards
Pundit at DiXiT Convention 1: Technology, Software, StandardsPundit at DiXiT Convention 1: Technology, Software, Standards
Pundit at DiXiT Convention 1: Technology, Software, StandardsNet7
 
Word Embedding e word2vec: Introduzione ed Esperimenti Preliminari
Word Embedding e word2vec: Introduzione ed Esperimenti PreliminariWord Embedding e word2vec: Introduzione ed Esperimenti Preliminari
Word Embedding e word2vec: Introduzione ed Esperimenti PreliminariNet7
 
Io sono qui per voi - Giulio Andreini
Io sono qui per voi - Giulio AndreiniIo sono qui per voi - Giulio Andreini
Io sono qui per voi - Giulio AndreiniNet7
 
Rethinking the Role of SSH - Culture and Creativity
Rethinking the Role of SSH - Culture and CreativityRethinking the Role of SSH - Culture and Creativity
Rethinking the Role of SSH - Culture and CreativityNet7
 
Pundit at 3rd DBpedia Community Meeting 2015
Pundit at 3rd DBpedia Community Meeting 2015Pundit at 3rd DBpedia Community Meeting 2015
Pundit at 3rd DBpedia Community Meeting 2015Net7
 
Lod portal and pundit @ Humanities Hack london2014
Lod portal and pundit @ Humanities Hack london2014Lod portal and pundit @ Humanities Hack london2014
Lod portal and pundit @ Humanities Hack london2014Net7
 
Looking at Words through Images - Presentation at CASVA, National Gallery of ...
Looking at Words through Images - Presentation at CASVA, National Gallery of ...Looking at Words through Images - Presentation at CASVA, National Gallery of ...
Looking at Words through Images - Presentation at CASVA, National Gallery of ...Net7
 
Looking at Words through Images - Presentation at CASVA, National Gallery of ...
Looking at Words through Images - Presentation at CASVA, National Gallery of ...Looking at Words through Images - Presentation at CASVA, National Gallery of ...
Looking at Words through Images - Presentation at CASVA, National Gallery of ...Net7
 
Pundit @ Vienna 2014
Pundit @ Vienna 2014Pundit @ Vienna 2014
Pundit @ Vienna 2014Net7
 
Apache Solr + ajax solr
Apache Solr + ajax solrApache Solr + ajax solr
Apache Solr + ajax solrNet7
 
2014 09-18 pundit@dariah2014
2014 09-18 pundit@dariah20142014 09-18 pundit@dariah2014
2014 09-18 pundit@dariah2014Net7
 
DM2E project - All WP Meeting 5, Bergen - WP3
DM2E project - All WP Meeting 5, Bergen - WP3DM2E project - All WP Meeting 5, Bergen - WP3
DM2E project - All WP Meeting 5, Bergen - WP3Net7
 

Plus de Net7 (20)

E-RIHS Heritage Hub
E-RIHS Heritage HubE-RIHS Heritage Hub
E-RIHS Heritage Hub
 
Net7 @ Master Big Data 2017
Net7 @ Master Big Data 2017Net7 @ Master Big Data 2017
Net7 @ Master Big Data 2017
 
Presentation of context: Web Annotations (& Pundit) during the StoM Project (...
Presentation of context: Web Annotations (& Pundit) during the StoM Project (...Presentation of context: Web Annotations (& Pundit) during the StoM Project (...
Presentation of context: Web Annotations (& Pundit) during the StoM Project (...
 
iAnnotate 2016 - Demo Pundit web annotator
iAnnotate 2016 - Demo Pundit web annotatoriAnnotate 2016 - Demo Pundit web annotator
iAnnotate 2016 - Demo Pundit web annotator
 
Pundit at Digital Humanities Austria 2015
Pundit at Digital Humanities Austria 2015Pundit at Digital Humanities Austria 2015
Pundit at Digital Humanities Austria 2015
 
Pundit at DINI Jahrestagungen, 2015 "Linked Data – Vision und Wirklichkeit"
Pundit at DINI Jahrestagungen, 2015 "Linked Data – Vision und Wirklichkeit"Pundit at DINI Jahrestagungen, 2015 "Linked Data – Vision und Wirklichkeit"
Pundit at DINI Jahrestagungen, 2015 "Linked Data – Vision und Wirklichkeit"
 
Muruca at DiXiT Convention 1: Technology, Software, Standards
Muruca at DiXiT Convention 1: Technology, Software, StandardsMuruca at DiXiT Convention 1: Technology, Software, Standards
Muruca at DiXiT Convention 1: Technology, Software, Standards
 
Pundit workshop tutorial at DiXiT Convention 1: Technology, Software, Standards
Pundit workshop tutorial at DiXiT Convention 1: Technology, Software, StandardsPundit workshop tutorial at DiXiT Convention 1: Technology, Software, Standards
Pundit workshop tutorial at DiXiT Convention 1: Technology, Software, Standards
 
Pundit at DiXiT Convention 1: Technology, Software, Standards
Pundit at DiXiT Convention 1: Technology, Software, StandardsPundit at DiXiT Convention 1: Technology, Software, Standards
Pundit at DiXiT Convention 1: Technology, Software, Standards
 
Word Embedding e word2vec: Introduzione ed Esperimenti Preliminari
Word Embedding e word2vec: Introduzione ed Esperimenti PreliminariWord Embedding e word2vec: Introduzione ed Esperimenti Preliminari
Word Embedding e word2vec: Introduzione ed Esperimenti Preliminari
 
Io sono qui per voi - Giulio Andreini
Io sono qui per voi - Giulio AndreiniIo sono qui per voi - Giulio Andreini
Io sono qui per voi - Giulio Andreini
 
Rethinking the Role of SSH - Culture and Creativity
Rethinking the Role of SSH - Culture and CreativityRethinking the Role of SSH - Culture and Creativity
Rethinking the Role of SSH - Culture and Creativity
 
Pundit at 3rd DBpedia Community Meeting 2015
Pundit at 3rd DBpedia Community Meeting 2015Pundit at 3rd DBpedia Community Meeting 2015
Pundit at 3rd DBpedia Community Meeting 2015
 
Lod portal and pundit @ Humanities Hack london2014
Lod portal and pundit @ Humanities Hack london2014Lod portal and pundit @ Humanities Hack london2014
Lod portal and pundit @ Humanities Hack london2014
 
Looking at Words through Images - Presentation at CASVA, National Gallery of ...
Looking at Words through Images - Presentation at CASVA, National Gallery of ...Looking at Words through Images - Presentation at CASVA, National Gallery of ...
Looking at Words through Images - Presentation at CASVA, National Gallery of ...
 
Looking at Words through Images - Presentation at CASVA, National Gallery of ...
Looking at Words through Images - Presentation at CASVA, National Gallery of ...Looking at Words through Images - Presentation at CASVA, National Gallery of ...
Looking at Words through Images - Presentation at CASVA, National Gallery of ...
 
Pundit @ Vienna 2014
Pundit @ Vienna 2014Pundit @ Vienna 2014
Pundit @ Vienna 2014
 
Apache Solr + ajax solr
Apache Solr + ajax solrApache Solr + ajax solr
Apache Solr + ajax solr
 
2014 09-18 pundit@dariah2014
2014 09-18 pundit@dariah20142014 09-18 pundit@dariah2014
2014 09-18 pundit@dariah2014
 
DM2E project - All WP Meeting 5, Bergen - WP3
DM2E project - All WP Meeting 5, Bergen - WP3DM2E project - All WP Meeting 5, Bergen - WP3
DM2E project - All WP Meeting 5, Bergen - WP3
 

Trend Analysis sui Social Network - I risultati del progetto SenTaClAus

  • 1. ! Trend Analysis @ SenTaClAus! Pisa – Dipartimento di Informatica! 23/03/2015! ! Luca De Santis – desantis@netseven.it - @lucadex!
  • 2. ! In principio… era il Social Proxy!! •  Nasce da l’esigenza di COOP Italia di integrare i propri sistemi con i Social Network! –  Non a caso proxy…! –  2010 inizio progettazione! –  2011 primo rilascio! •  Enfasi su funzionalità “editoriali”! •  Business Logic implementata via ESB!
  • 3. ! In principio… era il Social Proxy!! •  Nasce da l’esigenza di COOP Italia di integrare i propri sistemi con i Social Network! –  Non a caso proxy…! –  2010 inizio progettazione! –  2011 primo rilascio! •  Enfasi su funzionalità “editoriali”! •  Business Logic implementata via ESB!
  • 4. ! In principio… era il Social Proxy!! •  Nasce da l’esigenza di COOP Italia di integrare i propri sistemi con i Social Network! –  Non a caso proxy…! –  2010 inizio progettazione! –  2011 primo rilascio! •  Enfasi su funzionalità “editoriali”! •  Business Logic implementata via ESB!
  • 5. ! In principio… era il Social Proxy!! •  Nasce da l’esigenza di COOP Italia di integrare i propri sistemi con i Social Network! –  Non a caso proxy…! –  2010 inizio progettazione! –  2011 primo rilascio! •  Enfasi su funzionalità “editoriali”! •  Business Logic implementata via ESB!
  • 6. ! •  Regole parametriche per recuperare contenuti da molteplici fonti! –  Facebook (pagine, accounts, gruppi, ricerca, timeline dell’utente)! –  Twitter (ricerca, ricerca geografica, accounts, timeline dell’utente)! –  Instagram (ricerca, ricerca geografica, accounts, timeline dell’utente)! –  LinkedIn (gruppi, companies, persone, aggiornamenti del network)! –  YouTube (ricerche, canali) ! –  Foursquare (tips delle venues)! –  Pinterest (utenti, boards)! –  Feed RSS/Atom (siti web, blog)! •  I contenuti recuperati possono essere indicizzati su un motore di ricerca locale (Apache Solr) per ulteriori filtraggi.! Versione 2.0 – Funzionalità di ascolto!
  • 7. ! •  Regole parametriche per recuperare contenuti da molteplici fonti! –  Facebook (pagine, accounts, gruppi, ricerca, timeline dell’utente)! –  Twitter (ricerca, ricerca geografica, accounts, timeline dell’utente)! –  Instagram (ricerca, ricerca geografica, accounts, timeline dell’utente)! –  LinkedIn (gruppi, companies, persone, aggiornamenti del network)! –  YouTube (ricerche, canali) ! –  Foursquare (tips delle venues)! –  Pinterest (utenti, boards)! –  Feed RSS/Atom (siti web, blog)! •  I contenuti recuperati possono essere indicizzati su un motore di ricerca locale (Apache Solr) per ulteriori filtraggi.! Versione 2.0 – Funzionalità di ascolto!
  • 8. ! •  Regole parametriche per recuperare contenuti da molteplici fonti! –  Facebook (pagine, accounts, gruppi, ricerca, timeline dell’utente)! –  Twitter (ricerca, ricerca geografica, accounts, timeline dell’utente)! –  Instagram (ricerca, ricerca geografica, accounts, timeline dell’utente)! –  LinkedIn (gruppi, companies, persone, aggiornamenti del network)! –  YouTube (ricerche, canali) ! –  Foursquare (tips delle venues)! –  Pinterest (utenti, boards)! –  Feed RSS/Atom (siti web, blog)! •  I contenuti recuperati possono essere indicizzati su un motore di ricerca locale (Apache Solr) per ulteriori filtraggi.! Versione 2.0 – Funzionalità di ascolto!
  • 9. ! •  Regole parametriche per recuperare contenuti da molteplici fonti! –  Facebook (pagine, accounts, gruppi, ricerca, timeline dell’utente)! –  Twitter (ricerca, ricerca geografica, accounts, timeline dell’utente)! –  Instagram (ricerca, ricerca geografica, accounts, timeline dell’utente)! –  LinkedIn (gruppi, companies, persone, aggiornamenti del network)! –  YouTube (ricerche, canali) ! –  Foursquare (tips delle venues)! –  Pinterest (utenti, boards)! –  Feed RSS/Atom (siti web, blog)! •  I contenuti recuperati possono essere indicizzati su un motore di ricerca locale (Apache Solr) per ulteriori filtraggi.! Versione 2.0 – Funzionalità di ascolto!
  • 10. ! •  Regole parametriche per recuperare contenuti da molteplici fonti! –  Facebook (pagine, accounts, gruppi, ricerca, timeline dell’utente)! –  Twitter (ricerca, ricerca geografica, accounts, timeline dell’utente)! –  Instagram (ricerca, ricerca geografica, accounts, timeline dell’utente)! –  LinkedIn (gruppi, companies, persone, aggiornamenti del network)! –  YouTube (ricerche, canali) ! –  Foursquare (tips delle venues)! –  Pinterest (utenti, boards)! –  Feed RSS/Atom (siti web, blog)! •  I contenuti recuperati possono essere indicizzati su un motore di ricerca locale (Apache Solr) per ulteriori filtraggi.! Versione 2.0 – Funzionalità di ascolto!
  • 11. ! •  Usare strumenti di Named Entity Extraction per identificare i concetti nel testo! –  Uso di TagMe!! •  Nasce il servizio di Trend Analysis! •  Analisi in tempo pressoché reale: identifico i concetti man mano che recupero i post! Come fare una sintesi di tutto ciò?!
  • 12. ! •  Usare strumenti di Named Entity Extraction per identificare i concetti nel testo! –  Uso di TagMe!! •  Nasce il servizio di Trend Analysis! •  Analisi in tempo pressoché reale: identifico i concetti man mano che recupero i post! Come fare una sintesi di tutto ciò?!
  • 13. ! •  Usare strumenti di Named Entity Extraction per identificare i concetti nel testo! –  Uso di TagMe!! •  Nasce il servizio di Trend Analysis! •  Analisi in tempo pressoché reale: identifico i concetti man mano che recupero i post! Come fare una sintesi di tutto ciò?!
  • 14. ! •  Usare strumenti di Named Entity Extraction per identificare i concetti nel testo! –  Uso di TagMe!! •  Nasce il servizio di Trend Analysis! •  Analisi in tempo pressoché reale: identifico i concetti man mano che recupero i post! Come fare una sintesi di tutto ciò?! Conce&o  X   Conce&o  Z  
  • 15. ! Il lavoro in SenTaClAus! •  Estensioni della Trend Analysis! –  Miglioramenti nell’efficacia, grazie alle corrispondenti evoluzioni nella Text Analysis! –  Nuove analisi (e corrispondenti interfacce grafiche)! •  Link Analysis! •  Analisi geografiche! •  Analisi degli Influencers! •  Sperimentazioni sulla Sentiment Analysis! –  Si sfrutta la logica di elaborazione “a catena di montaggio” dell’ESB! ! Enterprise  Service  Bus   Immagini © http://ecquire.com/blog/social-media-sales-funnel/ - http://rvtechsolutions.com/socialmediabreakfast/willmar-lakes-area/
  • 16. Esempi di Trend Analysis: menzioni @Unipisa!
  • 17. Esempi di Trend Analysis: menzioni @Unipisa!
  • 18. Esempi di Trend Analysis: menzioni @Unipisa!
  • 19. Esempi di Trend Analysis: menzioni @Unipisa!
  • 28. ! •  Tecnica ispirata dall’articolo Identification of influential spreaders in complex networks (Kitsal et al, 2010)! –  Il grado con cui una persona riesce a diffondere qualcosa (anche un virus!) non dipende tanto dal numero dei suoi collegamenti ma da dove è posizionata nel grafo. ! –  Se si trova al centro diffonde molto di più di una in periferia, anche se quest'ultima ha molti più contatti.! –  Inoltre le persone nel centro diffondono con la stessa efficacia, indipendentemente dai collegamenti che hanno.! Analisi degli influencers!
  • 29. ! •  Tecnica ispirata dall’articolo Identification of influential spreaders in complex networks (Kitsal et al, 2010)! –  Il grado con cui una persona riesce a diffondere qualcosa (anche un virus!) non dipende tanto dal numero dei suoi collegamenti ma da dove è posizionata nel grafo. ! –  Se si trova al centro diffonde molto di più di una in periferia, anche se quest'ultima ha molti più contatti.! –  Inoltre le persone nel centro diffondono con la stessa efficacia, indipendentemente dai collegamenti che hanno.! Analisi degli influencers!
  • 30. ! •  Tecnica ispirata dall’articolo Identification of influential spreaders in complex networks (Kitsal et al, 2010)! –  Il grado con cui una persona riesce a diffondere qualcosa (anche un virus!) non dipende tanto dal numero dei suoi collegamenti ma da dove è posizionata nel grafo. ! –  Se si trova al centro diffonde molto di più di una in periferia, anche se quest'ultima ha molti più contatti.! –  Inoltre le persone nel centro diffondono con la stessa efficacia, indipendentemente dai collegamenti che hanno.! Analisi degli influencers!
  • 31. ! Sentiment Analysis! •  Sperimentazione fatta utilizzando sia i risultati di SenTaClAus che servizi commerciali! –  Integrazione servizi AlchemyAPI! –  Integrazione Sentistrength! •  Risultati… luci e ombre! –  Necessita di tanti dati: sconsigliata per “conversazioni” con pochi post! –  Adatta solo a contesti di conversazione “generalistici”! –  Necessità di configurare bene le fonti; decidere bene come e quando applicarla!
  • 32. ! Sentiment Analysis! •  Sperimentazione fatta utilizzando sia i risultati di SenTaClAus che servizi commerciali! –  Integrazione servizi AlchemyAPI! –  Integrazione Sentistrength! •  Risultati… luci e ombre! –  Necessita di tanti dati: sconsigliata per “conversazioni” con pochi post! –  Adatta solo a contesti di conversazione “generalistici”! –  Necessità di configurare bene le fonti; decidere bene come e quando applicarla!
  • 33. ! Sentiment Analysis! •  Sperimentazione fatta utilizzando sia i risultati di SenTaClAus che servizi commerciali! –  Integrazione servizi AlchemyAPI! –  Integrazione Sentistrength! •  Risultati… luci e ombre! –  Necessita di tanti dati: sconsigliata per “conversazioni” con pochi post! –  Adatta solo a contesti di conversazione “generalistici”! –  Necessità di configurare bene le fonti; decidere bene come e quando applicarla!
  • 34. ! Sentiment Analysis! •  Sperimentazione fatta utilizzando sia i risultati di SenTaClAus che servizi commerciali! –  Integrazione servizi AlchemyAPI! –  Integrazione Sentistrength! •  Risultati… luci e ombre! –  Necessita di tanti dati: sconsigliata per “conversazioni” con pochi post! –  Adatta solo a contesti di conversazione “generalistici”! –  Necessità di configurare bene le fonti; decidere bene come e quando applicarla!
  • 35. ! Sentiment Analysis! •  Sperimentazione fatta utilizzando sia i risultati di SenTaClAus che servizi commerciali! –  Integrazione servizi AlchemyAPI! –  Integrazione Sentistrength! •  Risultati… luci e ombre! –  Necessita di tanti dati: sconsigliata per “conversazioni” con pochi post! –  Adatta solo a contesti di conversazione “generalistici”! –  Necessità di configurare bene le fonti; decidere bene come e quando applicarla!
  • 36. ! Architettura Software! •  Architettura Multilayer! –  Data Layer: ! •  MariaDB! •  Solr! –  Presentation! •  PHP/ Symfony! –  Business! •  ESB ! •  Java! •  Enterprise Integration Pattern!
  • 37. Logica di elaborazione “a catena di montaggio”!
  • 38. Logica di elaborazione “a catena di montaggio”!
  • 39. Logica di elaborazione “a catena di montaggio”!
  • 40. ! Validazione! •  3 tipologie di focus group ! •  Funzionale! –  Questionario sui servizi del sistema! –  Target: utenti, clienti! •  Architetturale! –  Evoluzioni, in particolare in ottica di elaborazione di Big Data! –  Partner tecnici per possibili progetti! •  Marketing! –  Modalità di proposizione del servizio, analisi della concorrenza! –  Consulenti aziendali!
  • 41. ! Lessons Learned! •  Punti di forza!! •  Posizionamento non ottimale! –  Report finale più apprezzato di piattaforma di analisi! •  Architettura facilmente estendibile per processare grandi quantità di dati! –  Da ESB ad Apache Storm! –  Da DB relazionali a DB NOSQL! –  Da Solr ad ElasticSearch! •  Sentiment is… King!!