Social network metrics and trust based recommendation
1. Science des réseaux
« Analytique des réseaux sociaux »
Jimmy Siméon,
Presentation based on :
• Coursera course Pr Lada Adamic from Michigan university – 2014
• Computer research with Pr Didier Puzenat from W.I. University - 2016
p(k) = Ck-a
Données des réseaux sociaux
Simulateurs et visualisation
Modèles mathématiques
NetLogo
n(n-1)/2
Données: LinkedIn / FaceBook
a
b
c
0.41
0.36
0.23
0.41
0.23
0.23
0.36
0.41
0.36
Graphe métier B2C de confiance
2. Agenda
• Théorie des réseaux sociaux
Définition, les besoins, mesures, modélisations et classifications,
Génération et simulation de réseaux sociaux,
Techniques d’attaques dans un réseau social.
• Mise en application des réseaux sociaux
Analytique visuelle des métriques locales/globales d’un réseau social,
Réseau d’amis « FaceBook » et professionnel « LinkedIn »,
Graphe de recommandation basé sur la confiance.
4. Fouille des réseaux sociaux (Social Network Mining)
Ensemble des techniques de ‘data mining’ qui considèrent explicitement
les liens lors de la construction de modèles descriptifs ou prédictifs
à partir de données relationnelles.
[Geroor 2005].
L’état de l’art de la recherche sur les réseaux sociaux:
• Prédiction de liens (ex.: pour améliorer le marketing viral),
• Identifier les acteurs importants/experts,
• Détection de communautés,
• Identifications des rôles joués par les individus en fonction de leurs liens,
• Diffusion de l’information au sein d’un réseau social,
• Recommandation basée sur le confiance et la réputation,
• Anonymisation et vie privée.
5. Qu’est-ce qu’un réseau social pour la théorie des graphes ?
• Un réseau est un ensemble de noeuds connectés par des liens.“Réseau” ≡ “Graphe”
points lignes
vertices edges, arcs math
nodes links computer science
sites bonds physics
actors ties, relations sociology
Noeud (node)
Lien (edge)
• Graphe complet,
• Graphe orienté/dirigé (digraph),
• Graphe non orienté,
• Multi-graphe, Speudographe (self loop),
• Graphe biparti complet.Utilisateur
Relation
Réseau Social
• Pondéré
• Orienté
• Identité
Chemin (path)
6. Métriques locales et globales des réseaux sociaux
Centralité utilisateurs, caractéristique du réseau social
Les nœuds d’un réseau social n’ont pas tous la même importance.
Métriques locales de centralité d’un utilisateur ou d’un groupe d’utilsateurs:
1. Popularité d’un utilisateur (Degree Centrality = connectivity level),
2. Proximité avec les autres utilisateurs (Closeness Centrality = geographic ),
3. Médiateur avec beaucoup d’utilisateurs (Betweenness Centrality),
4. Popularité liée à la popularité de ses amis (Eigenvector Centrality = connected with central
nodes).
Analyser la force et la faiblesse des liens entre utilisateurs:
1. Analyser la typologie du réseau, motifs de connections,
2. Apprendre du profil utilisateur et de ses attributs,
3. Apprendre de l’activité de l’utilisateur.
[Lei Tang, Yahoo! Labs et Huan Liu, Community detection and Mining in Social Media]
Métriques globales qui caractérise le réseau:
1. Composantes connexes,
2. Distance moyenne,
3. Diamètre (plus grand chemin des plus
courts chemin d’un graphe),
4. Densité (=1 si le graphe est complet),
5. Coefficient de clustering moyen.
7. Typologies et identitées des modèles de réseaux
Distribution des liens dans un réseau social: scale-free, small-worlds, random
Binomial, poisson, normale
limit p small
limit large n
Fig. probabilité de distribution des liens sociaux.
Un réseau social se caractérise par la signature
de la distribution des liens entre les utilisateurs.
Modèle Barabasi-Albert [Barabasi 1999]p(k)
k
Réseau aléatoire (random)
Modèle Erdos-Renyi
Réseau « invariant » (scale-free)
(Attachement préférentiel, loi de puissance)
Nombre
de liens
entre
utilisateurs
Nombre
d’utilisateurs
Réseau « petit monde » (small-worlds)
Modèle Watts and Strogatz [Milgram 1967]
Approximations des réseaux aléatoires (lois de probabilités).
8. Simulateur du réseau « petit monde »
A terme les utilisateurs formeront une communauté dense.
Modèle des six degrés de séparation.
Logiciel NetLogo
https://en.wikipedia.org/
Watts & Strogatz
10. Simulateur d’un réseau « social sur Internet »
Les nouveaux utilisateurs ont tendance à se connectent aux utilisateurs centraux
Modèle de réseaux « scale-free », attachement préférentiel
https://en.wikipedia.org/wiki/Albert-
L%C3%A1szl%C3%B3_Barab%C3%A1si
Logiciel NetLogo
Barabási
11. Modèles des réseaux sociaux sur InterNet
Graph model - Barabasi-Albert model, preferential attachment (loi de puissance)
La distribution des liens entre utilisateurs sur InterNet suit
la loi de puissance:
les utilisateurs se connectent entre eux avec une
probabilité proportionnelle à leurs poplarités (degrés).
http://www.northeastern.edu/tomorrow/curing-
disease/albert-laszlo-barabasi-maps-the-disease-network
La probabilité d’observer un noeud de degré k
est calculé par :
Ckkp )(
Constante de normalisation
power law
exponent
La probabilité qu’un nouveau noeud
soit connecté au noeud est :
[Lada ADAMIC, Coursera SNA course 2014]
puissance
(in/out degree)
film actors 2.3
telephone call graph 2.1
email networks 1.5/2.0
sexual contacts 3.2
WWW and Social Networks 2.3/2.7
internet 2.5
peer-to-peer 2.1
metabolic network 2.2
protein interactions 2.4 nodes ordered in descending
degree
degree
short
head
long
tail
Example de réseau de type
“attachement préférentiel”.
Type de réseau
12. Caractéristiques des réseaux sociaux en ligne (InterNet)
Un réseau social se caractérise par:
1. un taux élevé de clustering (mes amis sont amis entre eux),
2. une densité faible du graphe O(log Nombre_noeuds),
3. une distribution des liens de degrés entre utilisateurs qui suit la « loi de puissance ».,
4. un graphe de plus en plus en plus dense, le diamètre diminuant avec le temps.
13. Techniques d’attaques dans les réseaux sociaux
Menaces et falsification de la réputation et de la confiance (1/2)
Local attack
-
-
-
-
-
--
-
-
-
-
+
+
+
+
-
individual
individualindividual
individual
individual
individual
Individual malicious
Threat model A
Diffamation
Local and system attack
-
+
- -
+
-
-
-
-
+
+
+
+
+
+
+
boost
collective
attack
individual
Partially malicious collectives
Threat model B’
Association de malfaiteurs
-
-
- -
-
-
-
-
-
+
+
+
+
collective
Collective
individual
Malicious collectives
Threat model B
Association de malfaiteurs
[Gomez, 2009]
14. Techniques d’attaques dans les réseaux sociaux
Menaces et falsification de la réputation et de la confiance (2/2)
%(+/-)
+
+
++
%(+/-) %(+/-)
%(+/-)
%(+/-)
%(+/-)
%(+/-)
%(+/-)
%(+/-)
collective
collective
individual
Malicious collectives with camouflage
Threat model C
Association de malfaiteurs
+
+
+
+
+
-
-
-
-
-
-
Malicious spies
boost
individual
spie
spie
Threat model D
Association de malfaiteurs et d’espions
Sybil attack
1
2 3
4
5
6
Threat model E
Identité multiple,
usurpation d’identité
Local and system attack Local and system attack Local and system attack
[Gomez, 2009]
16. Architecture globale des graphes applicatifs
exemple théorique :Allociné et FaceBook
0 1 … 0
1 0 … 1
1 1 … 0
0 0 … 1
0 0 … 0
(NetLogo)
Extraction des données
FaceBook (GraphML)
Analyse
et visualisation
Modélisation
(Matrix and Algorithm)
import igraph
g = Graph(1)
g.add_edges([(0,1), (1,2)])
layout = g.layout("rt", 2)
plot(g, layout)
Site Web de Commerce Scocial
Simulateurs
(Python)
Traitement des graphes
Gephi
Base de données
Graph Querry Language
Analytique et visualisation (science de la donnée, fouille de graphes)
NetworkX
XML
17. Graphe LinkedIn – données d’un réseau social
Extraction et visualisation de mes relations professionnelles sur LinkedIn
http://socilab.com/
Extracteur au format des données
Au format « .net »
http://gephi.github.io/
LinkedIn network
Fichier au format NET
• Algo Hub : diamètre
(colorisation)
Nœuds fortement
connecté
Algo Détection
de communautés
Visualisation et analyseApplication web d’extraction des données Stockage des données au format .net/csv
Social Network AnalysisLinkedIn Graph
Algorithm
1. Atlas 2 (data viz)
2. Community of users
3. Degree (connectivity)
18. Graphe FaceBook – données d’un réseau social
Extraction et visualisation de mes relations d’amitiés
NetGet is a modified (reduced functionality) version of the
Netvizz app by (Bernhard Rieder, who was kind to share the
source code for the purpose of having students in Coursera's
SNA course examine their social networks. It allows you to create
GML format files of the friendship relations within either your
personal network or the groups you are a member of. These files
can then be analyzed and visualized using graph visualization
software such as Gephi, NetworkX and iGraph. Big networks may
take some time to process. Be patient!
http://snacourse.com/getnet
Bernhard Rieder
University of Amsterdam
Mediastudies Department, Associate Professor
http://gephi.github.io/
Visualisation
des relations (DataViz)
GML format (Graph Markup Language)
Data extractor Tableur de données (DataSet)
FaceBook Network (web site) FaceBook Network (Graph)
Community detection Male, female and association
Social Network Analysis
Algorithm
1. Atlas 2 (data viz)
2. Community of users
3. Degree (connectivity)
Fichier au format GML
19. Graphe FaceBook – Visualisation de mon réseau d’amis
Logiciel GEPHI d’analyse visuelle des métriques d’un réseau social : communautés et popularité de mes amis
Comment trouver
le chemin le plus court
entre deux nœuds ?
• Mon réseau social a une signature de relations qui respecte
la « loi de puissance » (attachement préférentiel).
http://gephi.github.io/
« Détection de communautés »
« Détection des amis les plus populaires »
20. Graphe FaceBook – Visualisation avec l’outil Gephi
Localisations, genres et communautés dans mon réseau social
21. Graphe FaceBook – métrique « Betweenness »
Médiateur avec beaucoup d’utilisateurs (Betweenness Centrality)
fabian
22. Graphe FaceBook – métrique « Closeness »
Proximité avec les autres utilisateurs (Closeness Centrality = geographic )
Laurent
23. Site de covoiturage – graphe de confiance
moteur de recommandation basé sur la confiance
(users-to-users Trust-based Recommendation)
Rating Rating
Payment fuel
Travel path
a
b
c
0.41
0.36
0.23
0.41
0.23
0.23
0.36
0.41
0.36
Graphe d’historique des avis
utilisateurs
(multi-graph feedback rating)
Graphe de réputation globale
des utilisateurs
(0.8,0.8,0.2)
a b
c
(0.7,0.9,1.0)
(0.9)
Graphe de confiance
(global trust)
Graphe d’opinions
des utilisateurs (graphe signé)
a
b
c
0.41
0.41
0.41