SlideShare une entreprise Scribd logo
1  sur  23
Science des réseaux
« Analytique des réseaux sociaux »
Jimmy Siméon,
Presentation based on :
• Coursera course Pr Lada Adamic from Michigan university – 2014
• Computer research with Pr Didier Puzenat from W.I. University - 2016
p(k) = Ck-a
Données des réseaux sociaux
Simulateurs et visualisation
Modèles mathématiques
NetLogo
n(n-1)/2
Données: LinkedIn / FaceBook
a
b
c
0.41
0.36
0.23
0.41
0.23
0.23
0.36
0.41
0.36
Graphe métier B2C de confiance
Agenda
• Théorie des réseaux sociaux
Définition, les besoins, mesures, modélisations et classifications,
Génération et simulation de réseaux sociaux,
Techniques d’attaques dans un réseau social.
• Mise en application des réseaux sociaux
Analytique visuelle des métriques locales/globales d’un réseau social,
Réseau d’amis « FaceBook » et professionnel « LinkedIn »,
Graphe de recommandation basé sur la confiance.
Théorie des graphes
Fouille des réseaux sociaux (Social Network Mining)
Ensemble des techniques de ‘data mining’ qui considèrent explicitement
les liens lors de la construction de modèles descriptifs ou prédictifs
à partir de données relationnelles.
[Geroor 2005].
L’état de l’art de la recherche sur les réseaux sociaux:
• Prédiction de liens (ex.: pour améliorer le marketing viral),
• Identifier les acteurs importants/experts,
• Détection de communautés,
• Identifications des rôles joués par les individus en fonction de leurs liens,
• Diffusion de l’information au sein d’un réseau social,
• Recommandation basée sur le confiance et la réputation,
• Anonymisation et vie privée.
Qu’est-ce qu’un réseau social pour la théorie des graphes ?
• Un réseau est un ensemble de noeuds connectés par des liens.“Réseau” ≡ “Graphe”
points lignes
vertices edges, arcs math
nodes links computer science
sites bonds physics
actors ties, relations sociology
Noeud (node)
Lien (edge)
• Graphe complet,
• Graphe orienté/dirigé (digraph),
• Graphe non orienté,
• Multi-graphe, Speudographe (self loop),
• Graphe biparti complet.Utilisateur
Relation
Réseau Social
• Pondéré
• Orienté
• Identité
Chemin (path)
Métriques locales et globales des réseaux sociaux
Centralité utilisateurs, caractéristique du réseau social
Les nœuds d’un réseau social n’ont pas tous la même importance.
Métriques locales de centralité d’un utilisateur ou d’un groupe d’utilsateurs:
1. Popularité d’un utilisateur (Degree Centrality = connectivity level),
2. Proximité avec les autres utilisateurs (Closeness Centrality = geographic ),
3. Médiateur avec beaucoup d’utilisateurs (Betweenness Centrality),
4. Popularité liée à la popularité de ses amis (Eigenvector Centrality = connected with central
nodes).
Analyser la force et la faiblesse des liens entre utilisateurs:
1. Analyser la typologie du réseau, motifs de connections,
2. Apprendre du profil utilisateur et de ses attributs,
3. Apprendre de l’activité de l’utilisateur.
[Lei Tang, Yahoo! Labs et Huan Liu, Community detection and Mining in Social Media]
Métriques globales qui caractérise le réseau:
1. Composantes connexes,
2. Distance moyenne,
3. Diamètre (plus grand chemin des plus
courts chemin d’un graphe),
4. Densité (=1 si le graphe est complet),
5. Coefficient de clustering moyen.
Typologies et identitées des modèles de réseaux
Distribution des liens dans un réseau social: scale-free, small-worlds, random
Binomial, poisson, normale
limit p small
limit large n
Fig. probabilité de distribution des liens sociaux.
Un réseau social se caractérise par la signature
de la distribution des liens entre les utilisateurs.
Modèle Barabasi-Albert [Barabasi 1999]p(k)
k
Réseau aléatoire (random)
Modèle Erdos-Renyi
Réseau « invariant » (scale-free)
(Attachement préférentiel, loi de puissance)
Nombre
de liens
entre
utilisateurs
Nombre
d’utilisateurs
Réseau « petit monde » (small-worlds)
Modèle Watts and Strogatz [Milgram 1967]
Approximations des réseaux aléatoires (lois de probabilités).
Simulateur du réseau « petit monde »
A terme les utilisateurs formeront une communauté dense.
Modèle des six degrés de séparation.
Logiciel NetLogo
https://en.wikipedia.org/
Watts & Strogatz
http://ladamic.com/netlearn/NetLogo501/ErdosRenyiDegDist.html
Simulateur d’un réseau « aléatoire »
Les nouveaux utilisateurs se connectent entre eux aléatoirement
Modèle de réseau aléatoire (random)
Logiciel NetLogo
https://en.wikipedia.org/
Erdos & Renyi
Simulateur d’un réseau « social sur Internet »
Les nouveaux utilisateurs ont tendance à se connectent aux utilisateurs centraux
Modèle de réseaux « scale-free », attachement préférentiel
https://en.wikipedia.org/wiki/Albert-
L%C3%A1szl%C3%B3_Barab%C3%A1si
Logiciel NetLogo
Barabási
Modèles des réseaux sociaux sur InterNet
Graph model - Barabasi-Albert model, preferential attachment (loi de puissance)
La distribution des liens entre utilisateurs sur InterNet suit
la loi de puissance:
les utilisateurs se connectent entre eux avec une
probabilité proportionnelle à leurs poplarités (degrés).
http://www.northeastern.edu/tomorrow/curing-
disease/albert-laszlo-barabasi-maps-the-disease-network
La probabilité d’observer un noeud de degré k
est calculé par :

 Ckkp )(
Constante de normalisation
power law
exponent 
La probabilité qu’un nouveau noeud
soit connecté au noeud est :
[Lada ADAMIC, Coursera SNA course 2014]
puissance 
(in/out degree)
film actors 2.3
telephone call graph 2.1
email networks 1.5/2.0
sexual contacts 3.2
WWW and Social Networks 2.3/2.7
internet 2.5
peer-to-peer 2.1
metabolic network 2.2
protein interactions 2.4 nodes ordered in descending
degree
degree
short
head
long
tail
Example de réseau de type
“attachement préférentiel”.
Type de réseau
Caractéristiques des réseaux sociaux en ligne (InterNet)
Un réseau social se caractérise par:
1. un taux élevé de clustering (mes amis sont amis entre eux),
2. une densité faible du graphe O(log Nombre_noeuds),
3. une distribution des liens de degrés entre utilisateurs qui suit la « loi de puissance ».,
4. un graphe de plus en plus en plus dense, le diamètre diminuant avec le temps.
Techniques d’attaques dans les réseaux sociaux
Menaces et falsification de la réputation et de la confiance (1/2)
Local attack
-
-
-
-
-
--
-
-
-
-
+
+
+
+
-
individual
individualindividual
individual
individual
individual
Individual malicious
Threat model A
Diffamation
Local and system attack
-
+
- -
+
-
-
-
-
+
+
+
+
+
+
+
boost
collective
attack
individual
Partially malicious collectives
Threat model B’
Association de malfaiteurs
-
-
- -
-
-
-
-
-
+
+
+
+
collective
Collective
individual
Malicious collectives
Threat model B
Association de malfaiteurs
[Gomez, 2009]
Techniques d’attaques dans les réseaux sociaux
Menaces et falsification de la réputation et de la confiance (2/2)
%(+/-)
+
+
++
%(+/-) %(+/-)
%(+/-)
%(+/-)
%(+/-)
%(+/-)
%(+/-)
%(+/-)
collective
collective
individual
Malicious collectives with camouflage
Threat model C
Association de malfaiteurs
+
+
+
+
+
-
-
-
-
-
-
Malicious spies
boost
individual
spie
spie
Threat model D
Association de malfaiteurs et d’espions
Sybil attack
1
2 3
4
5
6
Threat model E
Identité multiple,
usurpation d’identité
Local and system attack Local and system attack Local and system attack
[Gomez, 2009]
Mise en application des Graphes
Architecture globale des graphes applicatifs
exemple théorique :Allociné et FaceBook
0 1 … 0
1 0 … 1
1 1 … 0
0 0 … 1
0 0 … 0
(NetLogo)
Extraction des données
FaceBook (GraphML)
Analyse
et visualisation
Modélisation
(Matrix and Algorithm)
import igraph
g = Graph(1)
g.add_edges([(0,1), (1,2)])
layout = g.layout("rt", 2)
plot(g, layout)
Site Web de Commerce Scocial
Simulateurs
(Python)
Traitement des graphes
Gephi
Base de données
Graph Querry Language
Analytique et visualisation (science de la donnée, fouille de graphes)
NetworkX
XML
Graphe LinkedIn – données d’un réseau social
Extraction et visualisation de mes relations professionnelles sur LinkedIn
http://socilab.com/
Extracteur au format des données
Au format « .net »
http://gephi.github.io/
LinkedIn network
Fichier au format NET
• Algo Hub : diamètre
(colorisation)
Nœuds fortement
connecté
Algo Détection
de communautés
Visualisation et analyseApplication web d’extraction des données Stockage des données au format .net/csv
Social Network AnalysisLinkedIn Graph
Algorithm
1. Atlas 2 (data viz)
2. Community of users
3. Degree (connectivity)
Graphe FaceBook – données d’un réseau social
Extraction et visualisation de mes relations d’amitiés
NetGet is a modified (reduced functionality) version of the
Netvizz app by (Bernhard Rieder, who was kind to share the
source code for the purpose of having students in Coursera's
SNA course examine their social networks. It allows you to create
GML format files of the friendship relations within either your
personal network or the groups you are a member of. These files
can then be analyzed and visualized using graph visualization
software such as Gephi, NetworkX and iGraph. Big networks may
take some time to process. Be patient!
http://snacourse.com/getnet
Bernhard Rieder
University of Amsterdam
Mediastudies Department, Associate Professor
http://gephi.github.io/
Visualisation
des relations (DataViz)
GML format (Graph Markup Language)
Data extractor Tableur de données (DataSet)
FaceBook Network (web site) FaceBook Network (Graph)
Community detection Male, female and association
Social Network Analysis
Algorithm
1. Atlas 2 (data viz)
2. Community of users
3. Degree (connectivity)
Fichier au format GML
Graphe FaceBook – Visualisation de mon réseau d’amis
Logiciel GEPHI d’analyse visuelle des métriques d’un réseau social : communautés et popularité de mes amis
Comment trouver
le chemin le plus court
entre deux nœuds ?
• Mon réseau social a une signature de relations qui respecte
la « loi de puissance » (attachement préférentiel).
http://gephi.github.io/
« Détection de communautés »
« Détection des amis les plus populaires »
Graphe FaceBook – Visualisation avec l’outil Gephi
Localisations, genres et communautés dans mon réseau social
Graphe FaceBook – métrique « Betweenness »
Médiateur avec beaucoup d’utilisateurs (Betweenness Centrality)
fabian
Graphe FaceBook – métrique « Closeness »
Proximité avec les autres utilisateurs (Closeness Centrality = geographic )
Laurent
Site de covoiturage – graphe de confiance
moteur de recommandation basé sur la confiance
(users-to-users Trust-based Recommendation)
Rating Rating
Payment fuel
Travel path
a
b
c
0.41
0.36
0.23
0.41
0.23
0.23
0.36
0.41
0.36
Graphe d’historique des avis
utilisateurs
(multi-graph feedback rating)
Graphe de réputation globale
des utilisateurs
(0.8,0.8,0.2)
a b
c
(0.7,0.9,1.0)
(0.9)
Graphe de confiance
(global trust)
Graphe d’opinions
des utilisateurs (graphe signé)
a
b
c
0.41
0.41
0.41

Contenu connexe

Similaire à Social network metrics and trust based recommendation

Detection and Analysis of Hidden Activities in Social network
Detection and Analysis of Hidden Activities in Social networkDetection and Analysis of Hidden Activities in Social network
Detection and Analysis of Hidden Activities in Social networkWiem louhichi
 
Les principaux logiciels pour l'analyse de réseau
Les principaux logiciels pour l'analyse de réseauLes principaux logiciels pour l'analyse de réseau
Les principaux logiciels pour l'analyse de réseauLaurent Beauguitte
 
Des traces d'usages aux patterns relationnels : la construction technologique...
Des traces d'usages aux patterns relationnels : la construction technologique...Des traces d'usages aux patterns relationnels : la construction technologique...
Des traces d'usages aux patterns relationnels : la construction technologique...Sébastien
 
Connectés mais protégés : le pari des réseaux sociaux décentralisés. Par Fran...
Connectés mais protégés : le pari des réseaux sociaux décentralisés. Par Fran...Connectés mais protégés : le pari des réseaux sociaux décentralisés. Par Fran...
Connectés mais protégés : le pari des réseaux sociaux décentralisés. Par Fran...SMCFrance
 
Mc flashcards
Mc flashcardsMc flashcards
Mc flashcardsLaoureux
 
Des réseaux sociaux aux réseaux sociaux d’entreprise
Des réseaux sociaux aux réseaux sociaux d’entreprise Des réseaux sociaux aux réseaux sociaux d’entreprise
Des réseaux sociaux aux réseaux sociaux d’entreprise Maria Mercanti-Guérin
 
Université d’été ferney voltaire 2014 – les réseaux atelier-pajek
Université d’été ferney voltaire 2014 – les réseaux atelier-pajekUniversité d’été ferney voltaire 2014 – les réseaux atelier-pajek
Université d’été ferney voltaire 2014 – les réseaux atelier-pajekMarion Maisonobe
 
Intervention de David Fayon à Vulcania
Intervention de David Fayon à VulcaniaIntervention de David Fayon à Vulcania
Intervention de David Fayon à VulcaniaBertrand Soulier
 
Jamespot Les RéSeaux Sociaux P2 P Prospectives Et Usages Alain Garnier
Jamespot   Les RéSeaux Sociaux P2 P Prospectives Et Usages   Alain GarnierJamespot   Les RéSeaux Sociaux P2 P Prospectives Et Usages   Alain Garnier
Jamespot Les RéSeaux Sociaux P2 P Prospectives Et Usages Alain GarnierAlain GARNIER
 
Cm internet 2010 2011_rennes2 v2
Cm internet 2010 2011_rennes2 v2Cm internet 2010 2011_rennes2 v2
Cm internet 2010 2011_rennes2 v2BELVEZE Damien
 
Conception des bases de données relationelles
Conception des bases de données relationellesConception des bases de données relationelles
Conception des bases de données relationellesYassine Badri
 
Croisière sur le data lake
Croisière sur le data lakeCroisière sur le data lake
Croisière sur le data lakeDavid Morel
 
Sites de réseautage social, un petit monde où la confiance est aveugle
Sites de réseautage social, un petit monde où la confiance est aveugleSites de réseautage social, un petit monde où la confiance est aveugle
Sites de réseautage social, un petit monde où la confiance est aveugleISACA Chapitre de Québec
 
Conférence réseauxsociaux 18062012
Conférence réseauxsociaux 18062012Conférence réseauxsociaux 18062012
Conférence réseauxsociaux 18062012Aymeric
 
cartographie-Search2012-SocialComputing
cartographie-Search2012-SocialComputingcartographie-Search2012-SocialComputing
cartographie-Search2012-SocialComputingSocial Computing
 
4 ModeleRelationnel.pdf
4 ModeleRelationnel.pdf4 ModeleRelationnel.pdf
4 ModeleRelationnel.pdfAzedineSariye
 
Cours réseaux sociaux et community management
Cours réseaux sociaux et community managementCours réseaux sociaux et community management
Cours réseaux sociaux et community managementChristophe Benavent
 

Similaire à Social network metrics and trust based recommendation (20)

Detection and Analysis of Hidden Activities in Social network
Detection and Analysis of Hidden Activities in Social networkDetection and Analysis of Hidden Activities in Social network
Detection and Analysis of Hidden Activities in Social network
 
Les principaux logiciels pour l'analyse de réseau
Les principaux logiciels pour l'analyse de réseauLes principaux logiciels pour l'analyse de réseau
Les principaux logiciels pour l'analyse de réseau
 
Des traces d'usages aux patterns relationnels : la construction technologique...
Des traces d'usages aux patterns relationnels : la construction technologique...Des traces d'usages aux patterns relationnels : la construction technologique...
Des traces d'usages aux patterns relationnels : la construction technologique...
 
Connectés mais protégés : le pari des réseaux sociaux décentralisés. Par Fran...
Connectés mais protégés : le pari des réseaux sociaux décentralisés. Par Fran...Connectés mais protégés : le pari des réseaux sociaux décentralisés. Par Fran...
Connectés mais protégés : le pari des réseaux sociaux décentralisés. Par Fran...
 
Mc flashcards
Mc flashcardsMc flashcards
Mc flashcards
 
Des réseaux sociaux aux réseaux sociaux d’entreprise
Des réseaux sociaux aux réseaux sociaux d’entreprise Des réseaux sociaux aux réseaux sociaux d’entreprise
Des réseaux sociaux aux réseaux sociaux d’entreprise
 
Web Doc Adbs 6juillet2007
Web Doc Adbs 6juillet2007Web Doc Adbs 6juillet2007
Web Doc Adbs 6juillet2007
 
Université d’été ferney voltaire 2014 – les réseaux atelier-pajek
Université d’été ferney voltaire 2014 – les réseaux atelier-pajekUniversité d’été ferney voltaire 2014 – les réseaux atelier-pajek
Université d’été ferney voltaire 2014 – les réseaux atelier-pajek
 
Intervention de David Fayon à Vulcania
Intervention de David Fayon à VulcaniaIntervention de David Fayon à Vulcania
Intervention de David Fayon à Vulcania
 
Jamespot Les RéSeaux Sociaux P2 P Prospectives Et Usages Alain Garnier
Jamespot   Les RéSeaux Sociaux P2 P Prospectives Et Usages   Alain GarnierJamespot   Les RéSeaux Sociaux P2 P Prospectives Et Usages   Alain Garnier
Jamespot Les RéSeaux Sociaux P2 P Prospectives Et Usages Alain Garnier
 
Cm internet 2010 2011_rennes2 v2
Cm internet 2010 2011_rennes2 v2Cm internet 2010 2011_rennes2 v2
Cm internet 2010 2011_rennes2 v2
 
Conception des bases de données relationelles
Conception des bases de données relationellesConception des bases de données relationelles
Conception des bases de données relationelles
 
Croisière sur le data lake
Croisière sur le data lakeCroisière sur le data lake
Croisière sur le data lake
 
Sites de réseautage social, un petit monde où la confiance est aveugle
Sites de réseautage social, un petit monde où la confiance est aveugleSites de réseautage social, un petit monde où la confiance est aveugle
Sites de réseautage social, un petit monde où la confiance est aveugle
 
Ic05complet
Ic05completIc05complet
Ic05complet
 
Conférence réseauxsociaux 18062012
Conférence réseauxsociaux 18062012Conférence réseauxsociaux 18062012
Conférence réseauxsociaux 18062012
 
cartographie-Search2012-SocialComputing
cartographie-Search2012-SocialComputingcartographie-Search2012-SocialComputing
cartographie-Search2012-SocialComputing
 
4 ModeleRelationnel.pdf
4 ModeleRelationnel.pdf4 ModeleRelationnel.pdf
4 ModeleRelationnel.pdf
 
Ic05plan
Ic05planIc05plan
Ic05plan
 
Cours réseaux sociaux et community management
Cours réseaux sociaux et community managementCours réseaux sociaux et community management
Cours réseaux sociaux et community management
 

Social network metrics and trust based recommendation

  • 1. Science des réseaux « Analytique des réseaux sociaux » Jimmy Siméon, Presentation based on : • Coursera course Pr Lada Adamic from Michigan university – 2014 • Computer research with Pr Didier Puzenat from W.I. University - 2016 p(k) = Ck-a Données des réseaux sociaux Simulateurs et visualisation Modèles mathématiques NetLogo n(n-1)/2 Données: LinkedIn / FaceBook a b c 0.41 0.36 0.23 0.41 0.23 0.23 0.36 0.41 0.36 Graphe métier B2C de confiance
  • 2. Agenda • Théorie des réseaux sociaux Définition, les besoins, mesures, modélisations et classifications, Génération et simulation de réseaux sociaux, Techniques d’attaques dans un réseau social. • Mise en application des réseaux sociaux Analytique visuelle des métriques locales/globales d’un réseau social, Réseau d’amis « FaceBook » et professionnel « LinkedIn », Graphe de recommandation basé sur la confiance.
  • 4. Fouille des réseaux sociaux (Social Network Mining) Ensemble des techniques de ‘data mining’ qui considèrent explicitement les liens lors de la construction de modèles descriptifs ou prédictifs à partir de données relationnelles. [Geroor 2005]. L’état de l’art de la recherche sur les réseaux sociaux: • Prédiction de liens (ex.: pour améliorer le marketing viral), • Identifier les acteurs importants/experts, • Détection de communautés, • Identifications des rôles joués par les individus en fonction de leurs liens, • Diffusion de l’information au sein d’un réseau social, • Recommandation basée sur le confiance et la réputation, • Anonymisation et vie privée.
  • 5. Qu’est-ce qu’un réseau social pour la théorie des graphes ? • Un réseau est un ensemble de noeuds connectés par des liens.“Réseau” ≡ “Graphe” points lignes vertices edges, arcs math nodes links computer science sites bonds physics actors ties, relations sociology Noeud (node) Lien (edge) • Graphe complet, • Graphe orienté/dirigé (digraph), • Graphe non orienté, • Multi-graphe, Speudographe (self loop), • Graphe biparti complet.Utilisateur Relation Réseau Social • Pondéré • Orienté • Identité Chemin (path)
  • 6. Métriques locales et globales des réseaux sociaux Centralité utilisateurs, caractéristique du réseau social Les nœuds d’un réseau social n’ont pas tous la même importance. Métriques locales de centralité d’un utilisateur ou d’un groupe d’utilsateurs: 1. Popularité d’un utilisateur (Degree Centrality = connectivity level), 2. Proximité avec les autres utilisateurs (Closeness Centrality = geographic ), 3. Médiateur avec beaucoup d’utilisateurs (Betweenness Centrality), 4. Popularité liée à la popularité de ses amis (Eigenvector Centrality = connected with central nodes). Analyser la force et la faiblesse des liens entre utilisateurs: 1. Analyser la typologie du réseau, motifs de connections, 2. Apprendre du profil utilisateur et de ses attributs, 3. Apprendre de l’activité de l’utilisateur. [Lei Tang, Yahoo! Labs et Huan Liu, Community detection and Mining in Social Media] Métriques globales qui caractérise le réseau: 1. Composantes connexes, 2. Distance moyenne, 3. Diamètre (plus grand chemin des plus courts chemin d’un graphe), 4. Densité (=1 si le graphe est complet), 5. Coefficient de clustering moyen.
  • 7. Typologies et identitées des modèles de réseaux Distribution des liens dans un réseau social: scale-free, small-worlds, random Binomial, poisson, normale limit p small limit large n Fig. probabilité de distribution des liens sociaux. Un réseau social se caractérise par la signature de la distribution des liens entre les utilisateurs. Modèle Barabasi-Albert [Barabasi 1999]p(k) k Réseau aléatoire (random) Modèle Erdos-Renyi Réseau « invariant » (scale-free) (Attachement préférentiel, loi de puissance) Nombre de liens entre utilisateurs Nombre d’utilisateurs Réseau « petit monde » (small-worlds) Modèle Watts and Strogatz [Milgram 1967] Approximations des réseaux aléatoires (lois de probabilités).
  • 8. Simulateur du réseau « petit monde » A terme les utilisateurs formeront une communauté dense. Modèle des six degrés de séparation. Logiciel NetLogo https://en.wikipedia.org/ Watts & Strogatz
  • 9. http://ladamic.com/netlearn/NetLogo501/ErdosRenyiDegDist.html Simulateur d’un réseau « aléatoire » Les nouveaux utilisateurs se connectent entre eux aléatoirement Modèle de réseau aléatoire (random) Logiciel NetLogo https://en.wikipedia.org/ Erdos & Renyi
  • 10. Simulateur d’un réseau « social sur Internet » Les nouveaux utilisateurs ont tendance à se connectent aux utilisateurs centraux Modèle de réseaux « scale-free », attachement préférentiel https://en.wikipedia.org/wiki/Albert- L%C3%A1szl%C3%B3_Barab%C3%A1si Logiciel NetLogo Barabási
  • 11. Modèles des réseaux sociaux sur InterNet Graph model - Barabasi-Albert model, preferential attachment (loi de puissance) La distribution des liens entre utilisateurs sur InterNet suit la loi de puissance: les utilisateurs se connectent entre eux avec une probabilité proportionnelle à leurs poplarités (degrés). http://www.northeastern.edu/tomorrow/curing- disease/albert-laszlo-barabasi-maps-the-disease-network La probabilité d’observer un noeud de degré k est calculé par :   Ckkp )( Constante de normalisation power law exponent  La probabilité qu’un nouveau noeud soit connecté au noeud est : [Lada ADAMIC, Coursera SNA course 2014] puissance  (in/out degree) film actors 2.3 telephone call graph 2.1 email networks 1.5/2.0 sexual contacts 3.2 WWW and Social Networks 2.3/2.7 internet 2.5 peer-to-peer 2.1 metabolic network 2.2 protein interactions 2.4 nodes ordered in descending degree degree short head long tail Example de réseau de type “attachement préférentiel”. Type de réseau
  • 12. Caractéristiques des réseaux sociaux en ligne (InterNet) Un réseau social se caractérise par: 1. un taux élevé de clustering (mes amis sont amis entre eux), 2. une densité faible du graphe O(log Nombre_noeuds), 3. une distribution des liens de degrés entre utilisateurs qui suit la « loi de puissance »., 4. un graphe de plus en plus en plus dense, le diamètre diminuant avec le temps.
  • 13. Techniques d’attaques dans les réseaux sociaux Menaces et falsification de la réputation et de la confiance (1/2) Local attack - - - - - -- - - - - + + + + - individual individualindividual individual individual individual Individual malicious Threat model A Diffamation Local and system attack - + - - + - - - - + + + + + + + boost collective attack individual Partially malicious collectives Threat model B’ Association de malfaiteurs - - - - - - - - - + + + + collective Collective individual Malicious collectives Threat model B Association de malfaiteurs [Gomez, 2009]
  • 14. Techniques d’attaques dans les réseaux sociaux Menaces et falsification de la réputation et de la confiance (2/2) %(+/-) + + ++ %(+/-) %(+/-) %(+/-) %(+/-) %(+/-) %(+/-) %(+/-) %(+/-) collective collective individual Malicious collectives with camouflage Threat model C Association de malfaiteurs + + + + + - - - - - - Malicious spies boost individual spie spie Threat model D Association de malfaiteurs et d’espions Sybil attack 1 2 3 4 5 6 Threat model E Identité multiple, usurpation d’identité Local and system attack Local and system attack Local and system attack [Gomez, 2009]
  • 15. Mise en application des Graphes
  • 16. Architecture globale des graphes applicatifs exemple théorique :Allociné et FaceBook 0 1 … 0 1 0 … 1 1 1 … 0 0 0 … 1 0 0 … 0 (NetLogo) Extraction des données FaceBook (GraphML) Analyse et visualisation Modélisation (Matrix and Algorithm) import igraph g = Graph(1) g.add_edges([(0,1), (1,2)]) layout = g.layout("rt", 2) plot(g, layout) Site Web de Commerce Scocial Simulateurs (Python) Traitement des graphes Gephi Base de données Graph Querry Language Analytique et visualisation (science de la donnée, fouille de graphes) NetworkX XML
  • 17. Graphe LinkedIn – données d’un réseau social Extraction et visualisation de mes relations professionnelles sur LinkedIn http://socilab.com/ Extracteur au format des données Au format « .net » http://gephi.github.io/ LinkedIn network Fichier au format NET • Algo Hub : diamètre (colorisation) Nœuds fortement connecté Algo Détection de communautés Visualisation et analyseApplication web d’extraction des données Stockage des données au format .net/csv Social Network AnalysisLinkedIn Graph Algorithm 1. Atlas 2 (data viz) 2. Community of users 3. Degree (connectivity)
  • 18. Graphe FaceBook – données d’un réseau social Extraction et visualisation de mes relations d’amitiés NetGet is a modified (reduced functionality) version of the Netvizz app by (Bernhard Rieder, who was kind to share the source code for the purpose of having students in Coursera's SNA course examine their social networks. It allows you to create GML format files of the friendship relations within either your personal network or the groups you are a member of. These files can then be analyzed and visualized using graph visualization software such as Gephi, NetworkX and iGraph. Big networks may take some time to process. Be patient! http://snacourse.com/getnet Bernhard Rieder University of Amsterdam Mediastudies Department, Associate Professor http://gephi.github.io/ Visualisation des relations (DataViz) GML format (Graph Markup Language) Data extractor Tableur de données (DataSet) FaceBook Network (web site) FaceBook Network (Graph) Community detection Male, female and association Social Network Analysis Algorithm 1. Atlas 2 (data viz) 2. Community of users 3. Degree (connectivity) Fichier au format GML
  • 19. Graphe FaceBook – Visualisation de mon réseau d’amis Logiciel GEPHI d’analyse visuelle des métriques d’un réseau social : communautés et popularité de mes amis Comment trouver le chemin le plus court entre deux nœuds ? • Mon réseau social a une signature de relations qui respecte la « loi de puissance » (attachement préférentiel). http://gephi.github.io/ « Détection de communautés » « Détection des amis les plus populaires »
  • 20. Graphe FaceBook – Visualisation avec l’outil Gephi Localisations, genres et communautés dans mon réseau social
  • 21. Graphe FaceBook – métrique « Betweenness » Médiateur avec beaucoup d’utilisateurs (Betweenness Centrality) fabian
  • 22. Graphe FaceBook – métrique « Closeness » Proximité avec les autres utilisateurs (Closeness Centrality = geographic ) Laurent
  • 23. Site de covoiturage – graphe de confiance moteur de recommandation basé sur la confiance (users-to-users Trust-based Recommendation) Rating Rating Payment fuel Travel path a b c 0.41 0.36 0.23 0.41 0.23 0.23 0.36 0.41 0.36 Graphe d’historique des avis utilisateurs (multi-graph feedback rating) Graphe de réputation globale des utilisateurs (0.8,0.8,0.2) a b c (0.7,0.9,1.0) (0.9) Graphe de confiance (global trust) Graphe d’opinions des utilisateurs (graphe signé) a b c 0.41 0.41 0.41