SlideShare une entreprise Scribd logo
1  sur  71
Télécharger pour lire hors ligne
BC-0506: Comunicação e Redes
BC-
      Grafos Aleatórios
 e Redes de Mundos Pequenos




                           1
Índice de Assuntos
Grafos Aleatórios: Erdös e Rényi
  Grafos Aleatórios: Conceitos
  Exemplos: propagação de boatos
Seis graus de Separação
  Experimento de Milgran
  Outros exemplos
Redes de Mundos Pequenos
  Conexões Fortes e Fracas
  Clusterização


                                   2
Parte 1: Grafos Aleatórios
Conceitos
Dado um Grafo não-orientado de n vértices,
quantas arestas poderão existir no máximo?

            2                   5


                  3       4
                                    5 Vértices
                                    6 Arestas
            1


Mais arestas: mais caminhos, distâncias menores,
menor diametro, maiores graus

                                                 4
Exemplo de Grafo com 5 vértices:
     número máximo de arestas: contamos 10
                      5




           1                       4




               2              3


                                             5
Dedução do caso geral
Cada vértice conectando-se com todos os demais
diretamente: número de conexões do vértice = n-1
            5                   Número total de
                                conexões = n x (n-1)


                                Cada par de vértices
  1                      4
                                compartilha uma
                                conexão. Logo:

                                n. Arestas máx =
                                    n x (n-1)/2

      2              3


                                                   6
Dedução do caso geral
Do exemplo de Grafo com n = 5 vértices:
número máximo de arestas = 5 x (5-1)/2 = 10
                      5




           1                      4




               2              3


                                              7
Dedução do caso geral
Da mesma forma, se o Grafo tem apenas um
componente conexo com n = 5 vértices:
                                           5
  número mínimo de arestas = n-1


                               1                           4




Atenção:                           2                   3
  Se está dito ou subentendido que todos os vértices
  estão no mesmo componente conexo.
  Não é necessário existirem arestas em um grafo       8
Grafos aleatórios:
O que são?
Para que servem?




                     9
Grafos aleatórios:
Conceito: dado um Grafo de n vértices, iniciar a
colocação de arestas entre pares de vértices de
forma aletória, sem repetição.
Formam-se sub-Grafos
                              5




                  1                       4




                       2              3

                                                   10
Grafos aleatórios:
Conceito: dado um Grafo de n vértices, cada
aresta pode existir ou não com probabilidade p.
   Quando a maioria dos vértices serão conectados
   em componente conexo?
                                       5
   Surgem propriedades interessantes


                           1                            4
minimo
(n-1)
    < num. arestas <
             n x (n-1)/2                                p
               máximo

                                2                   3

                                                        11
Grafos aleatórios:
À medida que inserimos arestas, se formam vários
sub-Grafos disconexos.
• Quando o número de conexões aumenta, estes
sub-Grafos se conectam, formando componentes
conexos cada vez maiores.
Se o grau médio supera 1, um único super-
componente conexo contém a maioria dos vértices.
• A maioria dos vértices do Grafo poderá ser
alcançado a partir de qualquer outro vértice,
bastando seguir um conjunto de arestas [01].


                                                12
Grafos aleatórios:
Comportamento de transição de fase.
    Se <k> < 1: componentes desconectados com
    tamanho médio 1/(1-np)
    Se <k> > 1 : só pode haver um super-
    componente contendo a maioria dos vértices
    <k> = 1 : Transição de fase !!
      Comportamento muda rapidamente
         Nome vem da física estatística
         Analogia: transição de estados da
         matéria
                                                13
Grafos aleatórios:
Intuição da prova:
    Suponha um subconjunto de vértices S.
    Considere as arestas que “saem” de S
    (conectam vértice em S a vértice fora de S)
    Tome uma delas, e inclua em S o vértice fora
    de S.
     Há menos uma aresta saindo de S. (aquela
    que foi explorada)
    Há mais arestas saindo de S (todas as outras
    incidindo no novo vértice)
       Quantas são? Na média, <k>
                                                14
Grafos aleatórios:
Intuição da prova:
    Ou seja, para cada nova aresta explorada,
    incluimos um vértice em S, e o conjunto de
    arestas na fronteira aumenta em <k> e diminui
    em 1
       Ou seja, muda em <k> - 1
    Se <k> < 1, na média a mudanca é negativa: o
    numero de arestas a explorar vai cair
    Se <k> > 1, na média a mudança é positiva:
    haverão arestas a explorar até acabarem os
    vértices (ou pelo menos explorar a maioria
    dos vértices)                              15
Grafos aleatórios:
Demo: transição de fase ao aumentar p
       Gif animada
http://www.stanford.edu/~dgleich/demos/matlab/random_graphs/erdosreyni.html




                                                                         16
Grafos aleatórios:
Podem existir 2 componentes gigantes?
Se existirem 2 componentes gigantes, com N1 e
N2 vértices, qual a probabilidade de uma aresta
conectar os 2?
A aresta tem que conectar um vertice em N1 (prob
N/n) a um vértice em N2 (N2/n), ou vice-versa
(conta 2x)
Prob = 2N1N2/n2
Probabilidade de uma aresta NÂO conectar N1 e
N2, então é 1 - 2N1N2/n2

                                                  17
Grafos aleatórios:
Podem existir 2 componentes gigantes?
Probabilidade de uma aresta NÂO conectar N1 e
N2, então é 1 - 2N1N2/n2
Existem no máximo (½)n(n-1) ~= ½ n2p arestas
Portanto a probabilidade que nenhuma das arestas
junte os 2 componentes é (pela definição da exponencial)



Que tende a zero quando N1 e N2 aumentam ou
crescem mais rápido do que n. (p=<k>/n)
                                                     18
Grafos aleatórios: para que
servem?
Apesar dos Grafos serem uma simplificação
elegante para facilitar o entendimento e
desenvolver soluções para problemas, na prática,
apresentam grandes desafios
  Apesar do Grafo poder representar as relações
  sociais, a Internet, e o metabolismo celular, as leis
  que regem a sua formação e inter-relacionamento são
  claramente diferentes
Como desenvolver um modelo de Grafo para
descrever sistemas tão diferentes e, ao mesmo
tempo, descobrir propriedades compartilhadas?


                                                    19
Grafos aleatórios
Paul Erdös e Alfred Rényi (húngaros) propuseram
então os Grafos aleatórios, sugerindo que, muitas
redes complexas na Natureza poderiam seguir um
padrão aleatório de formação
A partir dos Grafos aleatórios, muitos fenômenos
naturais e sociais passaram a ser estudados e
analisados a partir deste modelo de referência
   Antes, eram estudados somente redes regulares
Erdös escreveu mais de 1500 artigos em matemática
até a sua morte em 1996, a maioria em co-autoria
  Sua produção só é superada por Euler
  Com Rényi, foram 8 artigos clássicos sobre Grafos
                                                      20
Frases de Erdös
Paul Erdös foi um itinerante a sua vida toda, não
tendo nenhuma posse a não ser uma pequena mala
  Batia na porta de conhecidos do mundo inteiro e dizia:
  “A minha mente está aberta”
Tinha um gosto especial pela probabilidade
  Dizia: “Deus se diverte jogando dados com o mundo”
  Seu colega Albert Einstein não concordava: “Deus não
  joga dados com o Universo”
Afirmava também que não criamos a matemática,
apenas a descobrimos
  Considerava que as verdades matemáticas eram as
  mais absolutas e eternas
                                                     21
Exemplos:


Propagação de boatos:
  Festa com 100 convidados
  Nem todos conhecem os outros convidados
  Grupos de 2 a 3 pessoas que se conhecem
  Todos conhecem pelo menos UMA pessoa de outros
  grupos. E sempre saem do grupo para contar novidades
  para seus amigos
  Se a cada 10 minutos eles contam as novidades para os
  amigos, quanto tempo leva em média para que uma nova
  informação chegue a todos os 99 convidados?
                                                     22
Exemplos:



Pior caso é a pessoa ter que transmitir a
informação pessoalmente uma a uma:
teríamos: 99 x 10 minutos: 16,5 horas
Ou, se pensarmos nos grupos como vértices,
supondo 50 grupos, transmitindo para os grupos
um por um, 50 x 10 min = 500 min = 8,33 h
Quanto tempo demora considerando que eles tem
amigos fora do grupo? Como modelamos os amigos?
                                                 23
Exemplos:



aresta entre os grupos: alguem do grupo conhece
alguem do outro grupo
1 troca em 10 min: a cada 10 min, a informação
percorre cada aresta.
Como sabemos quando a informação chegará a
maioria dos vértices na média?


                                                 24
Exemplos:



aresta entre os grupos: alguem do grupo conhece
alguem do outro grupo
1 troca em 10 min: a cada 10 min, a informação
percorre cada aresta.
Como sabemos quando a informação chegará a
maioria dos vértices na média?
Calculando a distância média no super componente
do grafo aleatório. Que é pequena.
                                                 25
Exemplos:



Pior caso é a pessoa ter que transmitir a
informação pessoalmente uma a uma:
teríamos: 99 x 10 minutos: 16,5 horas
Erdös e Rényi provam pelos Grafos aleatórios que
bastam 30 minutos em média para que todos os 99
convidados fiquem sabendo da informação
    Diamêtro médio neste super componente é 3

                                              26
Uso de grafos aleatórios

Estes mesmos modelos podem ser utilizados para
estudar e modelar propagação de doenças, reações
químicas, propagação de vírus na Internet, etc.
Em redes com grande quantidade de vértices, um Grafo
aleatório terá vértices com aproximadamente o mesmo
número de arestas
Medindo o grau de cada vértice do Grafo aleatório, e o
resultado desenhado em um histograma, a distribuição
de graus irá seguir a distribuição de Poisson
  Esse tipo de Grafo é conhecido também como Grafo
  aleatório de Poisson


                                                     27
Uso de grafos aleatórios

Distribuição de Poisson




                           28
Geração de Grafos Aleatórios

Um grafo aleatório é um grafo (rede) gerado por
um processo aleatório
Formação
  Iniciar com N vértices e nenhuma aresta
  Com probabilidade p, conectar 2 vértices
  selecionados aleatoriamente com uma aresta


                  com p=0.2




                                               29
Parte 2: Seis Graus de
      Separação




 Imagem: http://en.wikipedia.org/wiki/File:Six_degrees_of_separation.svg
Experimento de Milgram:
Origens: escritor húngaro Karinthy escreve o
conto “Cadeia” em 1929, onde o personagem tenta
demonstrar que as pessoas estão muito mais
próximas que se supõem
A partir de no máximo cinco conhecidos, se
poderia chegar a qualquer um dos meio Bilhão de
pessoas da Terra (números da época)
Em 1967, o professor de Harvard, Stanley
Milgram realiza um experimento para determinar a
“distância” entre duas pessoas quaisquer dos EUA
  Ele escolheu duas pessoas comuns como “alvo” e dois locais
  distintos e distantes como pontos de partida
                                                               31
Experimento de Milgram:
Nos pontos de partida, ele enviou a residentes
aleatoriamente escolhidos, cartas para
participarem de um estudo sociológico
A carta continha informações sobre as pessoas
“alvo” como nome, endereço e fotos, e as seguintes
instruções:
  Acrescente o seu nome no fim da lista desta folha,
  para que o receptor saiba quem mandou
  Retire um dos cartões postais pré-pagos, preencha-o e
  envie para a Universidade de Harvard para podermos
  acompanhar o progresso do experimento


                                                       32
Experimento de Milgram:

Das 160 cartas preparadas, 42 retornaram
Menor caminho = 2 conexões; Mais longo = 12
Valor médio = 5,5 surpreendentemente baixo
Arredondando-se o 5,5 temos a famosa frase
“6 graus de separação”




                                              33
Experimento de Milgram:
A frase “6 Graus de Separação” não é de Milgram
  Criada pelo autor John Guare que escreveu uma peça
  teatral com este título para a Broadway em 1990,
  (filme em 1993)
O experimento de Milgram sugere que qualquer
pessoa do planeta, conectada com pelo menos UMA
outra pessoa, faz parte de uma enorme rede de 6
bilhões de vértices, e que qualquer pessoa poderá
ser alcançada a partir de poucas conexões
Dessa concepção da sociedade humana deriva o
conceito de Small World, ou Mundo Pequeno
• Expressão “It's a small world” em inglês, e.g.
  quando encontramos conhecidos em comum           34
Experimento de Milgram:
Milgram restringiu a sua experiência aos EUA, sem
considerar pessoas de outros países
Experimentos posteriores mais amplos
apresentaram um valor médio bem menor, de 3,
para quaisquer pessoas dos EUA
Em 2001, o professor Duncan Watts recria o
experimento de Milgram utilizando e-mails: 48 mil
remetentes de 157 países e 19 “Alvos”
O valor médio de intermediários foi 6
E as redes não sociais? Teriam o mesmo grau de
separação?
                                                 35
Outros exemplos - Web
Analisando-se o padrão de links das páginas da
Web (www), para a quantidades de páginas da Web
em 1998 (800 milhões de nós), foi estimado que
qualquer documento da Web seria atingido com 19
cliques, sem utilizar nenhum site de busca
Essa diferença de grau (de 6 para 19) surpreende
principalmente se considerarmos que a maioria das
redes naturais tem poucos graus de separação:
redes de cadeia alimentar (2 graus), moléculas
dentro de uma célula (3 reações químicas), redes
de colaboração de cientistas (de 4 a 6 graus)
Porque esta diferença tão grande?
                                              36
Outros exemplos
A resposta a esta questão tem duas partes
  Redes de hiperlinks da Web são em grande parte
  redes circulares: se auto-referenciam, o que dificulta
  achar um link de “saída” do grupo de páginas
   • Sub-redes dedicadas a assuntos específicos
  Diferença no número de conexões por vértice
     Uma página da Web tem em média 10 links,
   enquanto que um ser humano tem em média de 200 a
   5.000 pessoas conhecidas, segundo estimativa dos
   sociólogos
    Conhecido é diferente de amigo (Dunbar Number)


                                                      37
Parte 3: Mundo Pequeno




                         38
Efeito Mundo Pequeno
O experimento de Milgram despertou a consciência
de um mundo pequeno pois todas as pessoas do
mundo estavam conectadas através de poucos links
Ao mesmo tempo, os estudos teóricos dos Grafos
Aleatórios criadas por Erdös e Rényi,
proporcionavam ferramentas para analisar novas
redes, principalmente as complexas e dinâmicas
Uma das principais propriedades gerais das redes
aleatórias, onde as informações (ou qualquer outra
coisa) se propaga rapidamente por toda rede, é
conhecida como “Efeito Mundo Pequeno” [01]

                                                39
Efeito Mundo Pequeno
O efeito Mundo Pequeno foi estudado e verificado
em numerosas e diferentes redes
Seja dij a distância (menor caminho) entre os
vértices i e j, e [n x (n-1)/2] o número total de
arestas (máximo de todas combinações) do Grafo
Definindo l como a distância média entre todos os
pares de vértices de um Grafo não-direcionado,
temos [02]:



                                                40
Efeito Mundo Pequeno
Se o número de vértices a uma distância <= r de um
vértice central cresce exponencialmente com r,
então o valor de l crescerá de acordo com log n
  Ocorre com várias redes, inclusive grafos aleatórios
Rede é considerada como tendo o “efeito mundo
pequeno” (small world effect) se:
    (1) l escala O(log n) com o tamanho da rede
       O(log n) – logaritmo ou menor
       Fácil de medir (distância média)
    (2) alto índice de clusterização
                                                     41
Efeito Mundo Pequeno
Já foi demonstrado que em redes que seguem uma
lei de potência o valor de l cresce no máximo a
 log n / log log n
    Algumas redes com lei de potência também
    são small-world
Sabemos medir a condição (1)
    Vocês já implementaram o algoritmo
    Não considere vértices não conectados
O que é índice de clusterização?
    Problema:área nova -> várias definições
    similares mas diferentes
                                              42
Clusterização

Como observamos, muitas redes reais não
seguem o modelo dos Grafos Aleatórios criadas
por Erdös e Rényi, pois ele pressupõe uma
distribuição uniforme de vértices e arestas
Nos anos 90, Duncan Watts e Steven Strogatz
propõem um aprimoramento no modelo “Mundo
Pequeno” com a introdução do conceito de
“clusterização” e um “coeficiente de
clusterização” para medir o seu efeito
  clusterização = clustering = agrupamento


                                             43
Coeficiente de Clusterização
 Global
 O Coeficiente de clusterização global é:
      3 x número de triângulos na rede
C=
   número de triplas de vértices conectados

 C pode ser entendido como a probabilidade
 média de que dois vértices que são vizinhos de
 um mesmo outro vértice, também serão vizinhos
 Tripla: um nó com 2 arestas para 2 outros nós
   Não é combinação(n,3)
   Fator 3: em um triângulo há 3 triplas
                                                  44
Coeficiente de Clusterização
Global
Clusterização é frequentemente também
chamada de transitividade
  Se A conhece B e B conhece C então A conhece C
  Nesse caso, um triângulo entre eles é formado
C varia de 0 a 1
C = 0 quando não há nenhuma transitividade
C = 1 quando todos estão conectados a todos,
indicando que existem triângulos entre todos os
conjuntos de 3 vértices

                                                   45
Coeficiente de Clusterização
O grafo abaixo possui C = 3/8 = 0.375 (global)
  1 triangulo
  8 triplas: 6 centradas no nó central
    1 centrada em cada um dos outros nós do triangulo




                                                        46
Coeficiente de Clusterização
Local Médio
Média do coeficiente de clusterização local Ci
para cada vértice i.
Ci = # arestas entre os vizinhos de vi /
   # possível de arestas entre os vizinhos de vi.


Com k vizinhos, são possíveis k(k-1)/2 arestas
Quantas arestas existem entre vizinhos: conte.
  Ou...




                                                    47
Coeficiente de Clusterização
Local Médio
Média do coeficiente de clusterização local Ci
para cada vértice i.
Ci = # arestas entre os vizinhos de vi /
   # possível de arestas entre os vizinhos de vi.


Quantas arestas existem entre vizinhos:
  Calcule o num. de caminhos de comprimento 3 que
  começam e terminam no vértice i.
  A diagonal de A3 é 2x esse número!
     A3=AAA (A é a matriz de adjacências)
     (fácil no MATLAB/Scilab)

                                                    48
Coeficiente de Clusterização
Local Médio
Coef. de clusterização local
   2 vértices à esq do triang: 1
  Vértice central
     (4 vizinhos, 1 aresta):
     1/(4(4-1)/2) = 1/6
  2 vértices isolados
     Alguns consideram 0, outros indefinido
     Não acontece em alguns problemas
  Média: (1+1+1/6)/3=0.72 ou (1+1+1/6+0+0)/5=0.43
     Depende da definição



                                                    49
Coeficiente de Clusterização
Local Médio
Foi proposto primeiro, mas tem um problema:
Suponha:
   um nó com 2 vizinhos, conectados → C = 1
   um nó com 100 vizinhos, desconectados → C=0
  Média dos dois nós: 0.5
Mas não temos metade dos vizinhos conectados!
  Problema com a fórmula: k(k-1) no denominador
     Mais peso para nós de grau pequeno
Útil para estimar conectividade local
  Coef. Clust. Global melhor para descrever o grafo
  todo
                                                      50
Efeito da Clusterização
A figura a mostra um esquema de conexões
uniformes, com todos os vértices conectados
com os vizinhos mais próximos
A figura b mostra uma situação onde algumas
conexões aleatórias que atravessam o Grafo [02]




                                              51
Clusterização
Estas conexões possuem um grande efeito na
distância média do Grafo
Suponha, por exemplo, uma única conexão que
atravesse o Grafo pelo meio
    Qualquer propagação teria a sua distância a
    percorrer reduzida pela metade




                                              52
Clusterização
Quão grande precisa ser o índice de
clusterização para a rede ser mundo pequeno?
    Strogatz: “mundo pequeno” se C >> Crg
    Crg: coef. de clusterização para grafo
    aleatório com mesmo n e #arestas
Qual é o coeficiente de clusterização para um
grafo aleatorio Gn,p ?
    É fácil...



                                                53
Clusterização
Grafo aleatório (random graph):
    p é a probabilidade de 2 vértices estarem
    conectados p/ qualquer par de vértices.
    Portanto para qualquer par de vértices
    conectados a um 3º vertice, a probabilidade
    deste par estar conectado é p.
    Portanto Crg = p = <k>/n




                                            54
Efeito Mundo Pequeno
     Tabela: l p/ diversos tipos de rede
              α : expoente se a distribuição segue lei de potência
              [02]
              Repare como distâncias médias são pequenas
 Tipo rede                     Rede               Tipo        Vértices      Arestas         l         α
   Social     Atores de filmes               não direcional       449.913    25.516.482   3,48       2,3
   Social     Co-autoria de artigos Física   não direcional         52.909      245.300   6,19        -
   Social     Ligações telefônicas           não direcional    47.000.000    80.000.000              2,1
   Social     Mensagens e-mail                 direcional           59.915       86.300    4,95   1,5 a 2,0
Informação    Páginas www                      direcional     203.549.046 2.130.000.000   16,18   2,1 a 2,7
Informação    Redes de citações                direcional         783.339     6.716.198              3,0
Tecnológico   Distribuição elétrica          não direcional          4.941        6.594   18,99       -
Tecnológico   Rotas de trens                 não direcional            587       19.603    2,16       -
 Biológico    Rede metabólica                não direcional            765        3.686    2,56      2,2
 Biológico    Cadeia alimentar marinha         direcional              135          598    2,05       -
 Biológico    Redes Neurais                    direcional              307        2.359    3,95       -
                                                                                                       55
Efeito Mundo Pequeno
 Repare no coeficiente de clusterização (z=<k>)




                                                  56
Geração de Redes Small World

Uma rede small-world é um tipo de grafo onde a
maioria dos vértices não é vizinho dos outros
vértices, mas onde a maioria dos vértices pode
ser alcançada de qualquer outro vértice através
de um número pequeno de arestas
Formação
  Iniciar com um anel (lattice) de N vértices com
  arestas entre os seus n mais próximos vizinhos
  Cada aresta deve ser religada a outro vértice com
  probabilidade p


                                                      57
Geração de Redes Small World




                           58
Geração de Rede Small World
Parte de rede regular
– cada nó se conecta com alguns vizinhos
Cada aresta é reconectada a um vértice distance
com probabilidade p
Se p=1, temos um grafo aleatório




                                            59
Modelo de Rede Small World
Se p aumenta, o coef. de clusterização (C) e o
diâmetro (L) diminuem.




                                                 60
Modelo de Rede Small World
Mas L diminui muito antes de C
Região com C grande e L pequeno = Small World
Conectado só a vizinhos
Mas perto de todos
Sem ser aleatório
E com C alto
Vizinhos conectados
entre si


                                            61
Modelo de Rede Small World
Este modelo simples não é realista para todos os
problemas small world
Mas foi importante para demonstrar as
propriedades básicas e a importância das
ferramentas estatísticas
Particularmente bom para estudo de epidemias
em plantas:
– Plantas doentes infectam as plantas vizinhas
– Às vezes pássaros levam polen infectado


                                                 62
Conexões fortes e fracas
Em 1973, Mark Granovetter de Harvard publica o
artigo The Strength of Weak Ties, no American
Journal of Sociology
  Trata-se de um estudo que o autor realizou durante a
  graduação sobre a busca de emprego
Ao pesquisar sobre os fatores que influenciavam na
busca de um emprego, principalmente nas redes de
contato, ele realizou dezenas de entrevistas com
gerentes e profissionais sobre quem tinha indicado
ou ajudado a encontrar o emprego
  As repostas que mais encontrou não foi “um amigo”, mas
  “um conhecido”
                                                     63
Conexões fortes e fracas
No artigo, ele propõe que, na procura de emprego,
abrir um restaurante, ou espalhar uma notícia
relevante, as nossas conexões sociais mais fracas
(conhecidos) são mais importantes que as nossas
ligações com os nossos estimados amigos
As ligações fortes (amigos) fecham sobre si
mesmas, reduzindo as oportunidades
São as ligações fracas (ou de conhecidos) que
possibilitam que a rede de contatos se expanda e
amplie as oportunidades


                                                   64
Conexões fortes e fracas




O artigo original de Mark Granovetter foi rejeitado
na sua primeira tentativa de publicação, e só foi
publicado 4 anos depois
Hoje, este artigo é reconhecido como um dos
artigos mais influentes da sociologia de todos os
tempos, e um dos mais citados também
                                                    65
Colaboração e Número de Erdös

Paul Erdös não colaborou somente como teórico
na área de Grafos
Como um dos matemáticos mais produtivos de
todos os tempos, produziu mais de 1500 artigos
com 507 co-autores
Esta produção bem documentada, possibilitou um
outro estudo sobre redes de colaboração




                                            66
Colaboração e Número de Erdös

O número de Erdös é um número que foi criado
para medir a distância entre Erdös e uma pessoa
• O próprio Erdös tem o número de Erdös Zero
Aqueles que escreveram um artigo em co-autoria
com Erdös receberam o número Erdös de 1
Aqueles que escreveram um artigo em co-autoria
com alguém com o número Erdös 1, receberam o
número Erdös 2, e assim por diante



                                            67
Colaboração e Número de Erdös

O estudo da rede de colaboração criada em
torno de Erdös mostrou que, em 1998, existia
uma rede fortemente entrelaçada de 70.975
matemáticos, conectados através de mais de
200 mil artigos em co-autoria [02]
Se os matemáticos escolhessem os
colaboradores de forma aleatória, o
coeficiente de clusterização desta rede de
colaboração, seria extremamente pequena,
cerca de 10-5

                                               68
Colaboração e Número de Erdös

Entretanto, as medidas reais mostraram um
coeficiente de clusterização 10.000 vezes
maior, indicando que os matemáticos não
escolhem as suas colaborações de forma
aleatória, e mais que tudo, formam uma rede
altamente clusterizada




                                              69
Coeficiente de Clusterização
                   Rede                   Coeficiente de
                                           Clusterização

                  Web                          0.081

                  Flickr                       0.313

              LiveJournal                     0.330

                 Orkut                         0.171

                YouTube                        0.136

Fonte: Measurement and analysis of online social networks, IMC 2007.
                                                                       70
Referências

[01] Barabasi, A.L., Linked: How Everything Is
Connected to Everything Else and What It Means for
Business, Science and Everyday Life, Plume, 2003.
[02] Newman, M., The Structure and Function of
Complex Networks, Siam Review, Vol. 45, No 2,
pp.167–256, 2003.
Aulas Bruno Gonçalves
http://www.bgoncalves.com/teaching/spring-2011-
i690.html


                                                  72

Contenu connexe

Tendances

Integrais impróprias
Integrais imprópriasIntegrais impróprias
Integrais impróprias
karinsimonato
 
Introdução à Teoria dos Grafos
Introdução à Teoria dos GrafosIntrodução à Teoria dos Grafos
Introdução à Teoria dos Grafos
Bianca Dantas
 
Logaritmos
LogaritmosLogaritmos
Logaritmos
Isabel
 
1ª lista de exercícios de pesquisa operacional com gabarito
1ª lista de exercícios de pesquisa operacional   com gabarito1ª lista de exercícios de pesquisa operacional   com gabarito
1ª lista de exercícios de pesquisa operacional com gabarito
Antonio Rodrigues
 
Resumo sobre Integração de Funções Racionais e Frações Parciais
Resumo sobre Integração de Funções Racionais e Frações ParciaisResumo sobre Integração de Funções Racionais e Frações Parciais
Resumo sobre Integração de Funções Racionais e Frações Parciais
Gustavo Fernandes
 

Tendances (20)

Integrais impróprias
Integrais imprópriasIntegrais impróprias
Integrais impróprias
 
Aula 9
Aula 9Aula 9
Aula 9
 
Flip Flops Parte 4
Flip Flops Parte 4Flip Flops Parte 4
Flip Flops Parte 4
 
Introdução à Teoria dos Grafos
Introdução à Teoria dos GrafosIntrodução à Teoria dos Grafos
Introdução à Teoria dos Grafos
 
Logaritmos
LogaritmosLogaritmos
Logaritmos
 
1ª lista de exercícios de pesquisa operacional com gabarito
1ª lista de exercícios de pesquisa operacional   com gabarito1ª lista de exercícios de pesquisa operacional   com gabarito
1ª lista de exercícios de pesquisa operacional com gabarito
 
Analise 1
Analise 1Analise 1
Analise 1
 
Aula de oxirredução com experimento - Oxirredução com um problemão - http://q...
Aula de oxirredução com experimento - Oxirredução com um problemão - http://q...Aula de oxirredução com experimento - Oxirredução com um problemão - http://q...
Aula de oxirredução com experimento - Oxirredução com um problemão - http://q...
 
Lista de exercício 1 circuitos elétricos I
Lista de exercício 1   circuitos elétricos ILista de exercício 1   circuitos elétricos I
Lista de exercício 1 circuitos elétricos I
 
Resumo sobre Integração de Funções Racionais e Frações Parciais
Resumo sobre Integração de Funções Racionais e Frações ParciaisResumo sobre Integração de Funções Racionais e Frações Parciais
Resumo sobre Integração de Funções Racionais e Frações Parciais
 
mecanica dos fluidos
mecanica dos fluidosmecanica dos fluidos
mecanica dos fluidos
 
Equilíbrio Químico
Equilíbrio QuímicoEquilíbrio Químico
Equilíbrio Químico
 
TEORIA DE CONJUNTOS
TEORIA DE CONJUNTOS TEORIA DE CONJUNTOS
TEORIA DE CONJUNTOS
 
Hibridação sp sp2 e sp3
Hibridação sp sp2 e sp3Hibridação sp sp2 e sp3
Hibridação sp sp2 e sp3
 
8 oxidacao reducao
8  oxidacao reducao8  oxidacao reducao
8 oxidacao reducao
 
Familia do Nitrogênio
Familia do NitrogênioFamilia do Nitrogênio
Familia do Nitrogênio
 
Chumbo 
Chumbo Chumbo 
Chumbo 
 
Cien mat aula3
Cien mat aula3Cien mat aula3
Cien mat aula3
 
9 solubilidade
9 solubilidade9 solubilidade
9 solubilidade
 
Circuitos elétricos 2
Circuitos elétricos 2Circuitos elétricos 2
Circuitos elétricos 2
 

En vedette

Análise de Redes Sociais: Introdução aos Grafos Aleatórios
Análise de Redes Sociais: Introdução aos Grafos Aleatórios Análise de Redes Sociais: Introdução aos Grafos Aleatórios
Análise de Redes Sociais: Introdução aos Grafos Aleatórios
Alexandre Duarte
 

En vedette (6)

Informação e medidas em análise de redes sociais aplicada às empresas
Informação e medidas em análise de redes sociais aplicada às empresasInformação e medidas em análise de redes sociais aplicada às empresas
Informação e medidas em análise de redes sociais aplicada às empresas
 
Análise de Redes Sociais: Introdução aos Grafos Aleatórios
Análise de Redes Sociais: Introdução aos Grafos Aleatórios Análise de Redes Sociais: Introdução aos Grafos Aleatórios
Análise de Redes Sociais: Introdução aos Grafos Aleatórios
 
Introdução à Teoria das Redes (estudo dos graphos)
Introdução à Teoria das Redes (estudo dos graphos)Introdução à Teoria das Redes (estudo dos graphos)
Introdução à Teoria das Redes (estudo dos graphos)
 
Redes sociales y complejidad
Redes sociales y complejidadRedes sociales y complejidad
Redes sociales y complejidad
 
Expressoes Matematicas com o LaTeX
Expressoes Matematicas com o LaTeXExpressoes Matematicas com o LaTeX
Expressoes Matematicas com o LaTeX
 
Análise de Redes Sociais
Análise de Redes SociaisAnálise de Redes Sociais
Análise de Redes Sociais
 

Similaire à Com red2011q1mirisola grafosaleatoriossmallworld (12)

Grafos
GrafosGrafos
Grafos
 
Grafos De Bruijn para identificação de variações genéticas usando GBS
Grafos De Bruijn para identificação de variações genéticas usando GBSGrafos De Bruijn para identificação de variações genéticas usando GBS
Grafos De Bruijn para identificação de variações genéticas usando GBS
 
Analise Comb E Probabilidades
Analise Comb E ProbabilidadesAnalise Comb E Probabilidades
Analise Comb E Probabilidades
 
Analise Comb E Probabilidades
Analise Comb E ProbabilidadesAnalise Comb E Probabilidades
Analise Comb E Probabilidades
 
Sequencias e series unicamp
Sequencias e series   unicampSequencias e series   unicamp
Sequencias e series unicamp
 
Sequencias e series
Sequencias e seriesSequencias e series
Sequencias e series
 
Velvet assembler
Velvet assemblerVelvet assembler
Velvet assembler
 
euclides primos
euclides primoseuclides primos
euclides primos
 
Equaçoes literais
Equaçoes literaisEquaçoes literais
Equaçoes literais
 
Introdução a Teoria dos Grafos
Introdução a Teoria dos GrafosIntrodução a Teoria dos Grafos
Introdução a Teoria dos Grafos
 
Redes neurais com matlab
Redes neurais com matlabRedes neurais com matlab
Redes neurais com matlab
 
Grafos
GrafosGrafos
Grafos
 

Com red2011q1mirisola grafosaleatoriossmallworld

  • 1. BC-0506: Comunicação e Redes BC- Grafos Aleatórios e Redes de Mundos Pequenos 1
  • 2. Índice de Assuntos Grafos Aleatórios: Erdös e Rényi Grafos Aleatórios: Conceitos Exemplos: propagação de boatos Seis graus de Separação Experimento de Milgran Outros exemplos Redes de Mundos Pequenos Conexões Fortes e Fracas Clusterização 2
  • 3. Parte 1: Grafos Aleatórios
  • 4. Conceitos Dado um Grafo não-orientado de n vértices, quantas arestas poderão existir no máximo? 2 5 3 4 5 Vértices 6 Arestas 1 Mais arestas: mais caminhos, distâncias menores, menor diametro, maiores graus 4
  • 5. Exemplo de Grafo com 5 vértices: número máximo de arestas: contamos 10 5 1 4 2 3 5
  • 6. Dedução do caso geral Cada vértice conectando-se com todos os demais diretamente: número de conexões do vértice = n-1 5 Número total de conexões = n x (n-1) Cada par de vértices 1 4 compartilha uma conexão. Logo: n. Arestas máx = n x (n-1)/2 2 3 6
  • 7. Dedução do caso geral Do exemplo de Grafo com n = 5 vértices: número máximo de arestas = 5 x (5-1)/2 = 10 5 1 4 2 3 7
  • 8. Dedução do caso geral Da mesma forma, se o Grafo tem apenas um componente conexo com n = 5 vértices: 5 número mínimo de arestas = n-1 1 4 Atenção: 2 3 Se está dito ou subentendido que todos os vértices estão no mesmo componente conexo. Não é necessário existirem arestas em um grafo 8
  • 9. Grafos aleatórios: O que são? Para que servem? 9
  • 10. Grafos aleatórios: Conceito: dado um Grafo de n vértices, iniciar a colocação de arestas entre pares de vértices de forma aletória, sem repetição. Formam-se sub-Grafos 5 1 4 2 3 10
  • 11. Grafos aleatórios: Conceito: dado um Grafo de n vértices, cada aresta pode existir ou não com probabilidade p. Quando a maioria dos vértices serão conectados em componente conexo? 5 Surgem propriedades interessantes 1 4 minimo (n-1) < num. arestas < n x (n-1)/2 p máximo 2 3 11
  • 12. Grafos aleatórios: À medida que inserimos arestas, se formam vários sub-Grafos disconexos. • Quando o número de conexões aumenta, estes sub-Grafos se conectam, formando componentes conexos cada vez maiores. Se o grau médio supera 1, um único super- componente conexo contém a maioria dos vértices. • A maioria dos vértices do Grafo poderá ser alcançado a partir de qualquer outro vértice, bastando seguir um conjunto de arestas [01]. 12
  • 13. Grafos aleatórios: Comportamento de transição de fase. Se <k> < 1: componentes desconectados com tamanho médio 1/(1-np) Se <k> > 1 : só pode haver um super- componente contendo a maioria dos vértices <k> = 1 : Transição de fase !! Comportamento muda rapidamente Nome vem da física estatística Analogia: transição de estados da matéria 13
  • 14. Grafos aleatórios: Intuição da prova: Suponha um subconjunto de vértices S. Considere as arestas que “saem” de S (conectam vértice em S a vértice fora de S) Tome uma delas, e inclua em S o vértice fora de S. Há menos uma aresta saindo de S. (aquela que foi explorada) Há mais arestas saindo de S (todas as outras incidindo no novo vértice) Quantas são? Na média, <k> 14
  • 15. Grafos aleatórios: Intuição da prova: Ou seja, para cada nova aresta explorada, incluimos um vértice em S, e o conjunto de arestas na fronteira aumenta em <k> e diminui em 1 Ou seja, muda em <k> - 1 Se <k> < 1, na média a mudanca é negativa: o numero de arestas a explorar vai cair Se <k> > 1, na média a mudança é positiva: haverão arestas a explorar até acabarem os vértices (ou pelo menos explorar a maioria dos vértices) 15
  • 16. Grafos aleatórios: Demo: transição de fase ao aumentar p Gif animada http://www.stanford.edu/~dgleich/demos/matlab/random_graphs/erdosreyni.html 16
  • 17. Grafos aleatórios: Podem existir 2 componentes gigantes? Se existirem 2 componentes gigantes, com N1 e N2 vértices, qual a probabilidade de uma aresta conectar os 2? A aresta tem que conectar um vertice em N1 (prob N/n) a um vértice em N2 (N2/n), ou vice-versa (conta 2x) Prob = 2N1N2/n2 Probabilidade de uma aresta NÂO conectar N1 e N2, então é 1 - 2N1N2/n2 17
  • 18. Grafos aleatórios: Podem existir 2 componentes gigantes? Probabilidade de uma aresta NÂO conectar N1 e N2, então é 1 - 2N1N2/n2 Existem no máximo (½)n(n-1) ~= ½ n2p arestas Portanto a probabilidade que nenhuma das arestas junte os 2 componentes é (pela definição da exponencial) Que tende a zero quando N1 e N2 aumentam ou crescem mais rápido do que n. (p=<k>/n) 18
  • 19. Grafos aleatórios: para que servem? Apesar dos Grafos serem uma simplificação elegante para facilitar o entendimento e desenvolver soluções para problemas, na prática, apresentam grandes desafios Apesar do Grafo poder representar as relações sociais, a Internet, e o metabolismo celular, as leis que regem a sua formação e inter-relacionamento são claramente diferentes Como desenvolver um modelo de Grafo para descrever sistemas tão diferentes e, ao mesmo tempo, descobrir propriedades compartilhadas? 19
  • 20. Grafos aleatórios Paul Erdös e Alfred Rényi (húngaros) propuseram então os Grafos aleatórios, sugerindo que, muitas redes complexas na Natureza poderiam seguir um padrão aleatório de formação A partir dos Grafos aleatórios, muitos fenômenos naturais e sociais passaram a ser estudados e analisados a partir deste modelo de referência Antes, eram estudados somente redes regulares Erdös escreveu mais de 1500 artigos em matemática até a sua morte em 1996, a maioria em co-autoria Sua produção só é superada por Euler Com Rényi, foram 8 artigos clássicos sobre Grafos 20
  • 21. Frases de Erdös Paul Erdös foi um itinerante a sua vida toda, não tendo nenhuma posse a não ser uma pequena mala Batia na porta de conhecidos do mundo inteiro e dizia: “A minha mente está aberta” Tinha um gosto especial pela probabilidade Dizia: “Deus se diverte jogando dados com o mundo” Seu colega Albert Einstein não concordava: “Deus não joga dados com o Universo” Afirmava também que não criamos a matemática, apenas a descobrimos Considerava que as verdades matemáticas eram as mais absolutas e eternas 21
  • 22. Exemplos: Propagação de boatos: Festa com 100 convidados Nem todos conhecem os outros convidados Grupos de 2 a 3 pessoas que se conhecem Todos conhecem pelo menos UMA pessoa de outros grupos. E sempre saem do grupo para contar novidades para seus amigos Se a cada 10 minutos eles contam as novidades para os amigos, quanto tempo leva em média para que uma nova informação chegue a todos os 99 convidados? 22
  • 23. Exemplos: Pior caso é a pessoa ter que transmitir a informação pessoalmente uma a uma: teríamos: 99 x 10 minutos: 16,5 horas Ou, se pensarmos nos grupos como vértices, supondo 50 grupos, transmitindo para os grupos um por um, 50 x 10 min = 500 min = 8,33 h Quanto tempo demora considerando que eles tem amigos fora do grupo? Como modelamos os amigos? 23
  • 24. Exemplos: aresta entre os grupos: alguem do grupo conhece alguem do outro grupo 1 troca em 10 min: a cada 10 min, a informação percorre cada aresta. Como sabemos quando a informação chegará a maioria dos vértices na média? 24
  • 25. Exemplos: aresta entre os grupos: alguem do grupo conhece alguem do outro grupo 1 troca em 10 min: a cada 10 min, a informação percorre cada aresta. Como sabemos quando a informação chegará a maioria dos vértices na média? Calculando a distância média no super componente do grafo aleatório. Que é pequena. 25
  • 26. Exemplos: Pior caso é a pessoa ter que transmitir a informação pessoalmente uma a uma: teríamos: 99 x 10 minutos: 16,5 horas Erdös e Rényi provam pelos Grafos aleatórios que bastam 30 minutos em média para que todos os 99 convidados fiquem sabendo da informação Diamêtro médio neste super componente é 3 26
  • 27. Uso de grafos aleatórios Estes mesmos modelos podem ser utilizados para estudar e modelar propagação de doenças, reações químicas, propagação de vírus na Internet, etc. Em redes com grande quantidade de vértices, um Grafo aleatório terá vértices com aproximadamente o mesmo número de arestas Medindo o grau de cada vértice do Grafo aleatório, e o resultado desenhado em um histograma, a distribuição de graus irá seguir a distribuição de Poisson Esse tipo de Grafo é conhecido também como Grafo aleatório de Poisson 27
  • 28. Uso de grafos aleatórios Distribuição de Poisson 28
  • 29. Geração de Grafos Aleatórios Um grafo aleatório é um grafo (rede) gerado por um processo aleatório Formação Iniciar com N vértices e nenhuma aresta Com probabilidade p, conectar 2 vértices selecionados aleatoriamente com uma aresta com p=0.2 29
  • 30. Parte 2: Seis Graus de Separação Imagem: http://en.wikipedia.org/wiki/File:Six_degrees_of_separation.svg
  • 31. Experimento de Milgram: Origens: escritor húngaro Karinthy escreve o conto “Cadeia” em 1929, onde o personagem tenta demonstrar que as pessoas estão muito mais próximas que se supõem A partir de no máximo cinco conhecidos, se poderia chegar a qualquer um dos meio Bilhão de pessoas da Terra (números da época) Em 1967, o professor de Harvard, Stanley Milgram realiza um experimento para determinar a “distância” entre duas pessoas quaisquer dos EUA Ele escolheu duas pessoas comuns como “alvo” e dois locais distintos e distantes como pontos de partida 31
  • 32. Experimento de Milgram: Nos pontos de partida, ele enviou a residentes aleatoriamente escolhidos, cartas para participarem de um estudo sociológico A carta continha informações sobre as pessoas “alvo” como nome, endereço e fotos, e as seguintes instruções: Acrescente o seu nome no fim da lista desta folha, para que o receptor saiba quem mandou Retire um dos cartões postais pré-pagos, preencha-o e envie para a Universidade de Harvard para podermos acompanhar o progresso do experimento 32
  • 33. Experimento de Milgram: Das 160 cartas preparadas, 42 retornaram Menor caminho = 2 conexões; Mais longo = 12 Valor médio = 5,5 surpreendentemente baixo Arredondando-se o 5,5 temos a famosa frase “6 graus de separação” 33
  • 34. Experimento de Milgram: A frase “6 Graus de Separação” não é de Milgram Criada pelo autor John Guare que escreveu uma peça teatral com este título para a Broadway em 1990, (filme em 1993) O experimento de Milgram sugere que qualquer pessoa do planeta, conectada com pelo menos UMA outra pessoa, faz parte de uma enorme rede de 6 bilhões de vértices, e que qualquer pessoa poderá ser alcançada a partir de poucas conexões Dessa concepção da sociedade humana deriva o conceito de Small World, ou Mundo Pequeno • Expressão “It's a small world” em inglês, e.g. quando encontramos conhecidos em comum 34
  • 35. Experimento de Milgram: Milgram restringiu a sua experiência aos EUA, sem considerar pessoas de outros países Experimentos posteriores mais amplos apresentaram um valor médio bem menor, de 3, para quaisquer pessoas dos EUA Em 2001, o professor Duncan Watts recria o experimento de Milgram utilizando e-mails: 48 mil remetentes de 157 países e 19 “Alvos” O valor médio de intermediários foi 6 E as redes não sociais? Teriam o mesmo grau de separação? 35
  • 36. Outros exemplos - Web Analisando-se o padrão de links das páginas da Web (www), para a quantidades de páginas da Web em 1998 (800 milhões de nós), foi estimado que qualquer documento da Web seria atingido com 19 cliques, sem utilizar nenhum site de busca Essa diferença de grau (de 6 para 19) surpreende principalmente se considerarmos que a maioria das redes naturais tem poucos graus de separação: redes de cadeia alimentar (2 graus), moléculas dentro de uma célula (3 reações químicas), redes de colaboração de cientistas (de 4 a 6 graus) Porque esta diferença tão grande? 36
  • 37. Outros exemplos A resposta a esta questão tem duas partes Redes de hiperlinks da Web são em grande parte redes circulares: se auto-referenciam, o que dificulta achar um link de “saída” do grupo de páginas • Sub-redes dedicadas a assuntos específicos Diferença no número de conexões por vértice Uma página da Web tem em média 10 links, enquanto que um ser humano tem em média de 200 a 5.000 pessoas conhecidas, segundo estimativa dos sociólogos Conhecido é diferente de amigo (Dunbar Number) 37
  • 38. Parte 3: Mundo Pequeno 38
  • 39. Efeito Mundo Pequeno O experimento de Milgram despertou a consciência de um mundo pequeno pois todas as pessoas do mundo estavam conectadas através de poucos links Ao mesmo tempo, os estudos teóricos dos Grafos Aleatórios criadas por Erdös e Rényi, proporcionavam ferramentas para analisar novas redes, principalmente as complexas e dinâmicas Uma das principais propriedades gerais das redes aleatórias, onde as informações (ou qualquer outra coisa) se propaga rapidamente por toda rede, é conhecida como “Efeito Mundo Pequeno” [01] 39
  • 40. Efeito Mundo Pequeno O efeito Mundo Pequeno foi estudado e verificado em numerosas e diferentes redes Seja dij a distância (menor caminho) entre os vértices i e j, e [n x (n-1)/2] o número total de arestas (máximo de todas combinações) do Grafo Definindo l como a distância média entre todos os pares de vértices de um Grafo não-direcionado, temos [02]: 40
  • 41. Efeito Mundo Pequeno Se o número de vértices a uma distância <= r de um vértice central cresce exponencialmente com r, então o valor de l crescerá de acordo com log n Ocorre com várias redes, inclusive grafos aleatórios Rede é considerada como tendo o “efeito mundo pequeno” (small world effect) se: (1) l escala O(log n) com o tamanho da rede O(log n) – logaritmo ou menor Fácil de medir (distância média) (2) alto índice de clusterização 41
  • 42. Efeito Mundo Pequeno Já foi demonstrado que em redes que seguem uma lei de potência o valor de l cresce no máximo a log n / log log n Algumas redes com lei de potência também são small-world Sabemos medir a condição (1) Vocês já implementaram o algoritmo Não considere vértices não conectados O que é índice de clusterização? Problema:área nova -> várias definições similares mas diferentes 42
  • 43. Clusterização Como observamos, muitas redes reais não seguem o modelo dos Grafos Aleatórios criadas por Erdös e Rényi, pois ele pressupõe uma distribuição uniforme de vértices e arestas Nos anos 90, Duncan Watts e Steven Strogatz propõem um aprimoramento no modelo “Mundo Pequeno” com a introdução do conceito de “clusterização” e um “coeficiente de clusterização” para medir o seu efeito clusterização = clustering = agrupamento 43
  • 44. Coeficiente de Clusterização Global O Coeficiente de clusterização global é: 3 x número de triângulos na rede C= número de triplas de vértices conectados C pode ser entendido como a probabilidade média de que dois vértices que são vizinhos de um mesmo outro vértice, também serão vizinhos Tripla: um nó com 2 arestas para 2 outros nós Não é combinação(n,3) Fator 3: em um triângulo há 3 triplas 44
  • 45. Coeficiente de Clusterização Global Clusterização é frequentemente também chamada de transitividade Se A conhece B e B conhece C então A conhece C Nesse caso, um triângulo entre eles é formado C varia de 0 a 1 C = 0 quando não há nenhuma transitividade C = 1 quando todos estão conectados a todos, indicando que existem triângulos entre todos os conjuntos de 3 vértices 45
  • 46. Coeficiente de Clusterização O grafo abaixo possui C = 3/8 = 0.375 (global) 1 triangulo 8 triplas: 6 centradas no nó central 1 centrada em cada um dos outros nós do triangulo 46
  • 47. Coeficiente de Clusterização Local Médio Média do coeficiente de clusterização local Ci para cada vértice i. Ci = # arestas entre os vizinhos de vi / # possível de arestas entre os vizinhos de vi. Com k vizinhos, são possíveis k(k-1)/2 arestas Quantas arestas existem entre vizinhos: conte. Ou... 47
  • 48. Coeficiente de Clusterização Local Médio Média do coeficiente de clusterização local Ci para cada vértice i. Ci = # arestas entre os vizinhos de vi / # possível de arestas entre os vizinhos de vi. Quantas arestas existem entre vizinhos: Calcule o num. de caminhos de comprimento 3 que começam e terminam no vértice i. A diagonal de A3 é 2x esse número! A3=AAA (A é a matriz de adjacências) (fácil no MATLAB/Scilab) 48
  • 49. Coeficiente de Clusterização Local Médio Coef. de clusterização local 2 vértices à esq do triang: 1 Vértice central (4 vizinhos, 1 aresta): 1/(4(4-1)/2) = 1/6 2 vértices isolados Alguns consideram 0, outros indefinido Não acontece em alguns problemas Média: (1+1+1/6)/3=0.72 ou (1+1+1/6+0+0)/5=0.43 Depende da definição 49
  • 50. Coeficiente de Clusterização Local Médio Foi proposto primeiro, mas tem um problema: Suponha: um nó com 2 vizinhos, conectados → C = 1 um nó com 100 vizinhos, desconectados → C=0 Média dos dois nós: 0.5 Mas não temos metade dos vizinhos conectados! Problema com a fórmula: k(k-1) no denominador Mais peso para nós de grau pequeno Útil para estimar conectividade local Coef. Clust. Global melhor para descrever o grafo todo 50
  • 51. Efeito da Clusterização A figura a mostra um esquema de conexões uniformes, com todos os vértices conectados com os vizinhos mais próximos A figura b mostra uma situação onde algumas conexões aleatórias que atravessam o Grafo [02] 51
  • 52. Clusterização Estas conexões possuem um grande efeito na distância média do Grafo Suponha, por exemplo, uma única conexão que atravesse o Grafo pelo meio Qualquer propagação teria a sua distância a percorrer reduzida pela metade 52
  • 53. Clusterização Quão grande precisa ser o índice de clusterização para a rede ser mundo pequeno? Strogatz: “mundo pequeno” se C >> Crg Crg: coef. de clusterização para grafo aleatório com mesmo n e #arestas Qual é o coeficiente de clusterização para um grafo aleatorio Gn,p ? É fácil... 53
  • 54. Clusterização Grafo aleatório (random graph): p é a probabilidade de 2 vértices estarem conectados p/ qualquer par de vértices. Portanto para qualquer par de vértices conectados a um 3º vertice, a probabilidade deste par estar conectado é p. Portanto Crg = p = <k>/n 54
  • 55. Efeito Mundo Pequeno Tabela: l p/ diversos tipos de rede α : expoente se a distribuição segue lei de potência [02] Repare como distâncias médias são pequenas Tipo rede Rede Tipo Vértices Arestas l α Social Atores de filmes não direcional 449.913 25.516.482 3,48 2,3 Social Co-autoria de artigos Física não direcional 52.909 245.300 6,19 - Social Ligações telefônicas não direcional 47.000.000 80.000.000 2,1 Social Mensagens e-mail direcional 59.915 86.300 4,95 1,5 a 2,0 Informação Páginas www direcional 203.549.046 2.130.000.000 16,18 2,1 a 2,7 Informação Redes de citações direcional 783.339 6.716.198 3,0 Tecnológico Distribuição elétrica não direcional 4.941 6.594 18,99 - Tecnológico Rotas de trens não direcional 587 19.603 2,16 - Biológico Rede metabólica não direcional 765 3.686 2,56 2,2 Biológico Cadeia alimentar marinha direcional 135 598 2,05 - Biológico Redes Neurais direcional 307 2.359 3,95 - 55
  • 56. Efeito Mundo Pequeno Repare no coeficiente de clusterização (z=<k>) 56
  • 57. Geração de Redes Small World Uma rede small-world é um tipo de grafo onde a maioria dos vértices não é vizinho dos outros vértices, mas onde a maioria dos vértices pode ser alcançada de qualquer outro vértice através de um número pequeno de arestas Formação Iniciar com um anel (lattice) de N vértices com arestas entre os seus n mais próximos vizinhos Cada aresta deve ser religada a outro vértice com probabilidade p 57
  • 58. Geração de Redes Small World 58
  • 59. Geração de Rede Small World Parte de rede regular – cada nó se conecta com alguns vizinhos Cada aresta é reconectada a um vértice distance com probabilidade p Se p=1, temos um grafo aleatório 59
  • 60. Modelo de Rede Small World Se p aumenta, o coef. de clusterização (C) e o diâmetro (L) diminuem. 60
  • 61. Modelo de Rede Small World Mas L diminui muito antes de C Região com C grande e L pequeno = Small World Conectado só a vizinhos Mas perto de todos Sem ser aleatório E com C alto Vizinhos conectados entre si 61
  • 62. Modelo de Rede Small World Este modelo simples não é realista para todos os problemas small world Mas foi importante para demonstrar as propriedades básicas e a importância das ferramentas estatísticas Particularmente bom para estudo de epidemias em plantas: – Plantas doentes infectam as plantas vizinhas – Às vezes pássaros levam polen infectado 62
  • 63. Conexões fortes e fracas Em 1973, Mark Granovetter de Harvard publica o artigo The Strength of Weak Ties, no American Journal of Sociology Trata-se de um estudo que o autor realizou durante a graduação sobre a busca de emprego Ao pesquisar sobre os fatores que influenciavam na busca de um emprego, principalmente nas redes de contato, ele realizou dezenas de entrevistas com gerentes e profissionais sobre quem tinha indicado ou ajudado a encontrar o emprego As repostas que mais encontrou não foi “um amigo”, mas “um conhecido” 63
  • 64. Conexões fortes e fracas No artigo, ele propõe que, na procura de emprego, abrir um restaurante, ou espalhar uma notícia relevante, as nossas conexões sociais mais fracas (conhecidos) são mais importantes que as nossas ligações com os nossos estimados amigos As ligações fortes (amigos) fecham sobre si mesmas, reduzindo as oportunidades São as ligações fracas (ou de conhecidos) que possibilitam que a rede de contatos se expanda e amplie as oportunidades 64
  • 65. Conexões fortes e fracas O artigo original de Mark Granovetter foi rejeitado na sua primeira tentativa de publicação, e só foi publicado 4 anos depois Hoje, este artigo é reconhecido como um dos artigos mais influentes da sociologia de todos os tempos, e um dos mais citados também 65
  • 66. Colaboração e Número de Erdös Paul Erdös não colaborou somente como teórico na área de Grafos Como um dos matemáticos mais produtivos de todos os tempos, produziu mais de 1500 artigos com 507 co-autores Esta produção bem documentada, possibilitou um outro estudo sobre redes de colaboração 66
  • 67. Colaboração e Número de Erdös O número de Erdös é um número que foi criado para medir a distância entre Erdös e uma pessoa • O próprio Erdös tem o número de Erdös Zero Aqueles que escreveram um artigo em co-autoria com Erdös receberam o número Erdös de 1 Aqueles que escreveram um artigo em co-autoria com alguém com o número Erdös 1, receberam o número Erdös 2, e assim por diante 67
  • 68. Colaboração e Número de Erdös O estudo da rede de colaboração criada em torno de Erdös mostrou que, em 1998, existia uma rede fortemente entrelaçada de 70.975 matemáticos, conectados através de mais de 200 mil artigos em co-autoria [02] Se os matemáticos escolhessem os colaboradores de forma aleatória, o coeficiente de clusterização desta rede de colaboração, seria extremamente pequena, cerca de 10-5 68
  • 69. Colaboração e Número de Erdös Entretanto, as medidas reais mostraram um coeficiente de clusterização 10.000 vezes maior, indicando que os matemáticos não escolhem as suas colaborações de forma aleatória, e mais que tudo, formam uma rede altamente clusterizada 69
  • 70. Coeficiente de Clusterização Rede Coeficiente de Clusterização Web 0.081 Flickr 0.313 LiveJournal 0.330 Orkut 0.171 YouTube 0.136 Fonte: Measurement and analysis of online social networks, IMC 2007. 70
  • 71. Referências [01] Barabasi, A.L., Linked: How Everything Is Connected to Everything Else and What It Means for Business, Science and Everyday Life, Plume, 2003. [02] Newman, M., The Structure and Function of Complex Networks, Siam Review, Vol. 45, No 2, pp.167–256, 2003. Aulas Bruno Gonçalves http://www.bgoncalves.com/teaching/spring-2011- i690.html 72