1. Cap´
ıtulo 3
Modelos Discretos
3.1 Vari´veis Aleat´rias Discretas
a o
3.1.1 Vari´vel Aleat´ria
a o
Considere um experimento com espa¸o amostral Ω. Uma fun¸˜o definida no
c ca
espa¸o Ω ´ uma vari´vel aleat´ria. Em outras palavras, imagine que s ∈ Ω seja
c e a o
um evento simples (um resultado em um expermento aleat´rio), uma vari´vel
o a
aleat´ria X ´ uma fun¸ao que atribui um valor X(s) a este evento simples. Os
o e c˜
valores que X assume podem ser tanto discretos quanto cont´ ınuos, implicando
em vari´veis, respectivamente discretas ou cont´
a ınuas. Neste cap´ ıtulo apenas nos
preocuparemos com o caso discreto.
Exemplo. Arremesso de uma Moeda Dez Vezes. Considere um experi-
mento no qual arremessamos uma moeda dez vezes. O espa¸o amostral Ω deste
c
experimento consiste em 210 = 1024 pontos (por exemplo, HHHHHHHHHH,
HTHTHTHTHT, etc.... Lembrando que H=Cara e T=Coroa). Uma poss´ ıvel
vari´vel aleat´ria seria o n´ mero de caras NH assim se s = HHHHT HT T T T ,
a o u
ent˜o NH (s) = 5. Note que a fun¸ao NH toma apenas valores discretos (por
a c˜
exemplo, 0, 1, 2, ...).
3.1.2 Fun¸˜o discreta de probabilidade
ca
Lembremos que um modelo probabil´ ıstico ´ determinado pela terna Ω, F, P ,
e
onde Ω ´ espa¸o amostral que representa o conjunto de poss´
e c ıveis resultados para
um experimento aleat´rio, F ´ a σ-´lgebra que representa todos os poss´
o e a ıveis
eventos compostos e P ´ a medida de probabilidade que atribui um valor entre
e
0 e 1 para cada evento, representado a chance de ocorrˆncia deste particular
e
evento. A defini¸ao da medida de probabilidade sobre o espa¸o amostral e,
c˜ c
por conseq¨ˆncia, sobre todos os eventos compostos (por que?)1 permite que
ue
1 Revise a defini¸ao a σ-´lgebra. D´ para ver que todos eventos compostos s˜o combina¸oes
c˜ a a a c˜
de pontos do espa¸o amostral. Se vocˆ souber o valor das probabilidades para todos eventos
c e
simples, vocˆ tamb´m saber´, pela simples aplica¸ao das propriedades da probabildiade, seu
e e a c˜
27
2. 28 CAP´
ITULO 3. MODELOS DISCRETOS
calculemos a fun¸ao discreta de probabilidade para qualquer vari´vel aleat´ria
c˜ a o
X.
Assim P (X = x) = P ({s : X(s) = x}). Em palavras, a probabilidade da
vari´vel aleat´ria X possuir valor x ´ a probabilidade do evento composto de-
a o e
scrito por {s : X(s) = x}, ou seja, ´ a probabilidade dos pontos do espa¸o
e c
amostral s nos quais a fun¸ao X(s), que define a vari´vel aleat´ria, tem valor
c˜ a o
x. Para economizar s´ ımbolos utilizaremos tamb´m P (x) significando a mesma
e
coisa (note que estamos reservando letras ma´ ıusculas para representar vari´veis
a
aleat´rias).
o
Exemplo. Arremesso de uma Moeda Dez Vezes. Retornamos para o ex-
emplo do experimento de arremesso de moeda dez vezes. Qual ´ a fun¸ao de
e c˜
probabilidade para o n´ mero de Caras em uma execu¸ao do experimento? Os
u c˜
eventos de interesse s˜o, porntanto, da forma {s : NH (s) = n}. Supondo que
a
utilizamos uma moeda honesta e que os arremessos s˜o independentes, temos
a
que cada ponto do espa¸o amostral tem probabildidade de 1/210 . Podemos
c
usar an´lise combinat´ria para contarmos quantos pontos do espa¸o amostral
a o c
correspondem a cada evento de interesse. Dado n, temos que escolher, n˜o a
importando a ordem, n entre dez posi¸oes na seq¨ˆncia de arremessos para in-
c˜ ue
serirmos Caras. Isso equivale a combina¸oes de 10 elementos n a n, ou seja
c˜
2
:
10 1
P (n) =
n 210
para n = 0, 1, 2, 3, 4....
3.1.3 Distribui¸˜es de Probabilidade
co
A rigor, uma distribui¸ao de probabilidades ´ uma fun¸ao crescente definida
c˜ e c˜
como F (x) = P (X ≤ x) para −∞ < x < ∞. Para o caso discreto utilizaremos
o mesmo termo para se referir tamb´m ` fun¸ao discreta de probabilidade.
e a c˜
Quando falarmos de vari´veis aleat´rias cont´
a o ınuas ficar´ mais clara a necessidade
a
da no¸ao de distribui¸ao de probabilidade.
c˜ c˜
Os modelos probabil´ısticos discretos s˜o comumente definidos em termos de
a
distribui¸oes de probabilidade (aqui j´ estamos nos referindo `s fun¸oes discre-
c˜ a a c˜
tas de probabilidade), nas pr´ximas se¸oes introduziremos v´rios deles e suas
o c˜ a
aplica¸oes.
c˜
3.2 Modelo Uniforme
Suponha que desejamos descrever o simples experimento de lan¸amento de um
c
dado honesto. A vari´vel aleat´ria de interesse ´ simplesmente o resultado do
a o e
arremesso que chamaremos de X. Qual a distribui¸ao de probabilidade apropri-
c˜
ada para descrever este experiemnto? O espa¸o amostral ´ Ω = {1, 2, 3, 4, 5, 6},
c e
valor para qualquer evento composto.
2 Se n˜o lembra an´lise combinat´ria, recomendo fortemente, Iezzi, G. Matem´tica Ele-
a a o a
mentar, Vol. 5 - Combinat´ria.
o
3. ´
3.3. MODELO GEOMETRICO 29
0.05
0.04
0.03
P(x)
0.02
0.01
0
−5 0 5
x
Figura 3.1: Fun¸ao de probabilidade uniforme discreta.
c˜
como o dado ´ honesto temos que P (x) = 1/6, ou seja, a fun¸ao de probabili-
e c˜
dade independe do particular resultado. Este tipo de distribui¸ao ´ denominada
c˜ e
distribui¸ao uniforme discreta.
c˜
Distribui¸˜o Uniforme Discreta.
ca
1
P (xj ) = , (3.1)
n
onde xj ´ n˜o nulo em {x1 , x2 , ..., xn }.
e a
´
Exemplo.N´mero de Caras em Unico Arremesso de uma Moeda Honesta.
u
Neste experimento o espa¸o amostral ´ Ω = {H, T }. A vari´vel aleat´ria que
c e a o
descreve o n´ mero de Caras em um unico arremesso ´ NH (H) = 1 e NH (T ) = 0.
u ´ e
Como a moeda ´ honesta a distribui¸ao de probabilidades ´ P (xj ) = 1/2 com
e c˜ e
xj n˜o nulo em {0, 1}.
a
3.3 Modelo Geom´trico
e
Digamos que vocˆ seja respons´vel pelos planos de manuten¸ao de dos novos
e a c˜
avi˜es da Embraer com sistema de aterrisagem totalmente autom´tico. Vocˆ
o a e
fez alguns testes de laborat´rio e concluiu que com o tempo a probabilidade
o
de falha do sistema tende a p. Se assumirmos que o avi˜o voar´ uma vez por
a a
dia, qual seria a distribui¸ao do intervalo de tempo transcorrido at´ a primeira
c˜ e
falha? A cada utiliza¸ao h´ duas possibilidades que chamaremos de 1 (funciona-
c˜ a
mento normal) e 0 (falha). Em princ´ ıpio, nosso experimento somente precisa
ser repetido at´ que a primeira falha aconte¸a, assim o espa¸o amostral con-
e c c
tem sequencias do tipo “0”, “10”, “110”. Podemos identificar estas seq¨ encias
u
pela posi¸ao da primeira falha, assim Ω = {1, 2, 3, 4, ...}. Note que este espa¸o
c˜ c
4. 30 CAP´
ITULO 3. MODELOS DISCRETOS
0.01
0.008
0.006
P(n)
0.004
0.002
0
100 200 300 400 500
n
Figura 3.2: Fun¸ao de probabilidade geom´trica com p = 0, 01.
c˜ e
amostral tem infinitos pontos, visto que h´ a possibilidade, infinitamente im-
a
prov´vel, de que uma falha nunca ocorra. Probabilidades podem ser atribu´
a ıdas
a cada seq¨ˆncia da seguinte forma: a cada utiliza¸ao do sistema a probabili-
ue c˜
dade de uma falha ´ p e a de funcionamento ´ 1 − p, assim, a probabilidade a
e e
ser atribu´ ao ponto do espa¸o amostral n ´ P (n) = (1 − p)n−1 p (por que?)3 ,
ıda c e
que ´ chamada distribui¸ao geom´trica.
e c˜ e
Distribui¸˜o geom´trica.
ca e
P (n) = (1 − p)n−1 p, (3.2)
onde n = 1, 2, 3, ....
3.4 Modelo Binomial
Suponha agora que queremos avaliar a probabilidade de em n lan¸amentos de
c
uma moeda obtermos, n˜o importando a ordem, k Caras. O espa¸o amostral
a c
´ composto por todas as seq¨ˆncias poss´
e ue ıveis de comprimento n (por exemplo,
se n = 4, Ω = {HHHH, HT HT, T T HH, ...}. Suponhamos que a probabilidade
de obtermos uma Cara em um lan¸amento seja q (a moeda n˜o precisa neces-
c a
sariamente ser honesta). Considerado os lan¸amentos independentes, podemos
c
atribuir probabilidades para cada ponto do espa¸o amostral apenas contando o
c
n´ mero de Caras e Coroas. Procedendo dessa forma encontramos: q k (1 − q)n−k .
u
Como a ordem n˜o importa temos que utilizar an´lise combinat´ria para con-
a a o
3 P (n) significa a probabilidade da primeira falha ocorrer na n-´sima utiliza¸ao, ou seja,
e c˜
primeiro ocorrem n − 1 funcionamentos normais at´ que a seq¨ˆncia ´ encerrada com uma
e ue e
falha.
5. 3.4. MODELO BINOMIAL 31
0.25
0.2
0.15
P(n)
0.1
0.05
0
0 5 10 15 20
n
Figura 3.3: Distribui¸ao Binomial com q = 0, 5, n = 10 (tracejado) e n = 20.
c˜
Note a simetria e a posi¸ao da m´dia em p × n.
c˜ e
tarmos o n´ mero de seq¨ˆncias equivalentes (com o mesmo n´ mero de Caras,
u ue u
s´ que em outra ordem). No final obtemos:
o
Distribui¸˜o Binomial.
ca
n
P (k|n, p) = q k (1 − q)n−k (3.3)
k
para k = 0, 1, 2, 3, 4....
Qualquer evento independente cujo resultado possa ser classificado de apenas
duas maneiras (erro ou acerto, sucesso ou falha, etc...) ´ denominado tentativa
e
de Bernoulli. A distribui¸ao do n´ mero k de ocorrˆncias de uma das duas
c˜ u e
maneiras com probabilidade q em uma seq¨ˆncia de n tentativas de Bernoulli ´
ue e
Binomial P (k|n, p).
Exemplo. Fornecimento de Energia. Suponha que n = 10 trabalhadores
est˜o utilizando energia el´trica de forma intermitente. Estamos interessados em
a e
estimar a demanda total esperada. Como uma primeira aproxima¸ao imagine c˜
que a qualquer momento cada trabalhador tem exatamente a mesma probabili-
dade p de requerer uma unidade de potˆncia. Se considerarmos que os trabal-
e
hadores atuam de forma independente teremos que a probabilidade de k deles
demandarem energia simultaneamente ser´ binomial P (k|n, p). Se, em m´dia,
a e
um trabalhador utilizar energia 12 minutos por hora teremos que p = 1/5.
Assim, a probabilidade de sete ou mais trabalhadores demandarem energia si-
multˆneamente ser´ P (7|10; 0, 2) + P (8|10; 0, 2) + P (9|10; 0, 2) + P (10|10; 0, 2) =
a a
0, 000864. Em outras palavras, se a potˆncia fornecida for suficiente para co-
e
brir 6 trabalhadores simultaneamenente, haver´ sobrecarga com probabilidade
a
0, 08%, ou seja em 1 minuto em 1157, ou ainda 1 minuto em 24 horas.
Exemplo. Teste de Efic´cia de Medicamentos. A taxa normal de infec¸ao
a c˜
6. 32 CAP´
ITULO 3. MODELOS DISCRETOS
0.35
0.3
0.25
0.2
P(n) 0.15
0.1
0.05
0
0 5 10 15 20
n
Figura 3.4: Distribui¸ao Binomial com n = 10, q = 0, 5 (tracejado) e q = 0, 1.
c˜
Note a assimetria do caso q = 0, 1.
de determinada doen¸a ´ de 25%. Para testar um novo medicamento, o admin-
c e
istramos a n indiv´
ıduos. Como poder´ ıamos avaliar o resultado do experimento?
Se o medicamento for totalmente in´ til a probabilidade de exatamente k in-
u
div´ıduos permanecerem livres de infec¸ao ser´ P (k|n; 0, 75). Por exemplo, para
c˜ a
k = n = 10, a probabilidade ´ de 5, 6%. Para k = n = 12, a probabilidade ´
e e
de 3, 2%. Assim, isso n˜o seja uma demonstra¸ao conclusiva, se de 10 ou 12 in-
a c˜
div´ıduos nenhum contrair a infec¸ao isso poderia ser visto como uma indica¸ao
c˜ c˜
de que o medicamento fez efeito.
3.5 Modelo Poisson
Tomemos novamente a distribui¸ao binomial. Imaginemos que estamos interes-
c˜
sados em um fenˆmeno que acontece raramente com probabilidade q = λ/n,
o
onde λ ´ o n´ mero de ocorrˆncias em um n´ mero muito grande n → ∞
e u e u
de repeti¸oes. Reexaminemos a express˜o para a distribui¸ao binomial neste
c˜ a c˜
regime:
k n−k
n λ λ
lim P (k|n, q = λ/n) = lim 1−
n→∞ n→∞ k n n
k n−k
n! λ λ
= lim 1−
n→∞ (n − k)!k! n n
n
n n − 1 n − k + 1 λk
−k
λ λ
= lim ... 1− 1−
n→∞ n n n k! n n
λk −λ
= e
k!
7. 3.5. MODELO POISSON 33
0.2
0.15
P(k|λ)
0.1
0.05
0
0 5 10 15 20
k
Figura 3.5: Distribui¸ao de Poisson com λ = 5 (tracejado) e λ = 10.
c˜
Distribui¸˜o de Poisson.
ca
λk −λ
P (k|λ) = e . (3.4)
k!
Exemplo.Anivers´rios. Qual ´ achance que em um grupo de 500 pessoas 2
a e
fa¸am anivers´rio no dia 7 de setembro. Se as 500 pessoas forem escolhidas ao
c a
acaso podemos imaginar 500 tentativas de Bernoulli cada uma com probabili-
dade q = 1/365. Pela defini¸ao λ = nq = 500/365 = 1, 3699... A probabilidade
c˜
que k pessoas fa¸am anivers´rio exatamente no dia 7 de Setembro (ou em qual-
c a
quer dia escolhido) ´ P (k|1, 3699). Por exemplo, se k = 2, P (2|1, 3699) = 0, 24.
e
Exemplo.Centen´rios. Ao nascer qualquer pessoa tem uma pequena chance
a
de chegar aos 100 anos. Em uma comunidade grande o n´ mero de nascimentos
u
em um ano ´ grande. Devido a guerras, doen¸as, etc... as dura¸oes das vidas
e c c˜
de uma mesma gera¸ao n˜o s˜o independentes. No entanto, podemos comparar
c˜ a a
n nascimentos a n tentativas de Bernoulli com a vida ap´s os 100 anos como
o
sucesso. Assim a probabilidade de k pessoas chegarem a 100 anos ´ P (k|λ), com
e
λ dependendo do tamanho da popula¸ao e das condi¸oes de sa´ de.
c˜ c˜ u
3.5.1 Distribui¸˜o de Poisson no tempo
ca
Considere agora uma seq¨ˆncia de eventos aleat´rios ocorrendo no tempo, tais
ue o
como desintegra¸ao radioativa ou acessos a um web server. Suponha que os
c˜
pontos sejam distribuidos em uma linha do tempo e que estejamos preocupados
com sua distribui¸ao (n´ mero de pontos em um intervalo de tempo definido).
c˜ u
Suponha adicionalmente que:
1. As condi¸oes do experimento permanecem constantes com o tempo;
c˜
8. 34 CAP´
ITULO 3. MODELOS DISCRETOS
2. Intervalos de tempo que n˜o se intersectam s˜o estatisticamente indepen-
a a
dentes;
Quando estudarmos vari´veis aleat´rias no cont´
a o ınuo poderemos tratar este caso
diretamente, por hora utilizaremos a id´ia de limite. Come¸amos por dividir
e c
uma unidade de tempo em um n´ mero grande de intervalos n cada um com
u
dura¸ao 1/n. Cada intervalo ou est´ vazio (falha) ou cont´m no m´
c˜ a e ınimo um
ponto (sucesso). A probabilidade de sucesso pn ´ a mesma para qualquer um
e
dos intervalos. A distribui¸ao de probabilidade de k sucessos em n intervalos ´,
c˜ e
portanto, binomial P (k|n, pn ). Note que o n´ mero de sucessos n˜o ´ o mesmo
u a e
que o n´ mero de pontos em um dado intervalo, visto que um sucesso pode
u
representar mais de um ponto em um intervalo. Suponhamos ent˜o adicional-
a
mente que a probabilidade de dois pontos ou mais ocuparem o mesmo intervalo
de tempo seja desprez´ conforme n → ∞. Se fixarmos o n´ mero m´dio de
ıvel u e
sucessos por unidade de tempo como λ = npn teremos que a probabilidade de k
sucessos em uma unidade de tempo ter´ distribui¸ao de Poisson P (k|λ). Nesta
a c˜
categoria se encaixam: n´ mero de carros passando por um ped´gio por unidade
u a
de tempo; n´ mero de erros de digita¸ao em uma p´gina; n´mero de chamadas
u c˜ a u
em um callcenter por unidade de tempo; etc...
3.6 Modelo Hipergeom´trico
e
Suponha que em uma caixa h´ n bolas, n1 vermelhas e n2 = n − n1 pretas.
a
Retiramos da caixa r elementos sem reposi¸ao. Qual ´ a probabilidade de que
c˜ e
exatamente k deles sejam bolas vermelhas? O n´ mero total de maneiras de
u
n
escolhermos r elementos dentre n ´e . Notemos que o grupo escolhido
r
tem k bolas vermelhas e r − k bolas pretas. As k bolas vermelhas podem ser
n1
escolhidas de formas. As r − k bolas pretas podem ser escolhidas de
k
n − n1
formas. Para cada escolha de bolas vermelhas pode-se escolher
r−k
uma das formas equivalentes de escolha das bolas pretas, assim multiplicamos
as quantidades. Finalmente obtemos:
Distribui¸˜o Hipergeom´trica:
ca e
n1 n − n1
k r−k
P (k|n, n1 , r) = . (3.5)
n
r
com k = 0, 1, ..., min(r, n1 ).
Exemplo. Controle de Qualidade. Uma f´brica produz pe¸as que s˜o em-
a c a
baladas em caixas com 25 unidades. Para aceitar o lote enviado por essa f´brica,
a
o controle de qualidade de uma empresa procede da seguinte forma. Sorteia uma
caixa do lote e, em seguida, sorteia cinco pe¸as, sem reposi¸ao, dessa mesma
c c˜
9. 3.7. MODELO BINOMIAL NEGATIVO 35
0.35
0.3
0.25
P(k|n,n1,r)
0.2
0.15
0.1
0.05
0
0 2 4 6 8 10
k
Figura 3.6: Distribui¸ao Hipergeom´trica com n = 30, n1 = 10 e r = 10.
c˜ e
caixa. Se constatar no m´ximo duas defeituosas (k ≤ 2), aceita o lote fornecido
a
pela f´brica. Se a caixa sorteada tivesse 4 pe¸as defeituosas, qual seria a prob-
a c
abilidade de rejeitar o lote? A caixa pode ter pe¸as boas (bolas pretas) ou
c
defeituosas (bolas vermelhas). O n´ mero total de pe¸as ´ n = 25, vamos sortear
u c e
r = 5 e queremos saber a probabilidade do n´ mero de defeituosas n1 = 4 sendo
u
que obtivemos k ≤ 2 pe¸as defeituosas em nosso sorteio. Assim calculamos :
c
4 21 4 21 4 21
0 5 1 4 2 3
P (k ≤ 2|n, n1 , r) = + + = 0, 984.
25 25 25
5 5 5
Assim, a probabilidade de rejeitar o lote (k > 2) quando houver 4 pe¸as
c
defeituosas em 25 na caixa sorteada ser´ de 0, 016 (1, 6%).
a
3.7 Modelo Binomial Negativo
Considere uma seq¨ˆncia de n tentativas de Bernoulli. Quantas tentativas s˜o
ue a
necess´rias para conseguirmos r sucessos? A probabilidade de que r sucessos
a
ocorram ap´s r + k tentativas ´ idˆntica ` probabilidade de que k fracassos
o e e a
antecedam o r-´simo sucesso. Assim teremos uma seq¨ encia com r + k − 1
e u
tentativas com k fracassos posicionados arbitrariamente seguida por um sucesso.
A distribui¸ao de probabilidade do evento “k fracassos antes do r-´simo acerto”´
c˜ e e
a distribui¸ao binomial negativa denotada:
c˜
Distribui¸˜o Binomial Negativa.
ca
r+k−1
P (k|r, p) = pr (1 − p)k . (3.6)
k
10. 36 CAP´
ITULO 3. MODELOS DISCRETOS
0.08
0.07
0.06
0.05
ur
0.04
0.03
0.02
0.01
0
0 10 20 30 40 50
Numero de fosforos no outro bolso (r)
Figura 3.7: Caixa de F´sforos de Banach. Distribui¸ao de f´sforos na caixa que
o c˜ o
ainda n˜o est´ vazia. Cada caixa no come¸o tem exatos 50 f´sforos. Quando
a a c o
aquela que foi sorteada (bolso esquerdo ou bolso direito) se esvazia h´ exatos r
a
f´sforos na outra caixa. Note que o mais prov´vel ´ que haja poucos f´sforos
o a e o
tamb´m na outra caixa. A probabilidade de haver at´ 15 f´sforos no outro bolso
e e o
´ de 92% (como calculo isso?)
e
para k = 0, 1, 2, 3, 4....
Exemplo. Caixa de F´sforos de Banach. Um matem´tico sempre carrega
o a
consigo uma caixa de f´sforos em seu bolso direito e uma em seu bolso esquerdo.
o
Quando ele quer um f´sforo, ele escolhe um bolso ao acaso. A seq¨ˆncia de bol-
o ue
sos ´, portanto, uma seq¨ˆncia de tentativas de Bernoulli com p = 1/2. Suponha
e ue
que cada caixa inicialmente contenha N f´sforos e considere o momento no qual
o
nosso matem´tico descobre que uma das caixas est´ vazia. Neste mesmo mo-
a a
mento a outra caixa cont´m 0, 1, 2, ..., N f´sforos com probabilidade ur . Qual ´
e o e
essa probabilidade? Digamos que “sucesso”signifique escolher o bolso esquerdo.
O bolso esquerdo estar´ vazio no momento em que o bolso direito contiver ex-
a
atamente r f´sforos se, e somente se, exatametne N − r falhas (bolso direito)
o
precederem o sucesso de n´ mero N + 1. A probabilidade disso acontecer ser´
u a
P (N − r|N + 1, 1/2). A mesma coisa vale para o outro bolso assim:
2N − r
ur = 2P (N − r|N + 1, 1/2) = 2−2N +r .
N
3.8 Modelo Multinomial
A distribui¸ao binomial pode ser generalizada para o caso de n tentativas inde-
c˜
pendentes onde cada tentativa pode resultar em r diferentes resultados. Cada
resultado Ei ocorre com probabilidade pi . Assim p1 + p2 + ... + pr = 1. A
11. ¸˜
3.9. DISTRIBUICAO DE ZIPF 37
8
10
Linux reuse data
SunOS reuse data
10
7 Mac OS X reuse data
6
10
5
10
Number of uses
4
10
3
10
2
10
1
10
0
10
0 1 2 3 4 5 6 7 8
10 10 10 10 10 10 10 10 10
Subroutines ordered by use frequency (n)
Figura 3.8: Distribui¸ao de Zipf para reutiliza¸ao de c´digo nos sistemas Linux,
c˜ c˜ o
MacOS e SunOS (referˆncias versus ranking). Esta figura foi extra´ de Veld-
e ıda
huizen,T.L., Software Libraries and Their Reuse: Entropy, Kolmogorov Com-
plexit and Zipf’s Law, cs.SE/0508023.
probabilidade de que em n tentativas E1 ocorra k1 vezes, E2 ocorra k2 vezes e
assim por diante ´:
e
Distribui¸˜o Multinomial.
ca
n!
P (k1 , k2 , ..., kr |p1 , p2 , ..., pr ) = pk1 pk2 ...pkr .
r (3.7)
k1 !k2 !...kr ! 1 2
com k1 + k2 + ... + kr = n.
Exemplo.Jogando Doze Dados. Se jogarmos 12 dados, qual ´ a probabil-
e
idade de obtermos cada face 2 vezes? Aqui E1 ,...E6 representam as seis faces
dos dados. Queremos saber P (2, 2, 2, 2, 2, 2|1/6, ..., 1/6). Utilizando o modelo
multinomial teremos (12!)(2)−6 (6)−12 = 0, 0034.
3.9 Distribui¸˜o de Zipf
ca
A distribui¸ao de Zipf ´ definida como:
c˜ e
Distribui¸˜o de Zipf.
ca
k −s
P (k|s, N ) = N
. (3.8)
n=1 n−s
A distribui¸ao de Zipf (tamb´m conhecida como lei de potˆncia) aparece nos
c˜ e e
lugares mais variados: nas palavras em uma l´ıngua, nas seq¨ˆncias de DNA,
ue
12. 38 CAP´
ITULO 3. MODELOS DISCRETOS
na intensidade de terremotos, na popularidade de links na internet, na dis-
tribui¸ao de renda dos 3% mais ricos, no n´ mero de amigos no Orkut, nomes
c˜ u
numa popula¸ao, popula¸ao de cidades, tempo transcorrido nas trocas de car-
c˜ c˜
tas (ou emails), utiliza¸ao de palavras chave em um site de busca, tamanho de
c˜
extin¸oes em massa de esp´cies, tamanho de grandes flutua¸oes de pre¸os na
c˜ e c˜ c
bolsa, cita¸oes de artigos cient´
c˜ ıficos, etc...
A caracter´ ıstica mais evidente da distribui¸ao de Zipf ´ o fato de n˜o haver
c˜ e a
um valor t´ ıpico (isso mesmo, a m´dia n˜o existe !). Assim quando observamos
e a
um modelo usual temos uma varia¸ao mas h´ um tamanho t´
c˜ a ıpico (por exemplo,
n˜o vemos ningu´m com 10 metros de altura, todo mundo mede algo em torno
a e
de 1,60 m ou 1,70m). Em mundo onde a altura das pessoas fosse regida pela
distribui¸ao de Zipf, ver´
c˜ ıamos eventualmente (seriam raros, mas ver´ ıamos) pes-
´
soas com 10 m, ou 100 m, ou mesmo 1 km de altura! E claro que a altura das
pessoas n˜o ´ um bom exemplo. Mas o n´ mero de amigos no Orkut certamente
a e u
segue um modelo de Zipf (verifique).
3.10 Exerc´
ıcios
1. Uma moeda viciada tem probabilidade de Cara igual a 0,4. Para dois
lan¸amentos independentes dessa moeda, estude o comportamento da
c
vari´vel n´ mero de Caras e fa¸a um gr´fico de sua fun¸ao de distribui¸ao.
a u c a c˜ c˜
2. Uma vari´vel aleat´ria X tem a seguinte fun¸ao de distribui¸ao:
a o c˜ c˜
0
se x < 10;
0, 2 se 10 ≤ x < 12;
F (x) = 0, 5 se 12 ≤ x < 13;
0, 9 se 13 ≤ x < 25;
1 se x ≥ 25.
Determine: (a) A fun¸ao de probabilidade de X; (b) P (X ≤ 12); (c)
c˜
P (X < 12); (d) P (12 ≤ X ≤ 20); (e) P (X > 18).
3. Um usu´rio de transporte coletivo chega pontualmente `s 8 horas para
a a
pegar o seu ˆnibus. Devido ao trˆnsito ca´tico, a demora pode ser qualquer
o a o
tmpo entre 1 e 20 minutos (assuma que a unidade m´ ınima relevante para
o tempo ´ 1 minuto). Pergunta-se: (a) Qual ´ a probabilidade de demorar
e e
mais de 10 minutos? (b) Qual ´ a probabilidade de demorar pelo menos 5
e
minutos n˜o mais que 10 minutos? (c) Qual ´ a probabilidade da demora
a e
n˜o chegar a 5 minutos? (d) Se um amigo chegou 10 minutos atrasado e
a
vai pegar o mesmo ˆnibus (que ainda n˜o passou), qual ´ a probabilidade
o a e
do amigo atrasado esperar at´ 3 minutos?
e
4. Supondo igualdade de probabilidade entre nascimentos de cada sexo, para
uma fam´ com trˆs filhos, calcule a probabilidade de que: (a) Exata-
ılia e
mente dois sejam do sexo masculino. (b) Pelo menos um deles seja do
sexo masculino. (c) Todos sejam do sexo feminino.
13. ˆ
3.11. REFERENCIAS 39
5. No estudo de desempenho de uma central de computa¸ao, o acesso ` CPU
c˜ a
´ descrito por um modelo de Poisson com 4 requisi¸oes a cada segundo.
e c˜
Essas requisi¸oes podem ser de v´rias naturezas tais como: imprimir um
c˜ a
arquivo, efetuar um c´lculo ou enviar uma mensagem pela internet, entre
a
outras. (a) Escolhendo-se ao acaso um intervalo de 1 segundo, qual ´ ae
`
probabilidade de haver mais de 2 acessos A CPU? E do n´ mero de acessos
u
ultrapassar 5? (b) considerando agora o intervalo de 10 segundos, tamb´m
e
escolhido ao acaso, qual ´ a probabilidade de haver 50 acessos?
e
6. Um livreiro descuidado mistura 4 exemplares defeituosos junto com out-
ros 16 perfeitos de um certo livro did´tico. Quatro amigas v˜o a essa
a a
livraria para comprar seus livros escolares. (a) Calcule a probabilidade de
3 levarem livros defeituosos. (b) Qual ´ a probabilidade de, ap´s a visita
e o
dessas meninas,restarem o mesmo n´ mero de defeituosso na livraria? E
u
de n˜o restar nenhum?
a
7. Uma vacina contra a gripe ´ eficiente em 70% dos casos. Sorteamos, ao
e
acaso, 20 dos pacientes vacinados e pergunta-se a probabilidade de obter:
(a) Pelo menos 18 imunizados. (b) No m´ximo 4 imunizados. (c) N˜o
a a
mais do que 3 n˜o imunizados.
a
8. Uma linha de produ¸ao est´ sendo analisada para efeito de controle da
c˜ a
qualidade das pe¸as produzidas. Tendo em vista o alto padr˜o requerido, a
c a
produ¸ao ´ interrompida para regulagem toda vez que uma pe¸a defeituosa
c˜ e c
´ observada . Se 0,01 ´ a probabilidade da pe¸a ser defeituosa, estude o
e e c
comportamento da vari´vel Q, quantidade de pe¸as boas produzidas antes
a c
da primeira defeituosa.
3.11 Referˆncias
e
Se quiser fazer mais exerc´
ıcios procure por (todos os exerc´
ıcios do texto foram
extra´
ıdos de l´):
a
• Magalh˜es M.N., de Lima A.C.P., No¸oes de Probabilidade e Estat´
a c˜ ıstica,
Edusp,2004.
Exemplos foram extra´
ıdos de:
• Feller, W. An introduction to Probability Theory and Its Applications,
Volume I, John Wiley & Sons, 1950.
• DeGroot, M., Probability and Statistics, Addison-Wesley, 1975.
Livros de divulga¸ao cient´
c˜ ıfica relacionados ` lei de Zipf:
a
• Bak, P., How Nature Works, Oxford University Press, 1996.
• Buchanan, M., Ubiquity, Crown Publishers, 2001.