O documento discute métodos estatísticos para analisar padrões espaciais em dados, incluindo distribuições de Poisson, índices de agregação, o índice de Moran, a razão c de Geary, e os índices Gi de Getis-Ord e G geral. O objetivo é identificar padrões espaciais agregados, regulares ou aleatórios e testar sua significância estatística.
1. Ecologia de Populações
Prof. Dr. Harold Gordon Fowler
popecologia@hotmail.com
Testes de Distribuição ou Dispersão
Espacial (ou Temporal)
2. Por que Estudar a
Dependência Espacial?
avaliar a quantidade de agregação ou
aleatoriedade de um padrão
– e.g., taxas de doença, taxas de acidentes, renda
per capita
aleatória: os fatores causativos operam em
escalas mais finas do que as “zonas de
registro”
agregada: os fatores causativos operam em
escalas mais grosas do que as “zonas de
registro”
3. Métodos para fazer
análise espacial
1. Fazer a pergunta,
2. Coletar os dados,
3. Escolhe o método estatístico,
4. Calcular a estatística,
5. Interpretar a estatística, e
6. Testar a significância.
4. Analise Espacial
Transforma os dados crus em informação
útil
– Ao adicionar maior conteúdo e valor de
informação
Revela padrões, tendências, e
anormalidades que não são óbvios
Proporciona um teste da intuição humana
– Ajudando em situações onde o olho pode
enganar
5. Analise Espacial
Um método de análise é espacial se os
resultados dependem das localizações dos
objetos sob estudo
– Mudar os objetos e os resultados mudam
– resultados não são invariantes quando mudado
A análise espacial requer os atributos e
localizações dos objetos
– Um SIG tem a capacidade de guardar ambos
6. O Mapa de Snow
(surtos de cólera na década de 1850)
Proporciona um exemplo clássico do uso da
localização para fazer inferências
Mas o mesmo padrão podia resultar do
contagio (a disseminação da cólera pelo ar)
– Se a fonte original viveu no centro do surto
– contagio era a hipótese que Snow tentou
falsificar. O SIG pode ser usado para
demonstrar uma sequencia de mapas durante o
desenvolvimento do surto
– Contagio produziria uma seqüência concêntrica,
e a água potável uma seqüência aleatória
8. Análise Espacial
Censo biológico onde cada ponto
representa o avistamento de uma
espécie. Se existe um padrão como
nessa figura podemos analisar o
comportamento em termos das
características ambientais
1.Quantificação de padrão
• Atração ou repulsão
• Direcionalidade
2.Infere sobre processos
a base do padrão
observado
11. Análise de Padrão de Pontos
Os testes estatísticos para padrões significantes nos
dados, comparada com a hipótese nula de um padrão
espacial aleatório
O padrão para comparação de padrões espaciais de pontos
é um:
Processo inteiramente aleatório espacial de pontos
Distribuição da probabilidade de Poisson (média =
variância) . Usado para gerar pontos espaciais aleatórios
12. Análise de Parcelas (Pontos)
Divide a área em parcelas iguais
Conte o número de pontos em cada parcela
Compare contagens com contagens esperados
da distribuição aleatória
Número de células
Agregado
CSR esperado = hipótese nula
Média esperada do número por célula em
Uniforme
CSR l = N/número de parcelas
Número de pontos por célula Para a distribuição de Poisson:
p(x) = (e-l lx)/x!
# Oi P(x) Ei (observado – esperado)2/esperado
0 2 0.0156 0.39
1 2 0.0649 1.62 5.39 2.42 Verifique tabela de X2
2 5 0.1350 3.38 Se Ho rejeitada:
3 1 0.1873 4.68 Média <> variância
… S C2 Média > variância (uniforme)
Média < variância (agregado)
13. Dispersão Espacial da
População
Distribuição: aleatória, regular, agregada
Para identificar padrão: testa a distribuição
observada contra a distribuição aleatória
Distribuição de Poisson - uma descrição
matemática de eventos aleatórias não
freqüentes
Px = axe-a / x!
x – número de ocorrências, a – número médio de
ocorrências
14. Distribuição Poisson
onde m is é a média e i!= 1×2×3× ... ×i, 0!=1;
1!=1.
Teorema: Na distribuição Poisson, a média =
variância:
15. Distribuição Poisson
A distribuição Poisson é simétrica em
valores baixos de média, e quase
simétrica sob valores maiores de media
Quando a media Distribuições de Poisson com
médias diferentes
aproxima a
infinidade, essa
distribuição
coincida com a
distribuição normal
16. Distribuição Poisson
Exemplo: Simulação
100 pessoas pescam ao mesmo tempo (3
horas) e têm a probabilidade igual de
pescar um peixe por unidade de tempo.
Pergunta: Quantos pescadores pescam
0, 1, 2, 3 .... peixes?
17. Distribuição Poisson
TESTE DE CHI QUADRADO
onde n(i) é a distribuição da
amostra (o número de pescadores
que capturaram i peixes), e n'(i) é a
distribuição teórica (número
esperado de pescadores que O número de graus de
pescaram i peixes pela distribuição
Poisson). =4,74 liberdade = o número
de classes (7 ) menos
o número de
Valor crítico gl = 5 e P = parâmetros usados para
0.05 é de 11.07.: ajustar a distribuição
Distribuição da amostra não teórica a da amostra (2
difere significativamente. parâmetros: m=2.3 e N
= 100. gl = 7 - 2 = 5
18. Distribuição Poisson
Númer Número de Proporção Distribuição de
o de pescadores de Poisson
peixes pescadores n'(i)=Np'(i)
0 11 0,11 10
1 25 0.25 23 Número médio de peixes
2 21 0.21 27 capturado por um
3 25 0,25 20 pescador, M = 2.30, e
4 9 0.09 12 desvio padrão, SD = 1.41.
5 7 0,07 5
6 2 0.02 2 Método de momentos (m
7 0 0,00 1 = M) = 2.3
total 100 1,00 100
19. Distribuição Poisson
TESTE DE CHI QUADRADO
Se amostramos uma
Não comprova que a distribuição população por censo numa
da amostra é a mesma que a área, cada amostra é igual
teórica! Se não há diferença a um pescador e os
significativa, implica que ou a indivíduos contados são
distribuição da amostra é próxima a iguais aos peixes
teórica, ou que falta dados para capturados. Uma
distinguir essas distribuições. "distribuição aleatória"
pode definir usando o
modelo de indivíduos..
20. Distribuição Poisson
Anãlise Poisson da distribuição hipotética de larvas de mosquito em poços
Número de larvas Número de poços (O) Número esperado de 2
(O-E) /E
no poço poços (E)
0 8 6,82 0,21
1 8 8,86 0,08
2 4 6,28 0,82
3 2 2,49 0,1
4 1 0,82 0,04
5 1 0,21 2,97
6 1 0,05 18,05
25 25 χ 2 = 22.27
χ 2 = 22.27, 6 gl, p < 0.001
21. Distribuição Poisson
Premissas: número médio de ocorrências é igual a
variância do número de ocorrências
Razão Media/ variância > 1 implica variação entre
poços é pequena (relativa a media) e sugere
uma hiper-dispersão
Razão Media/ variância < 1 implica variação entre
poços é relativamente grande e sugere uma
distribuição agregada
22. Distribuição Poisson
Estatística de teste : (n-1)s2/x (media)
Estatística de teste : χ2, d.f. = n -1
ou seja. se a media = 1.48, s2 = 2.68, n = 25
Razão media/ variância = 1.48/2.68 = 0.55
Estatística de teste = (25 -1)(2.68)/(1.48) =
43.5, significativo ao nível de 0.05
Conclusão: a distribuição é agregada
24. Índices de Agregação
Testes de Padrão Espacial
Coeficiente de dispersão:
se CD << 1 [distribuição regular]
se CD » 1 [distribuição aleatória]
se CD >> 1 [distribuição agregada]
25. Distribuição Agregada
Não existe um modelo teórico universal para a
distribuição espacial agregada. Modelos empíricos
podem funcionar, como a distribuição binominal
negativa:
onde m é a média e k é a "coeficiente de
agregação"
A agregação aumenta com o decremento de k.
28. Índices de Agregação
Coeficiente de dispersão
Mean crowding (Lloyd 1967) é igual ao
número médio de ”vizinhos" no mesmo
parcela:
Índice tem sentido biológico somente se o
tamanho de cada parcela corresponde a
”distancia de interação" entre os indivíduos.
30. Índices de Agregação
(N) (N-1) N(N-1)
1 5 4 20
2 3 2 6
3 0 -1 0
4 1 0 0
5 7 6 42
Total 16 - 68
O numero médio de ”vizinhos" é = 4.25.
31. Índice de Moran
positivo quando os atributos dos objetos
próximos são mais similares do que esperado
0 quando os arranjos são aleatórios
negativo quando os atributos dos objetos
próximos são menos similares do que
esperado
I = nS S wijcij / S S wij S(zi - zavg)2
n = número de objetos na amostra
i,j - qualquer 2 dos objetos
Z = valor do atributo para I
cij = similaridade de i e j atributos
wij= similaridade de i e j localidades
32. Índice de Moran
similaridade dos atributos e da localização
Negativo Extremo SA Dispersado, - SA
Independente, 0 SA
Agregação Espaciaial, + SA
Positivo extremo SA
33. PADRÃO DE DISTRIBUIÇÃO DE
PONTOS: I de Moran
Dispersa
Demonstra a similaridade de atributos
vizinhos
Proporciona uma estatística única para
resumir padrão
Para dados contínuos
Covariação espacial /variação total
– Varia de –1 a 1
Positiva = auto-correlação espacial
positiva, negativa indica uma auto-
Agregada
correlação espacial negativa. 0 = sem
auto-correlação espacial (aleatório).
34. Correlação do Tempo de
Retorno: I de Moran
Centrado ao redor os valores médios de x, x
Padronizado a variação da amostra
Nh
Covariância do Lag: Ch = S (xi – xi-h )(xi – xi+h )
i=1
Nh
correlação do Lag Ph = Ch
Sx-h Sx+h
35. Razão c de Geary
Como o Índice de Moran usa um único
valor para descrever a distribuição
espacial
– como., de elevações nas células de DEM
< 1 (agregado)
1
> 1 (aleatório)
como.,o indicador da informação perdida
da auto-correlação espacial durante as
conversões entre DEMs e TINs
36. Moran e Geary
Lee and Marion, 1994, Analysis of spatial autocorrelation of USGS 1:250,000 DEMs. GIS/LIS Proceedings.
37. PADRÃO DE VALORES DE POLIGONOS
E PONTOS: Gi de Getis-Ord e G Geral
Análise de pontos quentes,
demonstrando concentração
de valores altos ou baixos
Indica se os valores altos ou
baixos são agregados
Usa uma distancia a base de
vizinhança especificada
Aplica um peso a dados dentro
da distancia com valores
similares
38. PADRÃO DA DISTRIBUIÇÃO DE
PONTOS:
Operações de Vizinhança
O que fica próximo?
Métodos
– Distancia de linha reta
(distancia Euclidiana)
Diagrama de aranha
– Distancia de custo em rede
– Custo numa superfície
– Buffers
– Buffers de distancia variável
– Filtros
– Funções Locais, Focais e Zonais
– Distancia até atributos
– Polígonos de Theissen, ou
diagramas de Voronoi
39. PADRÃO DA DISTRIBUIÇÃO DE PONTOS:
Índice do Vizinho Mais
Próximo
Calcula a distancia média entre
pontos
Significância testada
com a distribuição Z
Tipos
– Distancia Inter-centróide
– Distancia borda – borda
40. Distancia a Vizinho Mais Próximo
1. Calcule a distancia a vizinho mais próximo para cada ponto
2. Calcule a distancia média do vmp
3. Calcule a média esperada para a distribuição CSR E(di) = 0.5 A/N
4. Compare a média esperada a média observada com Z
Z = [ d – E(di)] / [0.0683 A/N2]
Verifique significância de z
Se Ho rejeitada,
média observada < média esperada e Z < 0 => agregada
média observada > esperada e Z > 0 => uniforme
41. Função K de Ripley
Expande um circulo de raio maior ao redor de cada ponto
Conte o número de pontos dentro de cada circulo.
Calcule L(d), uma medida do número esperado de pontos
dentro da distancia (d); L(d) = [ASkij/pN(N-1)]0.5, onde A
= área, Skij = número de pontos j dentro da distancia d de
todos os pontos i
Simulações de Monte Carlo ou teste t
Uniforme
Média esperada
de CSR
L(d)
Agregada
Raio
42. PADRÃO DA DISTRIBUIÇÃO DE PONTOS:
Função K de Ripley
Contagem do número de atributos dentro de
distancias definidas h h
Mede o arranjo espacial
(agregado, uniforme, aleatório)
Usa simulações múltiplas para criar um
envelope de distribuição aleatória
Detecta a escala desses padrões, Agregada
como o tamanho do cluster? Aleatória
Premissas: Limite superior
Limite inferior
– Estacionária: Sem tendências
Lhat(h)-h
nos dados
– Isotrofia: Sem direção
(mas é possível modificar a função
K para detectar a anisotrofia.
– área regular de estudo Distancia (m)
(raramente encontrada)
43. Índices de Agregação
Invariantes com a Densidade
Os índices simples de agregação são
específicos a populações particulares em
tempo discreto. Não podem ser
extrapolados no espaço ou tempo. Por
isso, vários índices invariantes com
densidade foram propostos.
44. Índices de Agregação
Invariantes com a Densidade
A ”lei de potência" (Taylor 1961):
O coeficiente b é especifica a espécie..
45. Índices de Agregação
Invariantes com a Densidade
K da distribuição da binomial negativa.
Não um bom índice porque geralmente
varia com a densidade
46. Índices de Agregação
Invariantes com a Densidade
Regressão de Mean crowding (Iwao 1968):
.