O documento descreve o teste de Wilcoxon, um teste estatístico não paramétrico para amostras pareadas. Ele fornece um método alternativo ao teste t de Student quando os dados não seguem uma distribuição normal. O teste compara as diferenças entre pares de dados atribuindo postos às diferenças e somando os postos com o mesmo sinal para calcular um valor estatístico W, que é comparado a valores críticos em uma tabela para determinar se há diferenças significativas entre as amostras.
2. O teste T de Wilcoxon substitui o t de Student para
amostras pareadas quando os dados não satisfazem as
exigências deste último. Foi também desenvolvido por F.
Wilcoxon em 1945 e baseia-se nos postos das diferenças
intrapares. O teste de Wilcoxon (Wilcoxon Matched-Pairs;
Wilcoxon signed-ranks test) é um método não-paramétrico
para comparação de duas amostras pareadas.
3. A princípio são calculados os valores numéricos da
diferença entre cada par, sendo possível três condições:
aumento (+), diminuição (-) ou igualdade (=). Uma vez
calculadas todas as diferenças entre os valores obtidos para
cada par de dados, essas diferenças são ordenadas pelo seu
valor absoluto (sem considerar o sinal), substituindo-se
então os valores originais pelo posto que ocupam na escala
ordenada.
4. Os seguintes passos devem ser
seguidos na sua construção:
Calcular a diferença entre as observações para cada par.
Ignorar os sinais das diferenças e atribuir postos a elas.
Calcular a soma dos postos (S) de todas as diferenças
negativas (ou positivas).
5. Procedimentos para a realização
do teste:
Para cada par, determinar a diferença (d), com sinal.
Atribuir postos a essas diferenças independentemente de sinal. Em
caso de empates, atribuir a média dos postos empatados.
Para cada posto atribuir o sinal + ou o sinal – do d que ele
representa.
Obter o valor T que representa a menor das somas de postos de
mesmo sinal.
Determinar N que é o total das diferenças com sinal.
6. Se N ≤25, obter p através da distribuição binomial.
Se N > 25, determinar a média e o desvio-padrão
aproximado da soma dos ranks dos postos. Em seguida,
obter o valor de z calculado e o valor de z tabelado.
Observa se portanto, a utilização da aproximação da
distribuição binomial pela distribuição Normal.
7. Por último, comparar o valor real com o valor teórico de
z. Se z calculado for menor que z tabelado não se pode
rejeitar a hipótese nula
8. Exemplo
A um grupo de alunos foram ministrados dois testes
similares para verificar o aprendizado. O objetivo é
verificar se os dois testes apresentados são equivalentes.
Os resultados dos testes estão no quadro abaixo.
Observa-se que cada aluno realizou os dois testes.
9. Para a resolução do teste contou-se com a ajuda de uma
planilha do Excel. Podemos observar no quadro abaixo as
diferenças dos escores de cada par, os postos das
diferenças sem o sinal e os postos médios com sinal.
10. Da mesma forma, obteve-se o valor T que representa a
menor das somas de postos de mesmo sinal e o valor de
N que é o total das diferenças com sinal.
Como a amostra apresenta N ≤25, obteve-se o valor de p
pela distribuição binomial.
11. Conclusão: Como o valor p calculado ficou acima de 5%,
não se pode rejeitar a hipótese nula, ou seja, os dois
testes podem ser considerados equivalentes.
12. Consideramos então que o objetivo do teste dos sinais de
Wilcoxon é comparar as performances de cada sujeito (ou
pares de sujeitos) no sentido de verificar se existem
diferenças significativas entre os seus resultados nas duas
situações. Os resultados da Situação B são subtraídos dos
da Situação A e à diferença resultante (d) é atribuído o
sinal mais (+) ou, caso seja negativa, o sinal menos (‐).
Estas diferenças são ordenadas em função da sua
grandeza (independentemente do sinal positivo ou
negativo).
13. O ordenamento assim obtido é depois apresentado
separadamente para os resultados positivos e negativos.
O menor dos valores deste segundo, dá‐lhe o valor de
uma “estatística” designada por W, que pode ser
consultada na Tabela de significância apropriada. A ideia
é que se existirem apenas diferenças aleatórias, tal como
é postulado pela hipótese nula, então haverá
aproximadamente o mesmo número de ordens elevadas
e de ordens inferiores tanto para as diferenças positivas
como negativas.
14. Se se verificar uma preponderância de baixos resultados
para um dos lados, isso significa a existência de muitos
resultados elevados para o outro lado, indicando uma
diferença em favor de uma das situações, superior àquilo
que seria de esperar se os resultados se devessem ao
acaso. Dado que a estatística W refleteo menor total de
ordens, quanto menor for oWmais significativas serão as
diferenças nas ordenações entre as duas situações.