Se o seu objetivo for comparar uma variável numérica entre dois grupos, mas as suposições para o teste-t forem violadas, você precisa de um Teste Mann-Whitney.
Aqui está um exemplo de como a ICIC - Consultoria Estatística realiza o de Mann-Whitney:
Supondo que temos como população os 90 concluintes do curso de Estatística do ano de 2015 e buscamos entender se os gêneros são homogêneos quanto à idade:
Podemos realizar a análise da seguinte forma:
T: TABELA
Estatísticas para a idade por gênero:
Q1: Primeiro Quartil, Q3: Terceiro Quartil, DP=Desvio Padrão, CV = Coeficiente de Variação, SW = p-valor do teste de normalidade de shapiro-wilk
I: INTERPRETAÇÃO
Realizando o teste de Mann Whitney (W=1926.5, p=<0.001***), rejeitamos a hipótese de igualdade de distribuições de Idade entre os grupos. O grupo Feminino (mediana=38.5 e intervalo interquartil = [34.25,42]) é maior que o grupo Masculino (mediana=28 e intervalo interquartil = [24,31]). Através da estatística r (0.79), verificamos a magnitude da diferença detectada maior que 0.5, o que foi classificado em Fritz et al., 2011 como um efeito grande.
Através do teste de Shapiro-Wilk, com p-valor maior que 0.05 para as duas amostras, não rejeitamos a normalidade das distribuições (Feminino - W=0.96, p-valor=0.103, Masculino - W=0.96, p-valor=0.136), por este motivo o teste-t também pode ser utilizado, com muitas vantagens do ponto de vista de interpretação do resultado.
R: REFERÊNCIAS
Teste representado pela letra “d” ao lado do p-valor. Neste teste não paramétrico, temos uma variável nominal que divide a população em duas categorias (Exemplo: Sexo feminino e masculino; Doente ou não doente; Desfecho positivo ou negativo). O objetivo do teste é verificar se uma variável numérica não normal ou categórica ordinal é diferente entre as duas categorias. Sendo assim, a hipótese nula é que a variável testada é igual entre os dois grupos e a alternativa, que a variável é diferente entre os grupos. Ao nível de significância de 5%, rejeita-se a hipótese de igualdade entre os dois grupos se o p-valor encontrado for menor que 0,05. O tamanho do efeito calculado é a estatística r, que é calculada como Z dividido pela raiz quadrada do total de observações. Esta estatística relata um tamanho de efeito, em que quanto mais distante do 0, maior o efeito. Quando os dados no primeiro grupo são maiores do que no segundo grupo, r é positivo. Quando os dados no segundo grupo são maiores do que no primeiro grupo, r é negativo. Comumente, considera-se r > 0.1 como efeito pequeno, r > 0.3 efeito médio e r > 0.5 grande.
Bibliografia:
Andy Field, Jeremy Miles, and Zoe Field. 2012. Discovering Statistics Using R. SAGE Publications.
Cohen, J. 1988. Statistical Power Analysis for the Behavioral Sciences (2nd Ed.). Hillsdale, NJ: Lawrence Erlbaum Associates, Publishers.
V: VISUALIZAÇÃO
Gostou dessa forma de análise? Se quiser uma dessa para os dados do seu banco, é só enviá-lo! Terei o maior prazer em replicar a sequência TIRV para você!
Fique à vontade para tirar dúvida sobre esse modelo de análise aqui nos comentários :)
Comments