O teste-t é amplamente utilizado na literatura para comparar a média de uma variável numérica de dois grupos.
Aqui está um exemplo de como a ICIC - Consultoria Estatística realiza o teste-t:
Supondo que temos como população os 90 concluintes do curso de Estatística do ano de 2015 e buscamos entender se a média de idade é igual entre os gêneros:
Podemos realizar a análise da seguinte forma:
T: TABELA
Estatísticas para a idade por gênero:
Q1: Primeiro Quartil, Q3: Terceiro Quartil, DP=Desvio Padrão, CV = Coeficiente de Variação, SW = p-valor do teste de normalidade de shapiro-wilk
I: INTERPRETAÇÃO
Realizando o teste-t bicaudal com correção de Welch para duas amostras independentes (t(78) = -3.15; p=0.002**), rejeitamos a hipótese de igualdade de médias de Idade por Gênero. Podemos ver que o grupo 'Feminino' (n=50, Média=53.01, DP=11.11) apresenta média menor que o grupo 'Masculino' (n=40, Média=61.1, DP=12.83). A estimativa de diferença entre as médias foi -8.09 e IC95%=(-13.2, -2.98 ).
Através da estatística d de Cohen (-0.67), verificamos a magnitude da diferença entre as médias entre 0.3 e 0.8 DP’s, o que Cohen (1988) considerou uma magnitude média. Apesar disso, cabe considerar a relevância clínica ou prática da diferença. A suposição de normalidade das amostras foi verificada através do teste de Shapiro-Wilk, que com p-valor maior que 0.05 para as duas amostras não rejeitou a normalidade das distribuições (Feminino - W=0.98, p-valor=0.698, Masculino - W=0.98, p-valor=0.660), atendendo a suposição do teste.
R: REFERÊNCIAS
Teste representado pela letra “c” ao lado do p-valor. Este é um teste paramétrico em que temos uma variável nominal que divide a população em duas categorias (Exemplo: Sexo feminino e masculino; Doente ou não doente; Desfecho positivo ou negativo) e uma variável numérica a ser comparada. O objetivo do teste é verificar se a média da população definida por uma categoria é diferente da média da outra população. Como este é um teste paramétrico, depende da hipótese de que ambas as populações possuem distribuição normal, o que é testado aqui através do teste de Shapiro-Wilk.
No teste-t de Student, há também a suposição de igualdade de variâncias nas duas populações, que segundo Andy Field, Jeremy Miles, and Zoe Field (2012), pode ser abandonada caso seja usada a correção de Welch dos graus de liberdade (Capítulo 9.4). Por este motivo, como sugerido, utilizamos a correção para ganhar maior robustez. O tamanho do efeito calculado é a estatística d de cohen (Cohen 1988), que informa quantos desvios-padrão (DP) de diferença existem entre os resultados dos dois grupos em comparação.Cohen propôs quantificar a magnitude do efeito em: Pequeno (d = 0.2 – 0.4), Médio (d = 0.4 – 0.8), Grande (d = maior que 0.8). Também significa que se a diferença entre as médias de dois grupos for menor que 0.2 DP, a diferença é desprezível, mesmo que seja estatisticamente significativa.
Bibliografia:
Andy Field, Jeremy Miles, and Zoe Field. 2012. Discovering Statistics Using R. SAGE Publications.
Cohen, J. 1988. Statistical Power Analysis for the Behavioral Sciences (2nd Ed.). Hillsdale, NJ: Lawrence Erlbaum Associates, Publishers.
V: VISUALIZAÇÃO
Gostou dessa forma de análise? Se quiser uma dessa para os dados do seu banco, é só enviá-lo! Terei o maior prazer em replicar a sequência TIRV para você!
Fique à vontade para tirar dúvida sobre esse modelo de análise aqui nos comentários :)
Comments