Contente
- Erro tipo I: rejeitando erroneamente a hipótese nula
- Erro tipo II: rejeitando erroneamente a hipótese alternativa
- Determinando o nível de significância
- Escolhendo um teste de significância
A significância estatística é um indicador objetivo de se os resultados de um estudo são matematicamente "reais" e estatisticamente defensáveis, em vez de apenas uma ocorrência casual. Os testes de significância comumente usados procuram diferenças nas médias dos conjuntos de dados ou diferenças nas variações dos conjuntos de dados. O tipo de teste aplicado depende do tipo de dados que está sendo analisado. Cabe aos pesquisadores determinar quão significativos eles exigem que os resultados sejam - em outras palavras, quanto risco eles estão dispostos a correr por estarem errados. Normalmente, os pesquisadores estão dispostos a aceitar um nível de risco de 5%.
Erro tipo I: rejeitando erroneamente a hipótese nula
Scott Rothstein / iStock / Getty ImagesSão realizadas experiências para testar hipóteses específicas ou perguntas experimentais com um resultado esperado. Uma hipótese nula é aquela que não detecta diferença entre os dois conjuntos de dados que estão sendo comparados. Em um ensaio clínico, por exemplo, a hipótese nula pode ser a de que não há diferença na melhora entre os pacientes que recebem o medicamento do estudo e os pacientes que recebem o placebo. Se o pesquisador rejeitar erroneamente essa hipótese nula quando for de fato verdade, ou seja, se "detectarem" uma diferença entre os dois conjuntos de pacientes quando realmente não houve diferença, eles cometeram um erro do tipo I.Os pesquisadores determinam antecipadamente quanto risco de cometer um erro do tipo I estão dispostos a aceitar. Esse risco é baseado em um valor-p máximo que eles aceitarão antes de rejeitar a hipótese nula e é chamado de alfa.
Erro tipo II: rejeitando erroneamente a hipótese alternativa
Uma hipótese alternativa é aquela que detecta uma diferença entre os dois conjuntos de dados que estão sendo comparados. No caso do teste médico, você esperaria ver diferentes níveis de melhorias nos pacientes que receberam o medicamento do estudo e nos pacientes que receberam o placebo. Se os pesquisadores falharem em rejeitar a hipótese nula quando deveriam, ou seja, se "detectarem" nenhuma diferença entre os dois grupos de pacientes quando realmente havia uma diferença, eles cometeram um erro do Tipo II.
Determinando o nível de significância
Quando os pesquisadores realizam um teste de significância estatística e o valor de p resultante é menor que o nível de risco considerado aceitável, o resultado do teste é considerado estatisticamente significativo. Nesse caso, a hipótese nula - a hipótese de que não há diferença entre os dois grupos - é rejeitada. Em outras palavras, os resultados indicam que há uma diferença na melhora entre os pacientes que recebem o medicamento do estudo e os pacientes que recebem o placebo.
Escolhendo um teste de significância
Existem vários testes estatísticos diferentes para você escolher. Um teste t padrão compara as médias de dois conjuntos de dados, como nossos dados sobre medicamentos em estudo e nossos dados sobre placebo. Um teste t emparelhado é usado para detectar diferenças no mesmo conjunto de dados, como um estudo antes e depois. Uma Análise de Variância unidirecional (ANOVA) pode comparar as médias de três ou mais conjuntos de dados e uma ANOVA bidirecional compara as médias de dois ou mais conjuntos de dados em resposta a duas variáveis independentes diferentes, como forças diferentes do medicamento de estudo. Uma regressão linear compara as médias dos conjuntos de dados ao longo de um gradiente de tratamentos ou tempo. Cada teste estatístico resultará em medidas de significância, ou alfa, que podem ser usadas para interpretar os resultados do teste.