Nas estatísticas, a amostragem aleatória de dados de uma população geralmente leva à produção de uma curva em forma de sino com a média centralizada no pico do sino. Isso é conhecido como distribuição normal. O teorema do limite central afirma que, à medida que o número de amostras aumenta, a média medida tende a ser normalmente distribuída sobre a média da população e o desvio padrão se torna mais estreito. O teorema do limite central pode ser usado para estimar a probabilidade de encontrar um valor específico dentro de uma população.
Colete amostras e determine a média. Por exemplo, suponha que você queira calcular a probabilidade de um homem nos Estados Unidos ter um nível de colesterol de 230 miligramas por decilitro ou mais. Começaríamos coletando amostras de 25 indivíduos e medindo seus níveis de colesterol. Após a coleta dos dados, calcule a média da amostra. A média é obtida somando cada valor medido e dividindo pelo número total de amostras. Neste exemplo, suponha que a média seja 211 miligramas por decilitro.
Calcule o desvio padrão, que é uma medida dos dados "espalhados". Isso pode ser feito em algumas etapas fáceis:
Neste exemplo, suponha que o desvio padrão seja 46 miligramas por decilitro.
Calcule o erro padrão dividindo o desvio padrão pela raiz quadrada do número total de amostras:
Erro padrão = 46 / sqrt25 = 9,2
Faça um esboço da distribuição normal e da sombra na probabilidade apropriada. Seguindo o exemplo, você deseja saber a probabilidade de um homem ter um nível de colesterol de 230 miligramas por decilitro ou acima. Para encontrar a probabilidade, descubra quantos erros padrão estão os 230 miligramas médios por decilitro (valor Z):
Z = 230 - 211 / 9,2 = 2,07
Procure a probabilidade de obter um valor 2,07 erros padrão acima da média. Se você precisar encontrar a probabilidade de encontrar um valor dentro de 2,07 desvios padrão da média, então z é positivo. Se você precisar encontrar a probabilidade de encontrar um valor além de 2,07 desvios padrão da média, z será negativo.
Procure o valor-z em uma tabela de probabilidade normal padrão. A primeira coluna no lado esquerdo mostra o número inteiro e a primeira casa decimal do valor z. A linha na parte superior mostra a terceira casa decimal do valor-z. Seguindo o exemplo, como nosso valor-z é -2,07, primeiro localize -2,0 na coluna da esquerda e, em seguida, verifique a linha superior da entrada 0,07. O ponto em que essas colunas e linhas se cruzam é a probabilidade. Nesse caso, o valor lido na tabela é 0,0192 e, portanto, a probabilidade de encontrar um homem com nível de colesterol de 230 miligramas por decilitro ou mais é de 1,92%.