Como encontrar o desvio padrão da amostra

Posted on
Autor: Randy Alexander
Data De Criação: 23 Abril 2021
Data De Atualização: 17 Novembro 2024
Anonim
Como encontrar o desvio padrão da amostra - Ciência
Como encontrar o desvio padrão da amostra - Ciência

Contente

Testes estatísticos como o t-test depende intrinsecamente do conceito de desvio padrão. Qualquer estudante de estatística ou ciência usará desvios padrão regularmente e precisará entender o que isso significa e como encontrá-lo a partir de um conjunto de dados. Felizmente, a única coisa que você precisa são os dados originais e, embora os cálculos possam ser entediantes quando você tem muitos dados, nesses casos, você deve usar funções ou dados da planilha para fazê-lo automaticamente. No entanto, tudo o que você precisa fazer para entender o conceito-chave é ver um exemplo básico que você pode facilmente resolver manualmente. Na essência, o desvio padrão da amostra mede quanto a quantidade que você escolheu varia em toda a população, com base na sua amostra.

TL; DR (muito longo; não leu)

Usando n significar tamanho da amostra, μ para a média dos dados, xEu para cada ponto de dados individual (de Eu = 1 a Eu = n) e Σ como sinal de soma, a variação da amostra (s2) é:

s2 = (Σ xEuμ)2 / (n − 1)

E o desvio padrão da amostra é:

s = √s2

Desvio padrão vs. desvio padrão da amostra

As estatísticas giram em torno de fazer estimativas para populações inteiras com base em amostras menores da população e responder por qualquer incerteza na estimativa no processo. Os desvios padrão quantificam a quantidade de variação na população que você está estudando. Se você estiver tentando encontrar a altura média, obterá um conjunto de resultados em torno do valor médio (médio) e o desvio padrão descreve a largura do cluster e a distribuição das alturas na população.

O desvio padrão da "amostra" estima o desvio padrão real para toda a população com base em uma pequena amostra da população. Na maioria das vezes, você não poderá amostrar toda a população em questão; portanto, o desvio padrão da amostra geralmente é a versão correta a ser usada.

Localizando o desvio padrão da amostra

Você precisa dos seus resultados e do número (n) das pessoas da sua amostra. Primeiro, calcule a média dos resultados (μ) adicionando todos os resultados individuais e dividindo-os pelo número de medições.

Como exemplo, os batimentos cardíacos (em batimentos por minuto) de cinco homens e cinco mulheres são:

71, 83, 63, 70, 75, 69, 62, 75, 66, 68

O que leva a uma média de:

μ = (71 + 83 + 63 + 70 + 75 + 69 + 62 + 75 + 66 + 68) ÷ 10

= 702 ÷ 10 = 70.2

O próximo estágio é subtrair a média de cada medição individual e depois quadrar o resultado. Como um exemplo, para o primeiro ponto de dados:

(71 – 70.2)2 = 0.82 = 0.64

E para o segundo:

(83 – 70.2)2 = 12.82 = 163.84

Você continua dessa maneira através dos dados e depois adiciona esses resultados. Portanto, para os dados de exemplo, a soma desses valores é:

0.64 + 163.84 +51.84 + 0.04 + 23.04 + 1.44 + 67.24 +23.04 + 17.64 + 4.84 = 353.6

O próximo estágio distingue entre o desvio padrão da amostra e o desvio padrão da população. Para o desvio da amostra, você divide esse resultado pelo tamanho da amostra menos um (n -1). No nosso exemplo, n = 10, então n – 1 = 9.

Esse resultado fornece a variação da amostra, denotada por s2, que para o exemplo é:

s2 = 353.6 ÷ 9 = 39.289

O desvio padrão da amostra (s) é apenas a raiz quadrada positiva desse número:

s = √39.289 = 6.268

Se você estava calculando o desvio padrão da população (σ) a única diferença é que você divide por n ao invés de n −1.

A fórmula inteira para o desvio padrão da amostra pode ser expressa usando o símbolo da soma Σ, com a soma sobre a amostra inteira e xEu representando o i_th resultado de _n. A variação da amostra é:

s2 = (Σ xEuμ)2 / (n − 1)

E o desvio padrão da amostra é simplesmente:

s = √s2

Desvio médio vs. desvio padrão

O desvio médio difere ligeiramente do desvio padrão. Em vez de elevar ao quadrado as diferenças entre a média e cada valor, basta pegar a diferença absoluta (ignorando quaisquer sinais de menos) e depois encontrar a média deles. Para o exemplo da seção anterior, o primeiro e o segundo pontos de dados (71 e 83) fornecem:

x1μ = 71 – 70.2 = 0.8

x2μ = 83 – 70.2 = 12.8

O terceiro ponto de dados fornece um resultado negativo

x3μ = 63 – 70.2 = −7.2

Mas você apenas remove o sinal de menos e toma isso como 7.2.

A soma de tudo isso dá dividida por n dá o desvio médio. No exemplo:

(0.8 + 12.8 + 7.2 + 0.2 + 4.8 + 1.2 + 8.2 + 4.8 + 4.2 + 2.2) ÷ 10 = 46.4 ÷ 10 = 4.64

Isso difere substancialmente do desvio padrão calculado anteriormente, porque não envolve quadrados e raízes.