Como encontrar o coeficiente de correlação para 'R' em um gráfico de dispersão

Novembro 2024

Autor: Laura McKinney

Data De Criação: 9 Abril 2021

Data De Atualização: 20 Novembro 2024

Como encontrar o coeficiente de correlação para 'R' em um gráfico de dispersão - Ciência

Contente

TL; DR (muito longo; não leu)

Encontrar a força da associação entre duas variáveis é uma habilidade importante para cientistas de todos os tipos. Se duas variáveis estiverem correlacionadas, isso mostra que há um link entre elas. Uma correlação positiva significa que quando uma variável aumenta, a outra também, e uma correlação negativa significa que quando uma variável aumenta, a outra diminui. As correlações não provam causalidade, embora seja possível que testes adicionais provem uma relação causal entre as variáveis. O coeficiente de correlação R mostra a força do relacionamento entre as duas variáveis e se é uma correlação positiva ou negativa.

TL; DR (muito longo; não leu)

Chamar uma variável x e uma variável y. Calcular o valor de R usando a fórmula:

R = ÷ √ {}

Onde n é o tamanho da sua amostra.

Faça uma tabela com seus dados. Isso deve incluir uma coluna para o número do participante, uma coluna para a primeira variável (rotulada x) e uma coluna para a segunda variável (rotulada y) Por exemplo, se você está olhando para ver se há uma correlação entre altura e tamanho do sapato, uma coluna identificaria cada pessoa que você mede, uma coluna mostraria a altura de cada pessoa e outra mostraria o tamanho do sapato. Faça três colunas adicionais, uma para xy, um para x² e um para y².

Use seus dados para preencher as três colunas adicionais. Por exemplo, imagine que sua primeira pessoa mede 75 polegadas de altura e tem tamanho 12 pés. o x (altura) mostraria 75 e a coluna y (tamanho do sapato) mostraria 12. Você precisa encontrar xy, x² e y². Então, usando este exemplo:

xy = 75 × 12 = 900

x² = 75² = 5,625

y² = 12² = 144

Complete estes cálculos para todas as pessoas para quem você tem dados.

Crie uma nova linha na parte inferior da sua tabela para as somas de cada coluna. Adicione todos os x valores, todos os y valores, todos os xy valores, todos os x² valores e todos os y² valores e, em seguida, coloque os resultados na parte inferior da coluna correspondente em sua nova linha. Você pode rotular sua nova linha como "soma" ou usar um símbolo sigma (Σ).

Você encontra R dos seus dados usando a fórmula:

R = ÷ √ {}

Parece um pouco assustador, então você pode dividi-lo em duas partes, que chamaremos s e t.

s = n (Σxy) - (Σx) (Σy)

t = √ {}

Nestas equações, n é o número de participantes que você tem (o tamanho da sua amostra). O restante das partes da equação são as somas que você calculou na última etapa. Então para s, multiplique o tamanho da sua amostra pela soma dos xy coluna e, em seguida, subtraia a soma do x coluna multiplicada pela soma da y coluna a partir disso.

Para t, há quatro etapas principais. Primeiro, calcule n multiplicado pela soma do seu x² coluna e, em seguida, subtraia a soma do seu x coluna ao quadrado (multiplicada por ele mesmo) desse valor. Segundo, faça exatamente a mesma coisa, mas com a soma do y² coluna e a soma do y coluna ao quadrado no lugar do x partes (ou seja, n × Σy² -) Terceiro, multiplique esses dois resultados (para o xareia ys) juntos. Quarto, pegue a raiz quadrada desta resposta.

Se você trabalhou em partes, pode calcular R simplesmente R = s ÷ t. Você receberá uma resposta entre -1 e 1. Uma resposta positiva mostra uma correlação positiva, com algo acima de 0,7 sendo geralmente considerado um relacionamento forte. Uma resposta negativa mostra uma correlação negativa, com algo acima de 0,7 considerado um forte relacionamento negativo. Da mesma forma, ± 0,5 é considerado um relacionamento moderado e ± 0,3 é considerado um relacionamento fraco. Qualquer coisa próxima de 0 mostra uma falta de correlação.