Contente
Um gráfico de dispersão é um gráfico que mostra a relação entre dois conjuntos de dados. Às vezes, é útil usar os dados contidos em um gráfico de dispersão para obter um relacionamento matemático entre duas variáveis. A equação de um gráfico de dispersão pode ser obtida manualmente, usando uma das duas maneiras principais: uma técnica gráfica ou uma técnica chamada regressão linear.
Criando um gráfico de dispersão
Use papel milimétrico para criar um gráfico de dispersão. Desenhe os eixos xe y, verifique se eles se cruzam e identifique a origem. Verifique se os eixos xe y também possuem títulos corretos. Em seguida, plote cada ponto de dados no gráfico. Quaisquer tendências entre os conjuntos de dados plotados devem agora ser evidentes.
Linha de Melhor Ajuste
Após a criação de um gráfico de dispersão, assumindo que haja uma correlação linear entre dois conjuntos de dados, podemos usar um método gráfico para obter a equação. Pegue uma régua e desenhe uma linha o mais próximo possível de todos os pontos. Tente garantir que haja tantos pontos acima da linha quanto abaixo da linha. Depois de traçada a linha, use métodos padrão para encontrar a equação da reta
Equação da linha reta
Depois que uma linha de melhor ajuste é colocada em um gráfico de dispersão, é fácil encontrar a equação. A equação geral de uma linha reta é:
y = mx + c
Onde m é a inclinação (gradiente) da linha ec é a interceptação em y. Para obter o gradiente, encontre dois pontos na linha. Para fins deste exemplo, vamos supor que os dois pontos sejam (1,3) e (0,1). O gradiente pode ser calculado tomando a diferença nas coordenadas y e dividindo pela diferença nas coordenadas x:
m = (3 - 1) / (1 - 0) = 2/1 = 2
O gradiente neste caso é igual a 2. Até agora, a equação da reta é
y = 2x + c
O valor para c pode ser obtido substituindo nos valores por um ponto conhecido. Seguindo o exemplo, um dos pontos conhecidos é (1,3). Conecte isso à equação e reorganize para c:
3 = (2 * 1) + c
c = 3-2 = 1
A equação final neste caso é:
y = 2x + 1
Regressão linear
A regressão linear é um método matemático que pode ser usado para obter a equação linear de um gráfico de dispersão. Comece colocando seus dados em uma tabela. Neste exemplo, vamos supor que temos os seguintes dados:
(4.1, 2.2) (6.5, 4.5) (12.6, 10.4)
Calcule a soma dos valores x:
x_sum = 4,1 + 6,5 + 12,6 = 23,2
Em seguida, calcule a soma dos valores y:
y_sum = 2,2 + 4,4 + 10,4 = 17
Agora soma os produtos de cada conjunto de pontos de dados:
xy_sum = (4.1 * 2.2) + (6.5 * 4.4) + (12.6 * 10.4) = 168.66
Em seguida, calcule a soma dos valores x ao quadrado e os valores y ao quadrado:
x_square_sum = (4.1 ^ 2) + (6.5 ^ 2) + (12.6 ^ 2) = 217.82
y_square_sum = (2.2 ^ 2) + (4.5 ^ 2) + (10.4 ^ 2) = 133.25
Por fim, conte o número de pontos de dados que você possui. Neste caso, temos três pontos de dados (N = 3). O gradiente para a linha de melhor ajuste pode ser obtido em:
m = (N * xy_sum) - (x_sum * y_sum) / (N * x_square_sum) - (x_sum * x_sum) = (3 * 168,66) - (23,2 * 17) / (3 * 217,82) - (23,2 * 23,2) = 0,968
A interceptação para a linha de melhor ajuste pode ser obtida em:
c = (x_square_sum * y_sum) - (x_sum * xy_sum) / (N * x_square_sum) - (x_sum * x_sum)
= (217.82 17) - (23.2 168.66) / (3 * 217.82) - (23.2 * 23.2) = -1.82
A equação final é, portanto:
y = 0,968x - 1,82