Contente
- TL; DR (muito longo; não leu)
- Pontos de dados do pedido
- Determinar a posição do primeiro quartil
- Determinar a posição do terceiro quartil
- Calcular intervalo interquartil
- Vantagens e desvantagens do IQR
O intervalo interquartil, frequentemente abreviado como IQR, representa o intervalo do 25º ao 75º percentil, ou o 50% do meio, de qualquer conjunto de dados. O intervalo interquartil pode ser usado para determinar qual seria o intervalo médio de desempenho em um teste: você pode usá-lo para ver onde a maioria das pessoas obtém pontuação em um determinado teste ou determinar quanto dinheiro o funcionário médio de uma empresa ganha a cada mês . O intervalo interquartil pode ser uma ferramenta mais eficaz de análise de dados do que a média ou mediana de um conjunto de dados, porque permite identificar o intervalo de dispersão em vez de apenas um único número.
TL; DR (muito longo; não leu)
O intervalo interquartil (IQR) representa os 50% do meio de um conjunto de dados. Para calculá-lo, primeiro ordene seus pontos de dados do menor para o maior e, em seguida, determine suas posições do primeiro e terceiro quartis usando as fórmulas (N + 1) / 4 e 3 * (N + 1) / 4 respectivamente, onde N é o número de pontos no conjunto de dados. Por fim, subtraia o primeiro quartil do terceiro para determinar o intervalo interquartil para o conjunto de dados.
Pontos de dados do pedido
O cálculo do intervalo interquartil é uma tarefa simples, mas antes do cálculo, você precisará organizar os vários pontos do seu conjunto de dados. Para fazer isso, comece ordenando os pontos de dados do menor para o maior. Por exemplo, se seus pontos de dados fossem 10, 19, 8, 4, 9, 12, 15, 11 e 20, você os reorganizaria assim: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Depois que seus pontos de dados tiverem sido solicitados dessa maneira, você poderá passar para a próxima etapa.
Determinar a posição do primeiro quartil
Em seguida, determine a posição do primeiro quartil usando a seguinte fórmula: (N + 1) / 4, em que N é o número de pontos no conjunto de dados. Se o primeiro quartil cair entre dois números, considere a média dos dois números como sua pontuação no primeiro quartil. No exemplo acima, como existem nove pontos de dados, você adiciona 1 a 9 para obter 10 e depois divide por 4 para obter 2,5. Como o primeiro quartil fica entre o segundo e o terceiro valor, você levaria a média de 8 e 9 para obter uma posição do primeiro quartil de 8,5.
Determinar a posição do terceiro quartil
Depois de determinar seu primeiro quartil, determine a posição do terceiro quartil usando a seguinte fórmula: 3 * (N + 1) / 4 em que N é novamente o número de pontos no conjunto de dados. Da mesma forma, se o terceiro quartil cair entre dois números, simplesmente calcule a média como faria ao calcular a pontuação do primeiro quartil. No exemplo acima, como existem nove pontos de dados, você deve adicionar 1 a 9 para obter 10, multiplicar por 3 para obter 30 e depois dividir por 4 para obter 7,5. Como o primeiro quartil cai entre o sétimo e o oitavo valor, você levaria a média de 15 e 19 para obter uma pontuação do terceiro quartil de 17.
Calcular intervalo interquartil
Depois de determinar seu primeiro e terceiro quartis, calcule o intervalo interquartil subtraindo o valor do primeiro quartil do valor do terceiro quartil. Para concluir o exemplo usado ao longo deste artigo, você subtrairia 8.5 de 17 para descobrir que o intervalo interquartil do conjunto de dados é igual a 8,5.
Vantagens e desvantagens do IQR
O intervalo interquartil tem uma vantagem de poder identificar e eliminar valores discrepantes nas duas extremidades de um conjunto de dados. O IQR também é uma boa medida de variação nos casos de distribuição de dados assimétrica, e esse método de cálculo do IQR pode funcionar para conjuntos de dados agrupados, desde que você use uma distribuição de frequência cumulativa para organizar seus pontos de dados. A fórmula do intervalo interquartil para dados agrupados é a mesma que para dados não agrupados, com IQR igual ao valor do primeiro quartil subtraído do valor do terceiro quartil. No entanto, possui várias desvantagens em comparação com o desvio padrão: menos sensibilidade a algumas pontuações extremas e uma estabilidade de amostragem que não é tão forte quanto o desvio padrão.