Contente
- Visualização rápida de dados
- Visualizando a abundância relativa
- Conjuntos de dados complexos podem precisar classificados em intervalos
- As tabelas de frequência podem obscurecer a inclinação e a curtose
As tabelas de frequência podem ser úteis para descrever o número de ocorrências de um tipo específico de dado dentro de um conjunto de dados. As tabelas de frequência, também chamadas de distribuição de frequência, são uma das ferramentas mais básicas para exibir estatísticas descritivas. As tabelas de frequência são amplamente utilizadas como uma referência rápida na distribuição de dados; eles são fáceis de interpretar e podem exibir grandes conjuntos de dados de maneira bastante concisa. As tabelas de frequência podem ajudar a identificar tendências óbvias em um conjunto de dados e podem ser usadas para comparar dados entre conjuntos de dados do mesmo tipo. As tabelas de frequência não são apropriadas para todas as aplicações, no entanto. Eles podem obscurecer valores extremos (mais que X ou menos que Y) e não se prestam a análises da inclinação e curtose dos dados.
Visualização rápida de dados
As tabelas de frequência podem revelar rapidamente discrepâncias e até tendências significativas em um conjunto de dados com não muito mais do que uma inspeção superficial. Por exemplo, um professor pode exibir notas de um aluno em um período intermediário em uma tabela de frequência, a fim de obter uma rápida olhada no desempenho da classe em geral. O número na coluna da frequência representaria o número de alunos que receberam essa nota; para uma turma de 25 alunos, a distribuição de frequência das notas recebidas pode ser algo como: Frequência da classe A .............. 7 B ........... .13 C .............. 3 D .............. 2
Visualizando a abundância relativa
As tabelas de frequência podem ajudar os pesquisadores a examinar a abundância relativa de cada dado alvo específico em sua amostra. A abundância relativa representa quanto do conjunto de dados é composto pelos dados de destino. A abundância relativa é frequentemente representada como um histograma de frequência, mas pode ser facilmente exibida em uma tabela de frequências. Considere a mesma distribuição de frequência dos graus intermediários. A abundância relativa é simplesmente a porcentagem de alunos que pontuaram uma série específica e pode ser útil para conceituar dados sem exagerar. Por exemplo, com a coluna adicionada que exibe a porcentagem de ocorrência de cada nota, você pode facilmente ver que mais da metade da classe obteve um B, sem ter que examinar os dados com mais detalhes.
Abundância relativa da frequência da série (% de frequência) A .............. 7 .............. 28% B ......... .... 13 ............ 52% C .............. 3 ............. 12% D .............. 2 .............. 8%
Conjuntos de dados complexos podem precisar classificados em intervalos
Uma desvantagem é que é difícil compreender conjuntos de dados complexos que são exibidos em uma tabela de frequência. Conjuntos de dados grandes podem ser divididos em classes de intervalo para facilitar a visualização usando uma tabela de frequência. Por exemplo, se você perguntasse às próximas 100 pessoas qual era a idade delas, provavelmente obteria uma ampla gama de respostas, variando de três a noventa e três. Em vez de incluir linhas para todas as idades em sua tabela de frequências, você pode classificar os dados em intervalos, como 0 - 10 anos, 11 - 20 anos, 21 - 30 anos e assim por diante. Isso também pode ser chamado de distribuição de frequência agrupada.
As tabelas de frequência podem obscurecer a inclinação e a curtose
A menos que seja exibido em um histograma, a assimetria e curtose dos dados podem não ser facilmente aparentes em uma tabela de frequência. A assimetria indica a direção em que seus dados tendem. Se as notas fossem exibidas no eixo X de um gráfico que mostrasse a frequência das notas intermediárias para nossos 25 alunos acima, a distribuição seria distorcida na direção de As e Bs. A curtose informa sobre o pico central dos seus dados - se eles caem na linha de uma distribuição normal, que é uma boa curva de sino suave ou alta e nítida. Se você representar graficamente as notas intermediárias em nosso exemplo, encontrará um pico alto em B com uma queda acentuada na distribuição das notas inferiores.