domingo, 14 de julho de 2013

DISTRIBUIÇÃO DE FREQUÊNCIA

CONVERSA 32


Quando queremos organizar os dados por meio de INTERVALOS ou CLASSES (quer dizer, quando queremos montar uma distribuição de frequência) surgem as perguntas:
- Quantas classes eu devo ter?
- Qual deve ser a amplitude de cada classe?
- Quais os limites dos intervalos de classe?



Para determinar o número de classes (i) de uma distribuição podemos usar a regra de Sturges, que dá o número de classes em função da quantidade de dados que temos disponíveis.
Vamos aplicar a regra a partir da tabela que obtivemos em nossa conversa anterior:
IDADE
FREQUÊNCIA
15
3
16
6
17
8
18
4
19
5
20
2
21
4
22
3
23
3
24
1
25
1
TOTAL
40

Perceba que o número de valores da variável é 40; a partir dessa informação, para calcular o número (i) de intervalos faça o seguinte:
- Calcule o logaritmo decimal de 40 e obtenha aproximadamente 1,6;
- Multiplique esse valor por 3,3 (sempre); neste caso, você terá 5,28;
- Ao valor obtido, acrescente 1 (sempre); neste caso, você terá 6,28 (ou seja, “i” aproximadamente igual a 6,28).

É fácil perceber que o número de classes é um número natural; portanto, o valor acima nos leva a concluir  que nossa distribuição deve ter 6 ou 7 classes (ou seja, i = 6 ou i = 7).

Para saber a amplitude (h) de cada um desses 6 ou 7 intervalos, vamos fazer o seguinte:
- Calcule a amplitude amostral (na nossa tabela, AA = 25 – 15 = 10 anos);
- Divida esse valor pelo “i” escolhido e já arredondado (quer dizer: 6 ou 7);
- Se der um resultado decimal, arredonde para mais.

Da tabela acima, perceba que se escolhermos i = 6 teremos h = 1,6; se escolhermos i = 7 termos h = 1,4 (ambos valores decimais e aproximados); o arredondamento para h = 2 é mais aconselhável; portanto, usaremos i = 6.

Para escolher quais os limites dos intervalos de classe é importante considerar aqueles que lhe permitirão obter, sempre que possível, valores NATURAIS para os pontos médios (quer dizer, valores não decimais).

Na nossa tabela, sendo que usaremos i = 6 classes e h = 2 anos, podemos nos dar ao luxo de começar mesmo por 15 e terminar o último intervalo com 27, mesmo que essa idade não esteja nos dados originais.

A nova tabela ficará assim:
i (número de classes)
Idades (intervalos)
fi (frequência simples ou absoluta de cada classe)
1
15 a 17 (sem incluir o 17)
9
2
17 a 19 (sem incluir o 19)
12
3
19 a 21 (sem incluir o 21)
7
4
21 a 23 (sem incluir o 23)
7
5
23 a 25 (sem incluir o 25)
4
6
25 a 27 (sem incluir o 27)
1

TOTAL
40 alunos

É claro que você não precisa explicar na tabela o que significa o “i” e nem o “fi”; eu o fiz para deixar tudo mais claro.

Importante lembrar (como com certeza você já sabe) que na tabela não escrevemos (como eu fiz) “15 a 17 (sem incluir o 17)”; usamos somente o símbolo “˫” e teremos algo como “15 ˫ 17”, o que dispensa a explicação “sem incluir o 17”.

Perceba que na primeira linha da tabela temos i = 1 (quer dizer, a primeira classe ou a classe de número 1), o intervalo 15 ˫ 17 e f1 = 9 (ou seja, há nove alunos de 15 a 17 anos, sem contar os que tem exatamente 17 anos).
Para encontrar o valor f1 = 9 você deve ir a tabela principal e conferir a frequência dos alunos que tem 15 anos (3 alunos) e dos que tem 16 anos (6 alunos); não conte os que tem 17 anos; estes só entrarão no intervalo seguinte.
(obs: usei f1 = 9 e não fi = 9, porque na primeira linha i = 1, logo fi é o f1).
Siga um procedimento semelhante e encontrará as frequências de todos os demais intervalos.

Outra coisa que precisamos lembrar é que, no intervalo “15 ˫ 17” (por exemplo) os números 15 e 17 são os limites de classe (sendo 15 o limite inferior e 17 o limite superior; a mesma nomenclatura vale para cada intervalo de classe da distribuição).

Quanto ao PONTO MÉDIO (xi) de cada intervalo, basta somar os dois limites de classe e dividir por 2 (sempre); no nosso exemplo, como o intervalo é pequeno, é so pegar o número que está exatamente entre 15 e 17, que dizer, o 16; este é o ponto médio da primeira classe.

Para evitar fazer um monte de contas, basta lembrar que a amplitude do intervalo (neste caso) é 2 (vimos que h = 2 em nossa tabela) e adiciona-la ao ponto médio inicial; esse procedimento nos dará todos os pontos médios das classes seguintes (quer dizer, x2, x3, etc).

Por fim a tabela com os pontos médios.
i
Idades
xi
fi
1
15 a 17
16
9
2
17 a 19
18
12
3
19 a 21
20
7
4
21 a 23
22
7
5
23 a 25
24
4
6
25 a 27
26
1

TOTAL

40

Em nossa próxima conversa falaremos sobre tipos de frequências; nos vemos lá.

Estatística, texto 2.




Nenhum comentário:

Postar um comentário