Quando queremos organizar os
dados por meio de INTERVALOS ou CLASSES (quer dizer, quando queremos montar uma
distribuição de frequência) surgem as perguntas:
- Quantas classes eu devo ter?
- Qual deve ser a amplitude de
cada classe?
- Quais os limites dos intervalos
de classe?
Para determinar o número de
classes (i) de uma distribuição podemos usar a regra de Sturges, que dá o
número de classes em função da quantidade de dados que temos disponíveis.
Vamos aplicar a regra a partir da
tabela que obtivemos em nossa conversa anterior:
IDADE
|
FREQUÊNCIA
|
15
|
3
|
16
|
6
|
17
|
8
|
18
|
4
|
19
|
5
|
20
|
2
|
21
|
4
|
22
|
3
|
23
|
3
|
24
|
1
|
25
|
1
|
TOTAL
|
40
|
Perceba que o número de valores
da variável é 40; a partir dessa informação, para calcular o número (i) de
intervalos faça o seguinte:
- Calcule o logaritmo decimal de 40 e obtenha aproximadamente 1,6;
- Multiplique esse valor por 3,3 (sempre); neste caso, você terá
5,28;
- Ao valor obtido, acrescente 1 (sempre); neste caso, você terá 6,28
(ou seja, “i” aproximadamente igual a 6,28).
É fácil perceber que o número de
classes é um número natural; portanto, o valor acima nos leva a concluir que nossa distribuição deve ter 6 ou 7
classes (ou seja, i = 6 ou i = 7).
Para saber a amplitude (h) de cada um desses 6 ou 7 intervalos,
vamos fazer o seguinte:
- Calcule a amplitude amostral
(na nossa tabela, AA = 25 – 15 = 10 anos);
- Divida esse valor pelo “i”
escolhido e já arredondado (quer dizer: 6 ou 7);
- Se der um resultado decimal, arredonde para mais.
Da tabela acima, perceba que se
escolhermos i = 6 teremos h = 1,6; se escolhermos i = 7 termos h = 1,4 (ambos
valores decimais e aproximados); o arredondamento para h = 2 é mais
aconselhável; portanto, usaremos i = 6.
Para escolher quais os limites dos intervalos de classe é
importante considerar aqueles que lhe permitirão obter, sempre que possível,
valores NATURAIS para os pontos médios (quer dizer, valores não decimais).
Na nossa tabela, sendo que
usaremos i = 6 classes e h = 2 anos, podemos nos dar ao luxo de começar mesmo
por 15 e terminar o último intervalo com 27, mesmo que essa idade não esteja
nos dados originais.
A nova tabela ficará assim:
i (número de classes)
|
Idades (intervalos)
|
fi (frequência simples ou absoluta de
cada classe)
|
1
|
15 a 17 (sem incluir o 17)
|
9
|
2
|
17 a 19 (sem incluir o 19)
|
12
|
3
|
19 a 21 (sem incluir o 21)
|
7
|
4
|
21 a 23 (sem incluir o 23)
|
7
|
5
|
23 a 25 (sem incluir o 25)
|
4
|
6
|
25 a 27 (sem incluir o 27)
|
1
|
TOTAL
|
40 alunos
|
É claro que você não precisa
explicar na tabela o que significa o “i” e nem o “fi”; eu o fiz para deixar
tudo mais claro.
Importante lembrar (como com
certeza você já sabe) que na tabela não escrevemos (como eu fiz) “15 a 17 (sem
incluir o 17)”; usamos somente o símbolo “˫” e teremos algo como “15 ˫ 17”, o
que dispensa a explicação “sem incluir o 17”.
Perceba que na primeira linha da
tabela temos i = 1 (quer dizer, a primeira classe ou a classe de número 1), o
intervalo 15 ˫ 17 e f1 = 9 (ou seja, há nove alunos de 15 a 17 anos,
sem contar os que tem exatamente 17 anos).
Para encontrar o valor f1
= 9 você deve ir a tabela principal e conferir a frequência dos alunos que tem
15 anos (3 alunos) e dos que tem 16 anos (6 alunos); não conte os que tem 17
anos; estes só entrarão no intervalo seguinte.
(obs: usei f1 = 9 e
não fi = 9, porque na primeira linha i = 1, logo fi é o f1).
Siga um procedimento semelhante e
encontrará as frequências de todos os demais intervalos.
Outra coisa que precisamos
lembrar é que, no intervalo “15 ˫ 17” (por exemplo) os números 15 e 17 são os limites de classe (sendo 15 o limite inferior e 17 o limite superior; a mesma nomenclatura
vale para cada intervalo de classe da distribuição).
Quanto ao PONTO MÉDIO (xi) de cada intervalo, basta somar os dois limites de classe e dividir por 2 (sempre); no nosso
exemplo, como o intervalo é pequeno, é so pegar o número que está exatamente
entre 15 e 17, que dizer, o 16; este é o ponto médio da primeira classe.
Para evitar fazer um monte de
contas, basta lembrar que a amplitude do intervalo (neste caso) é 2 (vimos que
h = 2 em nossa tabela) e adiciona-la ao ponto médio inicial; esse procedimento nos
dará todos os pontos médios das classes seguintes (quer dizer, x2, x3,
etc).
Por fim a tabela com os pontos médios.
i
|
Idades
|
xi
|
fi
|
1
|
15 a 17
|
16
|
9
|
2
|
17 a 19
|
18
|
12
|
3
|
19 a 21
|
20
|
7
|
4
|
21 a 23
|
22
|
7
|
5
|
23 a 25
|
24
|
4
|
6
|
25 a 27
|
26
|
1
|
TOTAL
|
40
|
Em nossa próxima conversa
falaremos sobre tipos de frequências; nos vemos lá.
Estatística, texto 2.
Nenhum comentário:
Postar um comentário