| |
Freqüència absoluta d'un valor d'una variable en una sèrie estadística és el nombre de vegades que apareix aquest valor en la sèrie.
Freqüència relativa
d'un valor d'una variable en una sèrie estadística és la proporció de
vegades, referida al total de dades de la sèrie, que apareix aquest
valor en la sèrie. S'obté dividint la freqüència absoluta pel nombre
total de valors i es pot expressar en tant per u o en tant per cent.
Una distribució estadística
és una taula on s'aparellen els valors d'una variable estadística i les
freqüències respectives. Normalment, aquesta taula té tres columnes amb
els valors de la variable (que s'indiquen amb xi), les freqüències absolutes (que s'indiquen amb ni) i les freqüències relatives (que s'indiquen amb fi). Aquesta taula constitueix les dades passades a net.
Exemple 1:
Les qualificacions de francès d'un grup d'alumnes han estat les següents:
1 |
7 |
9 |
2 |
5 |
4 |
4 |
3 |
7 |
8 |
4 |
5 |
6 |
7 |
6 |
4 |
3 |
1 |
5 |
9 |
2 |
6 |
4 |
6 |
5 |
2 |
2 |
8 |
3 |
6 |
4 |
5 |
2 |
4 |
3 |
5 |
6 |
5 |
2 |
4 |
Dades en brut
Si a la sèrie estadística anterior comptem el nombre de zeros, d'uns,
de dosos, de tresos, etc ..., podem omplir la columna de les
freqüències absolutes ni.
Si sumen la columna ni obtenim la mida de la població (40, que és el nombre d'alumnes).
Finalment, si anem dividint les freqüències absolutes per 40, podem omplir la columna de les freqüències relatives fi.
Observeu que, al estar les freqüències relatives donades en tant per u, la seva suma és 1.
|
Qualif.
xi |
Freq. abs.
ni |
Freq. rel.
fi |
0 |
0 |
0 |
1 |
2 |
0,05 |
2 |
6 |
0,15 |
3 |
4 |
0,1 |
4 |
8 |
0,2 |
5 |
7 |
0,175 |
6 |
6 |
0,15 |
7 |
3 |
0,075 |
8 |
2 |
0,05 |
9 |
2 |
0,05 |
10 |
0 |
0 |
Totals: |
40 |
1 |
Dades passades a net |
|
|
Els
exemples anteriors són casos en que la variable estadística és discreta
i, a més a més, el nombre de valors que pren és reduït. Hi ha altres
situación en que la variable és contínua o bé discreta, però pren un
nombre de valors molt gran. En aquests casos seria embarassós,
impossible o inútil fer taules de freqüències on apereguessin tots els
valors de la variable.
Per a variables contínues o discretes que prenen un nombre de valors molt gran s'agrupen les dades en els anomenats intervals o classes. Explicarem aquesta tècnica amb un exemple.
Exemple 1:
En
una fàbrica de cotxes, una determinada peça es fabrica automàticament
amb una màquina. Les longituds en mil·límetres de 100 peces fabricades
en una setmana són:
20.52 |
.50 |
.48 |
.51 |
.49 |
.52 |
.45 |
.49 |
.48 |
.45 |
|
.43 |
.53 |
.53 |
.51 |
.48 |
.50 |
.52 |
.47 |
.53 |
.55 |
.46 |
.53 |
.53 |
.57 |
.46 |
.52 |
.56 |
.51 |
.48 |
.48 |
.55 |
.47 |
.47 |
.53 |
.50 |
.50 |
.46 |
.52 |
.49 |
.47 |
.51 |
.49 |
.54 |
.49 |
.53 |
.53 |
.47 |
.50 |
.51 |
.49 |
.46 |
.46 |
.50 |
.47 |
.49 |
.50 |
.52 |
.59 |
.46 |
.50 |
.48 |
.52 |
.44 |
.50 |
.56 |
.51 |
.53 |
.57 |
.47 |
.47 |
.54 |
.49 |
.45 |
.49 |
.46 |
.45 |
.51 |
.42 |
.49 |
.45 |
.52 |
.48 |
.51 |
.47 |
.51 |
.50 |
.55 |
.44 |
.54 |
.50 |
.46 |
.49 |
.45 |
.54 |
.50 |
.54 |
.57 |
.53 |
.47 |
.50 |
Dades
en brut
(La part entera és sempre 20; per això, hem omitit el 20 a totes les dades excepte a la 1a)
En primer lloc, s'ha d'esbrinar quin és el valor més petit i quin és el
valor més gran en aquesta sèrie de dades. El més petit és 20,42 mm i el
més gran, 20,59 mm, per tant, totes les dades estan en l'interval
[20,42 , 20,59]. Arrodonirem una mica els extrems d'aquest interval i
treballarem en l'interval [20,4 , 20,6].
El segon pas és dividir aquest interval [20,4 , 20,6] en subintervals.
La longitud de l'interval és 20,6 - 20,4 = 0,2 mm i nosaltres el
dividirem en 10 subintervals; cada subinterval tindra una longitud:
Aleshores:
- El 1r subinterval comença en 20,4 i acaba en 20,42.
En aquest subinterval, que indicarem [20,4 , 20,42[, comptabilitzarem tots els valors de la variable més grans o iguals que 20,4 i més petits que 20,42. Observeu que no n'hi ha cap (el 20,42 s'ha d'excloure d'aquest interval, formarà part de l'interval següent) i la freqüència absoluta en aquest interval serà 0.
D'altra banda, es defineix el punt central del subinterval, que és 20,41, com a representatiu de tot el subinterval i se l'anomena marca de classe.
- El 2n subinterval comença en 20,42 i acaba en 20,44 i l'indicarem [20,42 , 20,44[.
En ell comptabilitzarem tots els valors més grans o iguals que 20,42 i
més petits que 20,44. N'hi ha 2 (un 20,42 i un 20,43) i la freqüència
absoluta serà 2.
La marca de classe d'aquest subinterval serà 20,43.
- El 3r subinterval comença en 20,44 i acaba en 20,46 i l'indicarem [20,44 , 20,46[.
En ell comptabilitzarem tots els valors més grans o iguals que 20,44 i
més petits que 20,46. N'hi ha 8 (dos 20,44 i sis 20,45) i la freqüència
absoluta serà 8.
La marca de classe d'aquest subinterval serà 20,45.
- Procedirem així successivament fins a arribar al 10è interval que començarà en 20,58 i acabarà en 20,6 i l'indicarem [20,58 , 20,6[.
En ell comptabilitzarem tots els valors més grans o iguals que 20,58 i
més petits que 20,6. Només n'hi ha 1 (un 20,59) i la freqüència
absoluta serà 1.
La marca de classe d'aquest subinterval serà 20,59.
Per aquest procediment, haurem obtingut aquesta taula de freqüències:
INTERVAL CLASSE |
MARCA DE CLASSE
xi
|
F. ABSOLUTA
ni
|
F. RELATIVA
fi
|
[20,.4 , 20,42[ |
20,41 |
0 |
0 |
[20,42 , 20,44[ |
20,43 |
2 |
0,02 |
[20,44 , 20,46[ |
20,45 |
8 |
0,08 |
[20,46 , 20,48[ |
20,47 |
18 |
0,18 |
[20,48 , 20,5[ |
20,49 |
18 |
0,18 |
[20,5 , 20,52[ |
20,51 |
22 |
0,22 |
[20,.52 , 20,54[ |
20,53 |
18 |
0,18 |
[20,54 , 20,56[ |
20,55 |
8 |
0,08 |
[20,56 , 20,58[ |
20,57 |
5 |
0,05 |
[20,58 , 20,6[ |
20,59 |
1 |
0,01 |
TOTALS: |
|
100 |
1 |
Dades passades a net
a la que podríem afegir columnes amb freqüències acumulades.
Exemple 2:
Els pesos d'un grup de 30 estudiants són els següents:
56
|
64
|
62
|
74
|
84 |
66
|
76
|
78
|
74
|
83 |
75
|
73
|
82
|
80
|
88 |
52
|
74
|
96
|
82
|
74 |
92
|
54
|
74
|
76
|
80 |
87
|
97
|
82
|
72
|
69 |
Dades en brut | |
|