Matemàtiques IV . Lliurament 3   

3.4 Mesures de centralització  
 
 

  

  Dossier
 

 
Un objectiu de l'estadística és resumir grans quantitats de dades en uns pocs nombres que proporcionin una idea, el més aproximada possible, del comportament de tots els elements d'una població en relació amb la variable que estudiem.
Les mesures de centralització són uns d'aquests nombres i tenen per objectiu agrupar o centralitzar les dades de tota una població en un sol valor numèric, entorn del qual estan tots els valors.
 

  Moda, mitjana i mediana - Exemple introductori
  

 

La moda, la mitjana i la mediana són les tres mesures de centralització més usades. Les expliquem amb un exemple.

Exemple:

Els sous mensuals dels 24 treballadors d'un taller venen donats per la taula de freqüències absolutes següent:

Sous (€)
xi

Nombre de treballadors
ni

1000

2

1100

4

1200

6

1300

3

1400

2

1500

1

1600

2

1700

1

1800

1

1900

1

2000

1

 


a) Ens podem preguntar: quin és el sou més freqüent en aquest taller? Està clar que són 1200 €; aquest valor de la variable s'anomena moda de la distribució .

b) La següent pregunta que ens podríem fer és, si el total dels sous es repartís entre tot el personal de forma equitativa, quan cobraria cadascun?

Hem de començar per calcular els total dels sous. Per fer-ho, afegim a la taula de freqüències absolutes una columna on anem multiplicant cada sou xi pel nombre de treballadors ni que el cobren respectivament, és la columna xi·ni:

Sou
xi
Nombre de treballadors
ni
Sou · N. de treballadors
xi·ni
1000
2
2000
1100
4
4400
1200
6
7200
1300
3
3900
1400
2
2800
1500
1
1500
1600
2
3200
1700
1
1700
1800
1
1800
1900
1
1900
2000
1
2000
TOTAL:
24
32400

Sumant la columna xi·ni tenim que el total dels sous és 32400 €, que repartits de forma equitativa entre els 24 empleats, li correspondrien a cadascun, aquest valor s'anomena mitjana de la distribució.

c) La tercera pregunta que ens podem fer és: quin hauria de ser el sou d'un treballador perquè la meitat del personal del taller tingués un sou mes petit que el seu i l'altra meitat, on sou més gran que el seu?

Per respondre a aquesta pregunta tindrem en compte les freqüències absolutes acumulades, afegim doncs la columna corresponent Ni:

Sous (€)
xi

Nombre de treballadors
ni

Freqüències acumulades
Ni

 

1000

2

2

Meitat "pobre"

1100

4

6

1200

6

12

1300

3

15

Meitat "rica"

1400

2

17

1500

1

18

1600

2

20

1700

1

21

1800

1

22

1900

1

23

2000

1

24

A la taula s'observa que els 12 primers treballadors, la meitat dels 24, cobren menys de 1200 €, i els restants 12, l'altra meitat, cobren més de 1300 €. Per tant, un sou que complís la condició de estar "per sobre" del que cobren la meitat dels treballadors i "per sota" del que cobren l'altra meitat, seria un sou comprès entre 1200 i 1300 €, podem agafar la mitjana d'aquest dos valors i dir que seria de 1250 €. Aquest valor s'anomena mediana de la distribució.

  
 

 

  La moda
   

 

Donada una sèrie o distribució estadística, la moda és el valor de la variable estadística estudiada que té la freqüència més gran. Si els valors estan agrupats en classes, s'anomena classe modal aquella té la freqüència més gran.

Així, la moda de la distribució anterior és 1200 €, i la distribució de les peces de cotxe donada per classes (veure la pràctica 3.2):

INTERVAL CLASSE
MARCA DE CLASSE
xi
F. ABSOLUTA
ni
F. RELATIVA
fi
[20,4 , 20,42[
20,41
0
0
[20,42 , 20,44[
20,43
2
0,02
[20,44 , 20,46[
20,45
8
0,08
[20,46 , 20,48[
20,47
18
0,18
[20,48 , 20,5[
20,49
18
0,18
[20,5 , 20,52[
20,51
22
0,22
[20,52 , 20,54[
20,53
18
0,18
[20,54 , 20,56[
20,55
8
0,08
[20,56 , 20,58[
20,57
5
0,05
[20,58 , 20,6[
20,59
1
0,01
TOTALS:
 
100
1

té per classe modal la classe [20,5 , 20,52[.

Les modes o classes modals es corresponen amb els màxims del diagrames de barres, polígons de freqüències, histogrames, etc... i amb els sectors més grans dels diagrames de sectors.

Segons el tipus de distribució, pot ser que no hi hagi moda (si els valors no es repeteixen o hi ha poca variació entre ells) o que hi hagi més d'una moda (si hi ha vàries dades amb freqüències màximes); en aquest últim cas, es parla de distribucions bimodals, trimodals o multimodals.


Distribució sense moda

Distribució bimodal
  
 

 

  La mitjana
   

 

Donada una sèrie estadística quantitativa, la mitjana és la suma de tots els valors de la sèrie dividida per el nombre de dades de la sèrie. Si la sèrie estadística té N dades

x1, x2, x3, x4, .... , xN

la mitjana s'indica amb i es calcula amb la fórmula

on hem usat el símbol per indicar sumes, concretament, xi vol dir la suma
x1 + x2 + x3 + x4 + ... + xN. Si vols més informació sobre com expressar sumes usant aquest símbol, que és la lletra grega sigma majúscula, pots consultar l'enllaç El llenguatge dels sumatoris i la calculadora Wiris o bé aquest document.

Així és com es calcularia la mitjana si ens donen una sèrie estadística curta o llarga sense cap valor repetit, o amb pocs valors repetits. Per exemple, si ens diuen que les edats d'un equip de basquet són 18, 28, 26, 27, 25, 19, 31, 19, 24 i 26 anys i ens demanen calcular la mitjana, faríem:

Com que habitualment en estadística, les dades venen agrupades per freqüències, per fer la suma de totes elles, cal fer la suma de cada valor diferent xi multiplicat per la freqüència absoluta respectiva ni:

i dividir per n1 + n 2 + n 3 + n 4 + ... = ni, que equival a dividir pel nombre de dades N.

Per aplicar aquest segon procediment, cal afegir a la taula de freqüències una columna amb els productes xi·ni, sumar aquesta columna i dividir per N, tal com s'ha fet a l'exemple introductori per calcular la mitjana del sou dels treballadors del taller.

  
 

Exemple d'obtenció de la moda i de càlcul de la mitjana:

Ens hem entretingut a comptar quantes flors hi ha en cadascun dels rosers d’un jardí. Els resultats són representats en el diagrama següent. Observeu que en aquest diagrama, la freqüència absoluta és el nombre de rosers que tenen un determinat nombre de roses.

  Observeu-lo i, després, completeu la taula i responeu a les preguntes:

Nombre de roses xi
Nombre de rosers ni
Productes
xi·ni
1
2
2
3
4
5
20
5
6
7
21
8
9
10
Totals:


Moda (nombre de roses que apareixen a més rosers) =

Nombre total de roses =

Nombre total de rosers =

Mitjana aritmètica (nombre de roses per roser) =

 
   
Exercici 3.4.1
Copia les respostes de l'exemple anterior al teu dossier.
  
  La mediana
   

 

Donada una sèrie estadística quantitativa, la mediana és un valor de la variable que té la propietat de que la meitat de les dades de la sèrie són menors o iguals que ell i l'altra meitat són majors o iguals que ell. És a dir, suposant que la sèrie estadística s'ha ordenat en forma creixent, la mediana divideix la sèrie en dos parts del mateix nombre d'elements.

Treballant amb la sèrie sencera i ordenada, es poden donar dos casos:

  • Que la sèrie tingui un nombre senar d'elements. En aquest cas, sempre hi haurà un element central en la sèrie que serà la mediana.
    Exemple: els pesos en kg de cinc nois són
                                               61, 63, 67, 68, 70, 73 i 74
    Aquesta sèrie ordenada té 5 elements i l'element central és 68, aleshores, la mediana és 68 kg.

  • Que la sèrie tingui un nombre parell d'elements. Aleshores hi ha dos valors que delimiten una meitat i l'altra de la sèrie. També ara poden passar dos casos més:

    - Que aquests valors siguin iguals; aleshores, la mediana és qualsevol d'ells.
      Exemple: a la mateixa hora, en 10 llocs diferents d'un país s'han registrat les
      temperatures següents
                                      -7º, -1º, 3º, 4º, 8º, 9º, 9º, 10º, 12º, 13º, 15º i 23º
      La sèrie té 12 elements; els elements centrals són 9 i 9, iguals,  aleshores, la
      mediana és 9º.

    - Que aquests valors siguin diferents; en aquest cas, es defineix la mediana com
      la mitjana aritmètica d'aquests dos valors.
      Exemple. Si ordenem les edats en anys dels jugadors de basquet, tenim la sèrie
                                            18, 19, 19, 24, 25, 26, 26, 27, 28 i 31
      La sèrie té 10 elements; els elements centrals són 25 i 26, diferents, aleshores,
      la mediana és la mitjana aritmètica de 25 i 26, que és 25,5 anys.

Com que habitualment en estadística, les dades venen agrupades per freqüències, per calcular la mediana no val el procediment anterior; s'han d'usar les freqüències acumulades per, fixant-se en la columna de les freqüències acumulades, esbrinar fins on arriba la meitat de la població. Això és el que hem fet per calcular la mediana del sou dels treballadors del taller.

Et posem un altre exemple de càlcul de la mediana, ara amb dades en classes.

Exemple 1:

Una companyia d'assegurances de cotxes vol establir una pòlissa d'accidents a tot risc per a cotxes utilitaris. Per això, passa una enquesta a 1000 propietaris d'aquests cotxes escollits a l'atzar, en la qual pregunta quants diners han gastat l'any passat en reparacions d'accidents. Les dades obtingudes es resumeixen a la taula següent:

Diners gastats
en €
Marques
de classe xi
Nombre de
propietaris ni
Freqüència
acumulada Ni
[0 , 100[
50
160
160
[100 , 200[
150
145
305
[200 , 300[
250
120
425
[300 , 400[
350
112
537
[400 , 500[
450
106
643
[500 , 600[
550
97
740
[600 , 700[
650
72
812
[700 , 800[
750
50
862
[800 , 900[
850
37
899
[900 , 1000[
950
23
922
[1000 , 1100[
1050
18
940
[1100 , 1200[
1150
15
955
[1200 , 1300[
1250
12
967
[1300 , 1400[
1350
9
976
[1400 , 1500[
1450
7
983
[1500 , 1600[
1550
6
989
[1600 , 1700[
1650
4
993
[1700 , 1800[
1750
3
996
[1800 , 1900[
1850
2
998
[1900 , 2000[
1950
2
1000
Totals:
 
1000
 
 


Les dades que ens donen són les columnes marcades en groc, de les classes i de les freqüències per classe.

El primer que s'ha de fer és afegir les columnes de les marques de classe i de freqüències acumulades. També és aconsellable afegir la fila final dels totals (per assegurar-se que hi són tots, en són 1000).

Aleshores, a la columna de freqüències acumulades, s'observa que la meitat dels propietaris, 500, està en la classe [300 , 400[ de marca 350. La marca de classe d'aquest interval es pot prendre com a valor aproximat de la mediana, o sigui, Mediana = 350

Podem aproximar la mediana amb més precisió aplicant el teorema de Thales en els triangles rectangles de la figura adjunta (no ho demanarem en les proves de validació).

Observeu que el costat AB=100 és l'interval de classe [300,400[; el costat BC=112=537-425 és la freqüència absoluta de la classe [300,400[ ; el costat AD=x és el valor que hem d'afegir a 300 per obtenir la mediana que és el punt D; el costat DE=75 és la diferència entre la meitat de la població (500) i la freqüència absoluta acumulada de l'interval [200,300[, o sigui, 500-425=75

Els triangles ABC i ADE són semblants i apliquem la proporcionalitat entre els costats homòlegs:

   
  Exemple 2:

Consultat un grup alumnes d’una classe sobre el nombre de monedes que porten a sobre, sense tenir en compte el seu valor, s’ha obtingut:

7

9

2

5

7

4

9

3

2

6

1

6

7

3

7

6

9

5

5

7

3

2

4

3

6

8

  Es demana:

a) Ompliu la taula següent preparatòria per calcular la mediana i la mitjana:

Nombre de monedes que porten
xi
Freqüència absoluta
ni
Freqüència absoluta acumulada
Ni
Productes
xi·ni
Totals:
 

b) Quin valor pren la moda, la mediana i la mitjana?

Moda =

Mediana (amb un decimal) =

Mitjana (amb dos decimals) =

 
   

Exercici 3.4.2
Copia les respostes de l'Exemple 2 al teu dossier.
Exercici 3.4.3
Fes aquest exercici del dossier.
  
 
Amunt