Conceptes bàsics d'estadística

Les grans quantitats de dades i nombres que ens informen sobre un col·lectiu són en si mateixes poc transparents i sovint atordidores. Necessitem eines per processar-les i fer-les més entenedores, i aquestes eines ens les proporciona l’estadística.

L’estadística és la part de les matemàtiques que s’ocupa de recollir, organitzar i analitzar grans quantitats de dades per estudiar les característiques o el comportament d’un col·lectiu.

Conceptes bàsics

En qualsevol estudi estadístic apareixen els conceptes bàsics següents:

  • Població i individu
  • Variable
  • Mostra
  • Estadística descriptiva i estadística inferencial
  • Estadístics i paràmetres

Població i individu

Dos dels conceptes bàsics en estadística són els de població i individu.

Població o univers: és el conjunt format per tots els elements respecte als quals desitgem obtenir una informació.

Individu: és qualsevol unitat elemental de la població.

Exemple de població i individu

Si es desitja fer un estudi estadístic de tots els alumnes matriculats al cicle formatiu de prevenció de riscos professionals a la FP oberta:

  • La població són tots els alumnes matriculats al cicle formatiu.
  • Els individus són cada un d’aquests alumnes.

Variable

Un altre concepte bàsic de l’estadística és el de variable.

Cadascuna de les característiques que volem mesurar sobre els individus s’anomena variable.

Exemple de variable

Si es desitja fer un estudi estadístic de tots els alumnes matriculats al cicle formatiu de prevenció de riscos professionals a la FP oberta, un exemple de variable és l’edat d’aquests alumnes.

Les variables poden ser:

  1. Quantitatives o numèriques:
    • Contínues: entre dos valors qualssevol poden existir un nombre infinit de valors de la variable. Exemples: el pes, l’alçada, etc.
    • Discretes: entre dos valors qualssevol de la variable, només poden existir un nombre finit de valors de la variable. Exemple: nombre d’accidents, nombre de treballadors, etc.
  2. Qualitatives o atributs: corresponen a variables que no es poden mesurar numèricament. Exemple: el color.

Mostra

Grandària de la mostra

Quan la grandària de la població és petita, es pot obtenir informació de tots els individus de la població i, per tant, la mostra que s’estudia coincideix amb la població.

Sovint, resulta impossible o poc pràctic estudiar una variable en tots els individus de la població. En aquests casos, s’estudia una part de la població, que rep el nom de mostra.

La mostra es pot definir com un subconjunt representatiu de la població triat amb la finalitat d’obtenir informació sobre tot el conjunt de la població.

Exemples de mostra i població

Si es realitzen enquestes per conèixer la intenció de vot a les properes eleccions autonòmiques catalanes:

  • la mostra correspon a totes les persones enquestades.
  • la població correspon a tot el cens.

La representativitat de la mostra és el que garanteix que els resultats siguin generalitzables a tota la població.

Estadística descriptiva i estadística inferencial

L’estadística es pot dividir en dos grans blocs:

  • Estadística descriptiva: té com a objectiu dur a terme una anàlisi de les variables que s’estudien. S’encarrega de l’organització i representació de les dades i del càlcul dels paràmetres estadístics.
  • Estadística inferencial: a partir de les dades recollides en una mostra, pretén extreure conclusions per a una població més àmplia.

Estadístics i paràmetres

Els paràmetres són les característiques que defineixen una població. És un nombre fix, però habitualment no se’n coneix el valor. Exemple: l’alçada mitjana de tots els estudiants de cicles formatius de grau superior.

Estadístics són les característiques que defineixen una mostra. Un estadístic varia d’una mostra a una altra. Exemple: l’alçada mitjana dels vint-i-cinc alumnes d’una classe.

Organització de les dades

Una de les finalitats de l’estadística és resumir gran quantitat d’informació en pocs valors. La informació que s’obté d’una variable en una mostra és un nombre finit de dades sobre quin valor o característica té cada element de la mostra, i excepte quan la grandària de la mostra sigui molt petita, s’ha de resumir per poder extreure’n conclusions.

Freqüències

El primer i obligat pas en el resum de les dades és el simple recompte de les repeticions d’un mateix valor o característica. Això ens condueix al concepte fonamental de freqüència. Les freqüències permeten simplificar la complexitat de les dades de què es disposa.

  • Freqüència absoluta (fa): nombre de vegades que s’ha observat una classe o valor de la variable en tots els individus d’una mostra.
  • Freqüència absoluta acumulada (Fa): la freqüència absoluta corresponent a una classe o valor de la variable més la suma de totes les freqüències absolutes anteriors.
  • Freqüència relativa (fr): és el quocient entre la freqüència absoluta i el nombre total d’individus de la mostra, on N = nombre total d’individus de la mostra.
  • Freqüència relativa acumulada (Fr): la freqüència relativa corresponent a una classe o valor de la variable més la suma de totes les freqüències relatives anteriors.
  • Percentatge individual (%): és el quocient entre la freqüència absoluta i el nombre total d’individus de la mostra, multiplicat per cent. Es pot calcular, per tant, multiplicant per cent la freqüència relativa.

  • Percentatge acumulat (%a): el percentatge corresponent a una classe o valor de la variable més la suma de tots els percentatges anteriors.

Tenint en compte les definicions anteriors, es pot deduir que:

  • La suma de totes les freqüències absolutes ha de coincidir amb el nombre d’individus de la mostra (fa = N).
  • La freqüència absoluta acumulada corresponent a l’últim valor de la variable ha de coincidir amb el nombre total d’individus de la mostra.
  • La suma de totes les freqüències relatives és igual a 1.
  • La freqüència relativa acumulada corresponent a l’últim valor de la variable ha de ser igual a 1.
  • La suma de tots els percentatges individuals ha de ser igual a 100.
  • El percentatge acumulat corresponent a l’últim valor de la variable ha de ser igual a 100.

Taules de freqüències

Una taula o distribució de freqüències és una taula de dades on es representen les diferents classes o valors de la variable, amb les seves freqüències corresponents.

La distribució de freqüències és diferent segons el tipus de variable de la qual es tracti. En els exemples següents es mostra com es fa la distribució de freqüències per cada tipus de variable.

1) Exemple de distribució de freqüències per variables quantitatives discretes

Es pregunta el nombre de crèdits suspesos en una mostra de 28 alumnes i s’obtenen els resultats de la taula.

0 1 0 2 0 1 3 1 2 4 2 0 3 2
5 2 1 1 1 3 4 0 5 2 0 0 0 1

Primer pas: es distribueixen els alumnes segons el nombre de suspesos (taula).

Valor Nombre alumnes
0 I I I I I I I I
1 I I I I I I I
2 I I I I I I
3 I I I
4 II
5 II

Segon pas: es confecciona la taula de distribució de freqüències amb les següents columnes:

  1. Valor de la variable
  2. Freqüència absoluta (fa). Es fa un recompte per cada valor de la variable: Es comprova que la suma de totes les freqüències és igual al nombre de mostres:
  3. Freqüència absoluta acumulada (Fa). Es calcula sumant totes les freqüències absolutes anteriors: Es comprova que la Fa corresponent a l’últim valor de la variable coincideix amb el nombre total d’individus de la mostra: Fa = 285
  4. Freqüència relativa (fr). Es calcula dividint les freqüències absolutes entre el nombre total d’individus de la mostra (en aquest cas, 28). Es comprova que la suma de totes les freqüències relatives és igual a 1:
  5. Freqüència relativa acumulada (Fr). Es calcula sumant totes les freqüències relatives anteriors: Es comprova que la Fr corresponent a l’últim valor de la variable és igual a 1: Fr = 15
  6. Percentatge individual (%). Es calcula a partir de fr: Es comprova que la suma de tots els % és igual a 100:
  7. Percentatge acumulat (%a). Es calcula sumant tots els % anteriors: Es comprova que el %a corresponent a l’últim valor de la variable és igual a 100:

Així doncs, la taula és la que resulta del càlcul de les freqüències i percentatges.

0 8 8 0,29 0,29 29 29
1 7 15 0,25 0,54 25 54
2 6 21 0,21 0,75 21 75
3 3 24 0,11 0,86 11 86
4 2 26 0,07 0,93 7 93
5 2 28 0,07 1 7 100
Total 28 1,07 100

2) Exemple de distribució de freqüències per variables quantitatives contínues

S’elabora un estudi sobre l’alçada d’un determinat col·lectiu, a partir d’una mostra de 20 persones, i s’obtenen els resultats de la taula.

1,61 1,66 1,71 1,70 1,74 1,77 1,64
1,63 1,74 1,66 1,59 1,73 1,63 1,67
1,70 1,73 1,64 1,75 1,58 1,68

Quan es tracta d’una variable quantitativa discreta, però el nombre de valors és molt elevat, també s’agrupen els valors possibles en intervals.

Quan es treballa amb variables quantitatives contínues, els infinits valors possibles de la variable s’agrupen en intervals.

Hem de seguir el procés següent:

Primer pas: es calcula l’amplitud de la variable (A).
L’amplitud (A) és la diferència entre el valor màxim i el valor mínim que prenen les variables.

Segon pas: es decideix el nombre d’intervals (n) que desitgem. A l’exemple prenem n = 5.

Tercer pas: calculem l’amplitud de l’interval (h). Per fer-ho, dividim el recorregut entre el nombre d’intervals escollit. Com que en aquest cas els valors tenen dues xifres decimals, s’ha arrodonit l’amplitud de l’interval a 0,04.

Quart pas: es formen els intervals: Això significa que un individu amb alçada 1,58 entraria al primer interval, un amb 1,62 al segon interval, i així successivament.

Cinquè pas: es calcula la marca de classe de cada interval,
La marca de classe és el valor del punt mig de l’interval. Es calcula dividint per 2 la suma del límit inferior i el límit superior de l’interval:

etc.

Sisè pas: es confecciona la taula de distribució de freqüències (taula), tal com s’ha explicat en el cas de la variable quantitativa discreta.

Interval fa Fa fr Fr % %a
[1,58, 1,62) 1,60 3 3 0,15 0,15 15 15
[1,62, 1,66) 1,64 4 7 0,2 0,35 20 35
[1,66, 1,70) 1,68 4 11 0,2 0,55 20 55
[1,70, 1,74) 1,72 5 16 0,25 0,80 25 80
[1,74, 1,78) 1,76 4 20 0,2 1 20 100
Totals 20 1 100

S’ha de tenir en compte que:

  • Quan es tracta d’una variable quantitativa discreta, però amb un nombre de valors elevat, els valors possibles també es poden agrupar per intervals;
  • En estadística, a efectes de càlcul, es considera que a tots els individus compresos en un mateix interval els correspon el mateix valor, que és el de la marca de classe. Per exemple, les alçades compreses en el primer interval tenen els valors: 1,58, 1,59, 1,61, però se suposarà que tots tenen una alçada d’1,60, que és la marca de classe de l’interval. Tota agrupació en intervals suposa pèrdua d’informació, però l’error que es comet amb aquestes aproximacions es considera menyspreable.

3) Exemple de distribució de freqüències per variables qualitatives

S’estudien la quantitat de components venuts per una empresa a les diferents províncies catalanes i s’obtenen els resultats de la taula:

Província Components venuts
Barcelona 10.000
Girona 6.000
Tarragona 4.000
Lleida 5.000

En aquest cas, un cop fet el recompte de les dades, es confecciona la taula de freqüències (taula) igual que en els exemples anteriors.

Valor fa Fa fr Fr % %a
Barcelona 10.000 10.000 0,4 0,4 40 40
Girona 6.000 16.000 0,24 0,64 24 64
Tarragona 4.000 20.000 0,16 0,80 16 80
Lleida 5.000 25.000 0,2 1 20 100
Total 25.000 1 100

Representació de les dades

La informació continguda en les taules estadístiques es pot expressar mitjançant gràfics estadístics. La forma en la qual es distribueix una característica s’aprecia més fàcilment quan representem gràficament els resultats obtinguts.

Hi ha diferents formes de representació gràfica i, en cada cas, haurem d’escollir la més adient per a la comprensió de les dades:

  • Diagrama de barres
  • Histograma
  • Polígon de freqüències
  • Diagrama de freqüències acumulades
  • Diagrama de sectors, de pastís o ciclograma

Diagrama de barres

Els diagrames de barres són rectangles, un per cada classe o valor de la variable, separats entre ells. Les bases dels rectangles corresponen a les diferents classes o valors de la variable i la seva amplada pot ser qualsevol, sempre que no s’encavalquin els diferents rectangles. Les alçades són proporcionals a les freqüències de cada classe o valor. Les freqüències es poden expressar amb qualsevol dels paràmetres estudiats: fa, Fa, fr, Fr, % o %a.

S’utilitzen especialment per comparar dades qualitatives o quantitatives discretes.

En la figura es mostra un diagrama de barres amb la freqüència absoluta on es representa el nombre de germans que té cadascun dels alumnes d’una classe.

Figura Diagrama de barres expressat amb freqüències absolutes (fa)

En la figura es mostra un diagrama de barres expressat en tant per cent.

Figura Diagrama de barres en %

Histograma

L’histograma és un diagrama de barres en el qual les dades s’agrupen per intervals, de manera que la base de cada rectangle coincideix amb els límits reals de l’interval.

En la figura es mostra un histograma on es representa el nombre de persones que viuen en cadascun dels portals d’un barri.

Figura Histograma.

Polígon de freqüències

El polígon de freqüències és una línia que uneix els punts mitjans dels costats superiors dels rectangles de l’histograma de freqüències.

Sobre l’histograma de la figura es pot veure el polígon de freqüències corresponent (figura).

Figura Polígon de freqüències

Diagrama de freqüències acumulades

En aquest cas, les freqüències que es representen són les acumulades (absolutes, relatives o %) i la línia uneix els límits superiors de cada interval.

En la figura es pot veure un diagrama de freqüències acumulades on es representa l’edat de les persones que participen en una determinada enquesta.

Figura Diagrama de freqüències acumulades

Diagrama de sectors, de pastís o ciclograma

Es tracta d’una circumferència en la qual es reparteixen els 360º proporcionalment a les freqüències de cada valor o classe. Els graus corresponents a cada sector es poden calcular per una regla de tres:

Així,

o equivalentment:

En la figura es pot veure un diagrama de sectors.

Figura Diagrama de sectors
Font: INSHT

Mesures de centralització o de tendència central

Les mesures de centralització són valors típics o representatius d’un conjunt de dades. Tendeixen a situar-se al centre del conjunt de dades ordenades segons la seva magnitud.

D’entre les diferents mesures de centralització existents, les més comunes són la mitjana aritmètica, la mediana i la moda.

Mitjana aritmètica

La mitjana aritmètica es representa per:

És la mesura de centralització més representativa d’una distribució. Es pot definir com la suma de tots els valors d’una variable dividida pel nombre total d’individus de la mostra.

Per a valors individuals (sense agrupar) la mitjana es calcula:

Essent x1, x2, …, xN els valors individuals i N = nombre total d’individus de la mostra.

Exemple de càlcul d'una mitjana aritmètica

Les notes obtingudes per un alumne en els diferents exàmens d’un crèdit són: 4,5; 5; 6,4.

La nota mitjana d’aquest alumne en el crèdit és per tant:

Si les dades es troben agrupades amb les freqüències corresponents, la mitjana aritmètica es calcula:

Essent x1, x2, …, xN els valors individuals; fa1, fa2, fa3, …, faN la freqüència absoluta de cada valor i N = nombre total d’individus de la mostra.

Exemple de càlcul d'una mitjana aritmètica amb freqüències

Volem conèixer la mitjana dels gols que un determinat equip de futbol marca als partits jugats a casa. Per això, s’anoten els gols marcats en els dotze últims partits que ha jugat a casa i s’obtenen els resultats següents:

1, 2, 1, 2, 3, 4, 1, 2, 3, 3, 2, 4

En aquest cas, com que hi ha dades que es repeteixen, les agrupem:

Valor fa
1 3
2 4
3 3
4 2

Calculem la mitjana:

Si les dades s’agrupen per intervals, la mitjana es calcula utilitzant la marca de classe de l’interval.

Exemple de càlcul d'una mitjana aritmètica amb dades agrupades en intervals

Intervals fa
[0,2) 1 2
[2,4) 3 4
[4,6) 5 2
[6,8) 7 3
[8,10) 9 1

Moda

La moda és el valor més comú o, en altres paraules:

La moda (Mo) és aquell valor que es presenta amb major freqüència.

La moda és una mesura de centralització poc fiable, varia fàcilment en mostres extretes d’una mateixa població.

La moda no necessàriament ha de ser única. Es diu que una sèrie de valors és unimodal quan només té una moda i bimodal quan hi ha dos modes.

Exemple de càlcul de moda

Es calcula la moda de les distribucions següents:

a) 1, 2, 3, 3, 4, 4, 5,5, 5, 6, 6 Mo = 5
b) 1, 2, 2, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5 Mo = 2 i 4, es tracta d’una distribució bimodal
c) 1, 2, 3, 3, 4, 4, 4, 5, 5, 5, 6, 6 Mo = 4,5

Si les dades s’agrupen per intervals, la moda es considera la marca de classe de l’interval amb major freqüència.

Exemple de càlcul de moda amb dades agrupades en intervals

Intervals fa
[0,2) 1 2
[2,4) 3 4
[4,6) 5 2
[6,8) 7 3
[8,10) 9 1

Mo = 3

Mediana

La mediana és un valor més fiable que la moda, però de poca utilitat per a l’estadística inferencial.

Quan es disposa de valors individuals, aquests s’ordenen i la mediana és el valor al qual correspon la posició central.

La mediana (Me) és una mesura de centralització que deixa la meitat de les dades de la mostra a cada costat.

Exemple de càlcul de mediana

Suposem que disposem de les dades següents:

1, 4, 5 ,7 ,9 , 13, 15

Me = 7

Si hi ha dos valors centrals, la mediana correspon a la mitjana aritmètica entre aquests dos valors.

Exemple de càlcul de mediana amb dos valors centrals

1, 3, 4, 5, 6, 8, 9, 11, 14, 15

Si les dades es troben agrupades amb les freqüències corresponents, s’ha de veure en quina posició es trobarà el valor central.

Exemple de càlcul de mediana amb freqüències

Si disposem de la taula de valors següent:

Valor fa
1 3
2 4
3 3
4 5

En total hi ha 15 dades, la posició central és la vuitena:

Si calculem les Fa1 veiem que el valor que ocupa la posició 8 és el 3,

Fa1 = 3, és a dir, que a les posicions 1, 2 i 3 hi ha un 1.

Fa2 = 7, és a dir, que a les posicions 4, 5, 6 i 7 hi ha un 2.

Fa3 = 10, és a dir, que a les posicions 8, 9 i 10 hi ha un 3 i per tant:

Me = 3, tal com es pot comprovar si es posen les dades sense agrupar.

1, 1, 1, 2 ,2, 2, 2, 3, 3, 3, 4, 4, 4, 4, 4

Exemple de càlcul de mediana amb freqüències i dos valors centrals

Si disposem de la taula de valors següent:

Valor fa
1 3
2 3
3 4
4 4

En total hi ha 12 dades i, per tant, hi ha dos valors que ocupen la posició central:

Si calculem les Fa1, veiem que el valor que ocupa la posició 6 és el 2, i el valor que ocupa la posició 7 és el 3.

Si les dades es troben distribuïdes en intervals, es pot calcular a quin interval pertany la mediana i agafar com a mediana la marca de classe d’aquest interval.

Exemple de càlcul de mediana amb dades agrupades en intervals

Intervals fa
[0,2) 1 3
[2,4) 3 4
[4,6) 5 1
[6,8) 7 3
[8,10) 9 1

En total hi ha 12 dades i, per tant, hi ha dos valors que ocupen la posició central:

Si calculem les Fa1, veiem que els valors que ocupen les posicions 6 i 7 estan compresos a l’interval [2,4(. Per tant:

Aquesta forma de procedir ens dona un valor aproximat de la mediana.

La mitjana aritmètica ponderada

La mitjana aritmètica ponderada és una mesura de centralització que pretén tenir en compte el pes o la importància de cada valor respecte dels altres. Per calcular-la, s’associa a cada valor de la variable un coeficient segons aquest pes i s’utilitza la fórmula següent:

on p1, p2, p3, ….,pN són els pesos corresponents a cada valor de la variable.

Exemple de càlcul de la mitjana aritmètica ponderada

S’agafen quatre mostres consecutives de pólvores de talc de durada 2; 1,5; 2 i 1 hora, respectivament. Els resultats deduïts de les anàlisis dels filtres són 1,82 mg/m3; 0,5 mg/m3; 1,0 mg/m3 i 2,5 mg/m3. Quina és la mitjana aritmètica ponderada (amb el temps de mostreig) de les concentracions?

La mitjana geomètrica

Correspon a l’arrel enèsima del producte dels valors individuals.

Essent x1, x2, …, xN els valors individuals i N = nombre total d’individus de la mostra.

Exemple de càlcul de la mitjana geomètrica

Calcular la mitjana geomètrica dels valors següents: 3,5,6,9,10

Si els valors estan agrupats:

Essent x1, x2, …, x3 els valors individuals; fa1, fa2, fa3, …, faN la freqüència absoluta de cada valor i N = nombre total d’individus de la mostra.

Exemple de càlcul de la mitjana geomètrica amb freqüències

Calcular la mitjana geomètrica dels valors següents:

Valor fa
13 3
23 3
34 4
42 2

Mesures de dispersió

Les mesures de dispersió s’utilitzen per conèixer el grau d’allunyament de les dades. Les més comunes són el recorregut o rang, la desviació típica i la variància.

Recorregut o rang

El recorregut o rang (R) s’obté restant el valor màxim menys el valor mínim de la distribució.

Per exemple, el recorregut de la distribució de valors: 1, 2, 4, 5, 7, 9, 11, és:

En el cas de dades agrupades, es resta el límit superior de l’últim interval menys el límit inferior del primer interval.

Per exemple, donada una distribució de valors agrupada en els intervals següents: [2,4), [4,6), [6,8), [8,10).

El recorregut és:

Desviació típica

La desviació típica d’una mostra (S) es calcula utilitzant la fórmula següent:

on

  • N = nombre total de valors de la població
  • xi = cadascun dels valors individuals
  • = mitjana aritmètica dels valors

Exemple de càlcul de desviació típica

Calculem la desviació típica dels valors següents: 1, 5, 6, 12

1) Calculem la mitjana aritmètica:

2) Calculem la desviació entre cada valor individual i la mitjana aritmètica i l’elevem al quadrat:

xi (xi - )
1 (1 -6)2 = 25
5 (5 -6)2 = 1
6 (6 -6)2 = 0
12 (12 -6)2 = 36

3) Fem la mitjana d’aquestes diferències:

4) Calculem la desviació típica (S) fent l’arrel quadrada:

Quan les dades estan agrupades amb la seva freqüència corresponent, per calcular la desviació típica de la mostra s’utilitza la fórmula:

fai = freqüència absoluta de cadascun dels valors.

N = = nombre total de valors de la població, correspon a la suma de les freqüències.

xi= cadascun dels valors individuals.

= mitjana aritmètica dels valors.

Exemple de càlcul de desviació típica amb freqüències

Calculem la desviació típica de la distribució de valors següent:

xi fai
1 3
2 1
3 2
4 4
5 2

Calculem la mitjana aritmètica:

Calculem el producte:

Xi fai (x - )2 fai *(xi − X)2
1 3 (1 - 3,08)2 = 4,33 12,98
2 1 (2 - 3,08)2 = 1,17 1,17
3 2 (3 - 3,08)2 = 0,006 0,01
4 4 (4 - 3,08)2 = 0,85 3,39
5 2 (5 - 3,08)2 = 3,69 7,37
N = = 12

Quan les dades es troben agrupades en intervals, el procediment és el mateix, només cal calcular prèviament la marca de classe.

Exemple de càlcul de desviació típica amb dades agrupades en intervals

Intervals fa
[0,2) 1 2
[2,4) 3 4
[4,6) 5 2
[6,8) 7 3
[8,10) 9 1

Intervals fa
[0,2) 1 2 (1 -4,5)² = 12,25 24,5
[2,4) 3 4 (3 -4,5)² = 2,25 9
[4,6) 5 2 (5 -4,5)² = 0,25 0,5
[6,8) 7 3 (7 -4,5)² = 6,25 18,75
[8,10) 9 1 (9 -4,5)² = 20,25 20,25
N = = 12

La desviació típica d’una mostra (S) és una estimació de la desviació típica de la població ().

Com més gran és la grandària de la mostra, més s’aproxima S a .

Per corregir l’error que es produeix quan es treballa amb mostres petites (n < 30), a la pràctica s’utilitza la desviació típica estimada (), que es pot calcular amb la fórmula següent:

Variància

La variància és el quadrat de la desviació típica.

La variància d’una mostra és la desviació típica de la mostra al quadrat (S2). I per tant:

La variància d’una població és la desviació típica de la població al quadrat ().

Utilització de la calculadora

Molts dels càlculs de paràmetres i estadístics es poden simplificar amb la utilització de calculadores amb funcions estadístiques. Aquestes calculadores es poden reconèixer perquè tenen sota algunes tecles els símbols:

Les orientacions generals per al càlcul dels diferents paràmetres i estadístics utilitzant les opcions estadístiques de la calculadora són les següents:

Cada model de calculadora és diferent. Per calcular els paràmetres i estadístics amb la vostra, consulteu les seves instruccions.

  1. La calculadora ha d’estar en mode estadístic. Generalment, això s’indica amb la notació SD a la pantalla.
  2. Assegureu-vos que no hi ha valors acumulats. Per esborrar el que hi ha a la memòria, moltes vegades s’han de prémer les tecles INV + AC.
  3. Per introduir les dades, generalment, es fa de la forma següent:
    1. S’introdueix la primera dada, es prem la tecla X, s’introdueix la primera freqüència i després es prem la tecla DATA.
    2. S’introdueix la segona dada, es prem la tecla X, s’introdueix la segona freqüència i després es prem la tecla DATA.
    3. I així es van introduint successivament totes les dades.
  4. Un cop introduïdes les dades, per obtenir els paràmetres o estadístics només cal prémer la tecla corresponent:

S’ha de tenir en compte que els valors calculats () correspondran a o a S, depenent de si els valors introduïts corresponen a tota la població o a una mostra.

Els valors de correspondran a la desviació típica estimada de la població.

Full de càlcul

Molts dels estadístics necessaris es poden calcular mitjançant el full de càlcul. Aquesta eina és molt útil tant per a operacions matemàtiques com per al càlcul d’estadístics. Abans d’utilizar el full de càlcul, cal plantejar-se el tipus de programari a utilitzar.

Actualment es poden trobar:

  • Programari lliure: paquet d’ofimàtica del LibreOffice Calc
  • Programari privatiu: paquets d’ofimàtica de Microsoft o Apple, Excel i Numbers, respectivament.

Abans d’instal·lar el full de càlcul s’ha de comprovar que l’equip té els requeriments tècnics per fer-ho. Per instal·lar el programari lliure accediu a les pàgines següents:

Aplicacions del fulls de càcul

Actualment totes les versions de full de càlcul tenen la seva aplicació.

El LibreOffice desa per defecte els fitxers del full de càlcul o llibres, amb extensió ODS.

En obrir un full de càlcul Calc, apareix la següent imatge (figura):

Figura Full de càlcul nou

Aquesta finestra té tres parts:

  • Barra d’eines: té per finalitat donar accés a les icones principals. Té diferents parts: estàndard, formatació, barra de fórmules i barra de dibuix. L’estàndard dona algunes opcions a tots els menús.
  • Barra de menús: es troba a la part superior i dona accés als apartats de Fitxer, Edita, Visualitza, Insereix, Format, Eines, Dades, Finestra i Ajuda.
  • Barra de tasques: és al final de tot de la finestra, i dona informació sobre el full de càlcul actiu: numeració del full, estil… i càlculs sobre les cel·les seleccionades (es poden canviar prement amb el botó dret del ratolí). També conté una barra de desplaçament per seleccionar l’escala de visualització del full.

El full de càlcul s’organtiza en files (1,2,3,…) i columnes (A, B, C,…). La intersecció de files i columnes s’anomena cel·la. Per exemple, en la figura la cel·la és la intersecció de la columna A i la fila 1, per tant, li correspon el nom de cel·la A1.

Files i columnes

L’usuari pot modificar l’amplada de les columnes o l’alçada de les files, situant el cursor al principi de les columnes o files i arrossegant la línia (vegeu figura).

Figura Amplada de les columnes

Si a la capçalera feu doble clic sobre la línia, la columna automàticament s’adapta a l’amplada òptima, la de la cel·la més plena. El mateix passa amb les files, que s’ajusten a l’alçada òptima.

També es pot modificar l’amplada de la columna i l’alçada de fila seleccionada a través dels menús Format> Columna (vegeu figura) i Format> Fila (vegeu figura).

Figura Modificació de l’amplada de la columna
Figura Modificació de l’alçada de la fila

Fórmules

Una de les funcions principals del full de càlcul són les seves fórmules i la capacitat de fer càlculs automàtics. Tots els fulls de càlcul compten amb moltes funcions: matemàtiques, estadístiques, bases de dades, etc. En aquest apartat es tracten les funcions bàsiques per al càlcul d’estadístics bàsics.

Per poder fer operacions, sempre cal posar abans el signe =. Hi ha dues maneres de fer-ho:

  1. Fórmules amb nombres: introduïu dins una cel·la una operació qualsevol (per exemple, =2+5) i feu un clic a la tecla Retorn per veure’n el resultat.
  2. Fórmules amb cel·les: hi ha dues opcions:
    • Auxiliar de funcions: activeu la icona funció de la barra i busqueu la fórmula que vulgueu. Per exemple, si voleu fer una suma podeu activar la funció suma (vegeu figura).
Figura Funció suma
  • Escriviu la fórmula directament: introduïu un valor a la cel·la A1 i un altre a la cel·la B1. A la cel·la C1, introduïu la fórmula =A1+B1 i feu un clic a la tecla de Retorn (vegeu figura).
Figura Introducció manual de la fórmula

Les fórmules fan càlculs amb els valors introduïts a les cel·les. Si es canvia el valor d’una cel·la, canvia automàticament el resultat de l’operació, que es mostra a una altra cel·la.

Fórmules més importants per al càlcul d'estadístics

Per al càlcul d’estadístics, podem fer servir diferents assistents.

Assistent per la funció màxim

L’assistent de càlcul per a la funció màxim serveix per calcular el màxim d’un rang de nombres. Per activar-lo cal anar a l’assistent de les funcions i buscar la funció MAX. Quan demani el rang de nombre, cal inserir el rang correcte (vegeu figura).

Figura Funció per calcular el nombre màxim d’una matriu de nombres

Assistent per a la funció mínim

L’assistent de càlcul per a la funció mínim serveix per calcular el valor mínim d’un rang de nombres. Per activar-la cal anar a l’assistent de funcions i seleccionar la funció MIN. Un cop a la funció, es pot entrar nombre a nombre o entrar tot el rang (vegeu figura).

Figura Funció per calcular el nombre mínim d’una matriu de nombres

Assistent per al càlcul de la moda

El càlcul de la moda serveix per calcular la moda d’una matriu de nombres. Per activar aquesta funció cal anar a l’assistent de funcions i seleccionar la funció MODA. Un cop a la funció, es pot entrar nombre a nombre o entrar tot el rang (vegeu figura).

Figura Funció per calcular la moda

Assistent per al càlcul de la mitjana

El càlcul de la mitjana serveix per calcular la mitjana aritmètica d’un conjunt de nombres. Per activar-la cal anar a l’assistent de funcions i seleccionar la funció MITJANA. Un cop a la funció, es pot entrar nombre a nombre o entrar tot el rang (vegeu figura).

Figura Funció per calcular la mitjana

Assistent per al càlcul de la mediana

El càlcul de la mediana serveix per calcular la mediana d’un conjunt de nombres. Per activar-la cal anar a l’assistent de funcions i seleccionar la funció MEDIANA. Un cop a la funció, es poden entrar els nombres un a un o bé entrar tot el grup (vegeu figura)

Figura Funció per calcular la mediana

Assistent per al càlcul del rang

El càlcul del rang serveix per calcular el rang d’un conjunt de nombres. Per activar-lo, cal anar a l’assitent de funcions i seleccionar la funció RANG. Un cop a la funció, es pot entrar els nombres un a un o bé entrar tot el grup (vegeu figura).

Figura Funció per calcular el rang

Assistent per la funció de freqüència

L’assistent per al càlcul de la freqüència serveix per calcular la freqüència tant d’un grup de nombres com de dades agrupades per intervals.

Per a aquest segon cas, un cop fets els intervals, i una matriu amb l’últim nombre de l’interval. Per exemple: per a intervals (0,5) (5,10)( 10,15), cal tenir una matriu 5, 10, 15.

La funció de freqüència s’activa per l’assistent de funcions. Un cop a l’assistent, cal seleccionar la funció (vegeu figura).

Figura Funció per calcular la freqüència

Assistent per al càlcul de la funció de potència

La funció de potència serveix per calcular la potència d’un nombre, una suma de nombres, una resta de nombres, etc. S’activa per l’assistent de funcions. Un cop seleccionada la funció, cal col·locar el nombre o la funció a dates a Base i a Exponencial la potència (vegeu figura).

Figura Funció per calcular la potència

Assistent per a la funció d'arrel quadrada

La funció d’arrel quadrada serveix per calcular l’arrel quadrada d’un nombre o d’una operació matemàtica. S’activa per l’assistent de funcions i seleccionant RAIZ. Un cop seleccionada, demana la cel·la on hi ha el nombre i en calcula l’arrel quadrada (vegeu figura).

Figura Funció per calcular l’arrel quadrada

Assistent per a la funció de desviació típica

La desviació típica serveix per calcular la desviació típica d’una matriu de dades. S’activa amb la funió DESVEST.S. Un cop seleccionada, demana les cel·les on hi ha les dades de les quals es vol calcular la desviació típica (vegeu figura).

Figura Funció per calcular la desviació típica

Assistent per al càlcul de la funció de variància

La funció de variància serveix per calcular la variància d’una matriu de dades. S’activa amb la funió VAR.S. Un cop seleccionada, demana les cel·les on hi ha les dades de les quals es vol calcular la variància (vegeu figura).

Figura Funció per calcular la variància

Diagrames

El full de càlcul permet obtenir diagrames dels resultats o dades utilitzades.

1. El primer pas per obtenir un diagrama és seleccionar les cel·les a inserir en el gràfic.

Selecció de cel·les que no són veïnes

Si voleu seleccionar cel·les que no són veïnes, utilitzeu la tecla Control per sumar. Per seleccionar tota una columna, feu clic sobre la lletra amb el seu nom.

El diagrama està vinculat al full de càlcul. Si canvieu de full, també canvia el diagrama.

2. A continuació, activeu la icona corresponent de la barra d’eines o aneu al menú Insereix>Diagrama. Per fer-ho, cal activar la icona diagrames del full de càlcul.

  • Icona diagrames del full de càlcul/-25
  • Icona diagrames del full de càlcul

3. Cal escollir el diagrama amb l’assistent següent (vegeu figura). Per defecte surt el primer diàleg, on es mostra el tipus de diagrama i apareix remarcat el diagrama que el programa ha fet per defecte. Si es vol canviar, cal seleccionar l’opció desitjada. Després es mostren les cel·les seleccionades.

Figura Escollir diagrames

Al segon diàleg, es mostren totes les cel·les seleccionades. Marqueu si voleu que les etiquetes que informen dels conceptes (nom dels continguts) siguin de la primera columna seleccionada, de la primera fila o les dues opcions alhora, i també si voleu la sèrie de dades en files o en columnes (vegeu figura).

Figura Interval de dades

4. Es poden suprimir sèries o afegir sèries i indicar l’interval per a la categoria de l’eix (vegeu figura).

Figura Modificar la sèrie de dades

5. Finalment, només cal escriure el títol del gràfic i els títols dels eixos, col·locar la llegenda i disposar-ne la situació (vegeu figura).

Figura Modificació d’elements del diagrama

6. Ara ja només cal tornar enrere, continuar, endavant o finalitzar.

Canvi de format

Per canviar el format d’un diagrama, només cal situar-s’hi a sobre, fer un clic i veure els tiradors verds que indiquen que el diagrama es pot modificar.

Per canviar de lloc un diagrama, només cal situar-s’hi a sobre, fer un doble clic i veure diagrama envoltat d’un quadrat gris que indica que es pot modificar el diagrama. Si moveu el cursor lentament amb el ratolí sobre les diferents parts del gràfic, veureu com van sortint, en finestretes de fons groc, els noms d’aquestes parts:

  • Títol principal
  • Àrea del diagrama
  • Llegenda

Parts modificables

Les tres parts que es poden modificar són independents. Un cop seleccionades, es poden modificar a partir dels menús que surten en prémer el botó dret del ratolí.

Cadascuna d’aquestes parts és independent i pot ser modificada fent servir uns menús que surten en prémer el botó dret del ratolí, havent-les seleccionat prèviament. També es poden modificar les característiques del gràfic des de la barra de menús Insereix> Format.

Format i impressió del full de càlcul

Per donar format a la pàgina la manera més fàcil es treballar amb el mode de previsualització de la pàgina. Es pot seleccionar des del menú Format> Pàgina, on s’obre la finestra Estil de la pàgina: per defecte i permet configurar les opcions de la pàgina.

Des dels menús Arxiu> Configuració de la impressora i Arxiu> Imprimeix es poden acabar de configurar les propietats i les opcions d’impressió.

Anar a la pàgina anterior:
Exercicis d'autoavaluació
Anar a la pàgina següent:
Activitats