Activitats

Anàlisi de dades quantitatives

L’objectiu d’aquesta activitat és treballar amb dades quantitatives de fonts secundàries per obtenir-ne informació.

Segons l’Estudi General de Mitjans els 8 diaris més llegits a tot Espanya en els períodes d’abril 2014 - març 2015 i abril 2015 - març 2016 eren els següents:

Diaris més llegits a Espanya (mitjans impresos, lectors per dia)
Publicació 14/15 15/16
Marca 2.398 2.306
El País 1.533 1.419
El Mundo 1.255 852
La Vanguardia 718 634
La Voz de Galicia 576 589
El Mundo Deportivo 559 508
El Periódico 545 489

Font: Estudi General de Mitjans (AIMC)

Accés a la informació de l'AIMC

A quines conclusions podeu arribar a partir d’aquesta comparativa? I quines accions poden emprendre els diaris segons aquests resultats?

En primer lloc podem fer un comparativa percentual entre els dos períodes analitzats.

Publicació Variació 14/16 (%)
Marca -3,84
El País -7,44
El Mundo -32,11
La Vanguardia -11,70
La Voz de Galicia 2,26
El Mundo Deportivo -9,12
El Periódico -10,28

Tots els diaris tenen una baixada considerable de lectors, excepte La Voz de Galicia, que incrementa els seus lectors en un 2,26%. El diari més afectat és El Mundo, que perd gairebé un terç dels seus lectors (-32,11%). El diari As és el que pateix menys el descens de lectors (-3,84%).

Segons aquests resultats i tenint en compte que hi ha dades de més períodes, es podria veure si aquesta baixada de lectors és un fet aïllat o bé si és una tendència constant i regular.

Si es tracta d’una baixada constant, els responsables d’aquests diaris s’haurien de plantejar les causes d’aquesta davallada, tot i que sembla evident que els mitjans digitals han tingut molta influència en aquesta situació, però caldria demostrar-ho amb l’estudi dels lectors que segueixen la premsa digital.

Adequació de la informació secundària

L’objectiu de l’activitat és valorar si la informació secundària obtinguda d’una determinada font és adequada i mereix confiança.

Suposem que voleu conèixer el perfil dels consumidors d’aliments ecològics per poder fer una acció promocional dirigida a diferents segments d’aquest mercat.

Mitjançant una cerca a través d’internet trobeu aquest estudi de mercat:

Estudi del perfil de consumidors d'aliments ecològics

  1. Creieu que es tracta d’un estudi de mercat fiable? Per què?
  2. En el cas que considereu que es tracta d’un estudi de mercat fiable, comenteu quina informació que es podria aprofitar per a l’objectiu plantejat. Justifiqueu la resposta.

1. Es tracta d’un estudi de confiança, ja que prové de dues fonts segures: l’empresa que ha desenvolupat l’estudi és GFK, una empresa líder en investigacions de mercats, i, d’altra banda, l’estudi va ser promogut pel Govern d’Espanya.

2. Es tracta d’un estudi de 2011. Per tant, tot i que pot ser vàlid cal contrastar les informacions amb altres fonts més actualitzades, perquè s’estudien els hàbits de consum, que evolucionen molt ràpidament.

Una informació molt interessant és la que té relació amb la segmentació del mercats. Aquest estudi analitza diferents perfils de consumidors:

  • Ecologista: mostra preocupació pel medi ambient i la tradueix en hàbits de consum responsables.
  • Des-implicat: mostra una actitud claudicant cap al canvi climàtic perquè és un procés inexorable sobre el qual poca cosa s’hi pot fer.
  • Convençut: és l’abanderat de la “causa ecològica” i mostra una actitud militant per defensar-la.
  • Preocupat per la salut: mostra un grau d’implicació més baix amb la problemàtica mediambiental i només es preocupa per la salut i el reciclatge.

Aquesta informació és clau ja que ens permet conèixer el perfil de diferents segments de mercat i les seves preferències davant dels productes ecològics. Aquesta segmentació pot ser la base per definir estratègies promocionals per a cada perfil de consumidor d’aliments ecològics, adaptant la promoció segons qui sigui el destinatari.

Tractament de dades massives

L’objectiu d’aquesta activitat és reflexionar sobre les conseqüències del big data a partir del fragment d’un article.

Llegiu el text següent:

Privacidad versus seguridad

“La combinación de los sistemas de videovigilancia y de reconocimiento facial con la minería de datos introduce un nuevo debate sobre la privacidad versus la seguridad. Reino Unido anunció el verano pasado que la policía del condado de Leicestershire iba a empezar a usar un nuevo software de reconocimiento facial llamado neoFace. El programa compara las imágenes de las caras captadas con las 92.000 de la base de datos de la policía en la región «con una elevada tasa de éxito». ¿De dónde proceden esas imágenes? De las cámaras de videovigilancia instaladas ya en «numerosos» rincones de las ciudades. Su presencia ha ocasionado acalorados debates sobre el derecho a la intimidad y a la anonimidad de los ciudadanos. También entra en juego el concepto de propiedad. «¿A quién pertenecen los datos que los gobiernos o empresas recogen de las personas?», plantea el informe de Future Trends Forum.”

Fragment de l’article "Así cambiará tu vida el big data en 11 ejemplos prácticos", de M. Climent i E. Mallol.

Reflexioneu sobre la privacitat de les dades recollides amb càmeres de videovigilància o qualsevol altre procediment (per exemple, un web on hem facilitat dades per donar-nos d’alta o fer un pagament a través de la xarxa).

La solució és oberta, per tant, totes les opinions raonades són possibles. A mode orientatiu, a continuació s’exposen algunes reflexions:

  1. Si amb el big data desapareix la nostra privacitat com a persones i funcionem com a simples números amb unes característiques determinades, a través de la nostra informació els governs i les empreses poden utilitzar les dades per al seu propi benefici.
  2. La utilització de dades massives o big data ens proporciona més seguretat, ja que el registre i anàlisi de les dades ens aporta prediccions, la qual cosa pot servir per ser més eficients en tots els àmbits (sanitat, educació, medi ambient…).
  3. Quant a la propietat de les dades, es planteja crear registres perquè cada persona disposi de les seves dades i així pugui preservar la seva intimitat.

Càlcul de freqüències

L’objectiu d’aquesta activitat és analitzar dades mitjançant el càlcul de freqüències.

Un fabricant de gelats que vol analitzar el consum setmanal de gelats entre joves de 12 a 18 anys, disposa de la informació següent:

Observació 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Nombre de gelats 2 4 3 1 5 3 2 1 3 2 3 2 1 3 4 2 0 1 2 3
Edat (anys) 14 13 13 18 12 15 16 17 14 15 13 14 18 14 12 15 17 7 15 13

Construïu les taules de distribució de freqüències absolutes, relatives i marginals.

Taula de distribució de freqüències absolutes:

Consum setmanal de gelats

Edat 0 1 2 3 4 5 Total
12 0 0 0 0 1 1 2
13 0 0 0 3 1 0 4
14 0 0 2 2 0 0 4
15 0 0 3 1 0 0 4
16 0 0 1 0 0 0 1
17 1 1 0 0 0 0 2
18 0 3 0 0 0 0 3
Total 1 4 6 6 2 1 20

En la taula de distribució de freqüències absolutes només cal ordenar les dades i fer-ne el recompte.

Taula de distribució de freqüències relatives i marginals:

Consum setmanal de gelats

Edat 0 1 2 3 4 5 Total
12 0 0 0 0 0,05 0,05 0,1
13 0 0 0 0,15 0,05 0 0,2
14 0 0 0,1 0,1 0 0 0,2
15 0 0 0,15 0,05 0 0 0,2
16 0 0 0,05 0 0 0 0,05
17 0,05 0,05 0 0 0 0 0,1
18 0 0,15 0 0 0 0 0,15
Total 0,05 0,2 0,3 0,3 0,1 0,05 1

En la taula de distribució de freqüències relatives i marginals cal fer la distribució calculant els tants per u, per tant, el total és 1. Les freqüències relatives són les que hi ha en el centre de la taula i les marginals, les que es hi ha als extrems (columna i fila de totals).

També es podria expressar en percentatges. En aquest cas, el total seria 100%.

Estudi de relacions entre dades

L’objectiu d’aquesta activitat és analitzar dades comercials mitjançant una taula de distribució de freqüències.

Un establiment comercial vol fer un estudi de les vendes que ha realitzat durant la primera hora d’obertura d’un dissabte.

Import dels tiquets de venda en euros
20,69 23,95 31,20 33,78 22,71
47,94 35,29 39,00 23,50 29,89
26,85 46,29 17,02 15,98 28,21
4,29 29,02 38,80 19,99 46,10
13,76 42,83 16,68 9,02 19,77
17,00 17,53 24,74 11,40 26,11
30,31 30,97 16,58 12,33 6,88
  1. Construïu una taula de distribució de freqüències absolutes utilitzant 5 classes d’igual interval, entre 0,01 i 50,00 euros.
  2. Calculeu la freqüència absoluta acumulada, la freqüència relativa i la freqüència relativa acumulada. Expresseu les freqüències relatives en percentatge.
  3. Interpreteu els resultats obtinguts a partir de la taula de distribució de freqüències.

1. La taula de distribució de freqüències absolutes és la següent:

Classes Freqüència absoluta (Fi)
0,01 - 10,00 3
10,01 - 20,00 11
20,01 - 30,00 10
30,01 - 40,00 7
40,01 - 50,00 4
Total 35

2. La taula de distribució de freqüències (absolutes, relatives i acumulades) és la següent:

Classes Freqüència
absoluta (Fi)
Freqüència absoluta
acumulada (Fa)
Freqüència
relativa (fi)
Freqüència relativa
acumulada (fa)
0,01 - 10,00 3 3 8,57 8,57
10,01 - 20,00 11 14 31,43 40,00
20,01 - 30,00 10 24 28,57 68,57
30,01 - 40,00 7 31 20,00 88,57
40,01 - 50,00 4 35 11,43 100,00
Total 35 100,00

La freqüència relativa es calcula a partir de la freqüència absoluta tenint en compte que 35 és el 100%. Per tant, 3 és el 8,57%, 11 és el 31,43%…

La freqüència acumulada és la suma d’una freqüència i la freqüència immediatament anterior.

3. Interpretació dels resultats

La representació de les dades d’una mostra utilitzant taules de freqüències aporta informació que es pot interpretar per poder prendre decisions estratègiques.

Per tal de millorar la lectura i interpretació de la taula de distribució de freqüències, com que les dades són quantitatives i hi ha molts valors diferents, s’utilitzen intervals per agrupar els valors de la variable estudiada (“classes”). Això permet fer una presentació més simplificada de la variable i contribueix a millorar-ne l’anàlisi.

Amb aquesta taula de distribució de freqüències podem observar el comportament de la variable “import dels tiquets de venda durant la primera hora d’obertura d’un dissabte” en aquest establiment:

  • El 31,43% de les compres que realitza la clientela és entre 10 i 20 euros.
  • El 28,57% de les compres que realitza la clientela és entre 20 i 30 euros.
  • El 20,00% de les compres que realitza la clientela és entre 30 i 40 euros.
  • L’11,43% de les compres que realitza la clientela és entre 40 i 50 euros.
  • El 8,57% de les compres que realitza la clientela és de menys de 10 euros.

Tota aquesta informació s’obté de les freqüències relatives (fi), que el que fan és calcular la proporció que representa cadascuna de les classes respecte del total (100%).

Si diem que 11 dels 35 clients han gastat entre 10 i 20 euros no aporta tanta informació com si diem que el 31,43% de la clientela fa compres d’entre 10 i 20 euros. Aquest percentatge dóna una idea més clara de la importància d’aquest grup de clients sobre el total.

Les freqüències relatives també es poden interpretar com a probabilitats que es produeixi un fenomen determinat. Per exemple, podem dir que hi ha un 31,43% de probabilitats que un client faci una compra d’entre 10 i 20 euros.

Si s’observen les freqüències relatives acumulades (fa), es pot observar com:

  • El 40% de la clientela realitza compres per un import inferior als 20 euros.
  • El 68,57% de la clientela realitza compres per un import inferior als 30 euros.
  • El 88,57% de la clientela realitza compres per un import inferior als 40 euros.

Les freqüències relatives acumulades mostren el percentatge de valors que se situen al mateix nivell o per sota d’un altre valor considerat. Si s’utilitzen intervals, aleshores la freqüència relativa acumulada mostra el percentatge de valors que són iguals o inferiors al límit superior de la classe o al límit inferior de la classe immediatament posterior.

Amb les dades de la freqüència relativa acumulada obtingudes, es pot observar que:

  • El 31,43% (100 – 68,57) de la clientela realitza compres per un import superior als 30 euros.
  • El 60% (100 – 40) de la clientela realitza compres per un import superior als 20 euros.

Com es pot comprovar, tota aquesta informació difícilment s’hauria pogut obtenir amb la simple observació de les dades. Per tant, les taules de freqüències ens permeten ordenar la informació obtinguda i extreure’n informació útil per a la presa de decisions.

Anàlisi de l'evolució de dades

L’objectiu d’aquesta activitat és analitzar l’evolució de dades a partir de nombres índex.

Es disposa de les dades de vehicles (turismes i motocicletes) a Catalunya següents:

Any Turismes Motocicletes Total
2000 2.850.226 408.060 3.258.286
2001 2.935.388 417.754 3.353.142
2002 2.998.346 425.002 3.423.348
2003 2.984.676 420.333 3.405.009
2004 3.089.787 443.115 3.532.902
2005 3.180.916 486.345 3.667.261
2006 3.192.024 532.312 3.724.336
2007 3.332.852 587.466 3.920.318
2008 3.370.338 623.903 3.994.241
2009 3.346.653 645.479 3.992.132
2010 3.355.779 666.714 4.022.493
2011 3.368.069 685.613 4.053.682
2012 3.359.732 696.763 4.056.495
2013 3.326.900 706.117 4.033.017
2014 3.309.596 723.258 4.032.854

Calculeu els nombres índex en base a l’any 2000 i expliqueu la informació que se’n pot obtenir.

Any Turismes Evolució Motocicletes Evolució Total Evolució
2000 2.850.226 1,000 408.060 1,000 3.258.286 1,000
2001 2.935.388 1,030 417.754 1,024 3.353.142 1,029
2002 2.998.346 1,052 425.002 1,042 3.423.348 1,051
2003 2.984.676 1,047 420.333 1,030 3.405.009 1,045
2004 3.089.787 1,084 443.115 1,086 3.532.902 1,084
2005 3.180.916 1,116 486.345 1,192 3.667.261 1,126
2006 3.192.024 1,120 532.312 1,304 3.724.336 1,143
2007 3.332.852 1,169 587.466 1,440 3.920.318 1,203
2008 3.370.338 1,182 623.903 1,529 3.994.241 1,226
2009 3.346.653 1,174 645.479 1,582 3.992.132 1,225
2010 3.355.779 1,177 666.714 1,634 4.022.493 1,235
2011 3.368.069 1,182 685.613 1,680 4.053.682 1,244
2012 3.359.732 1,179 696.763 1,708 4.056.495 1,245
2013 3.326.900 1,167 706.117 1,730 4.033.017 1,238
2014 3.309.596 1,161 723.258 1,772 4.032.854 1,238

Els nombres índex faciliten l’anàlisi de l’evolució de dades respecte a un any determinat, normalment el primer de la sèrie.

Per exemple, algunes qüestions que es poden observar fàcilment són:

  • Els anys 2008 i 2011 són els que registren un increment superior dels turismes, perquè són els que tenen el nombre índex més alt. En canvi, l’any 2003 és el que té un increment més baix.
  • L’any 2014 és el que registra un increment més gran de les motocicletes, perquè és l’any que té el nombre índex més alt. En canvi, l’any 2001 és el que té un increment més baix.
  • En el còmput total de turismes i motocicletes, l’any 2012 és el que té un increment més elevat i l’any 2001 el que té l’augment més petit.

Comparació de dades amb nombres índex

L’objectiu d’aquesta activitat és practicar el càlcul de la variació de dades utilitzant els nombres índex i interpretar els resultats obtinguts.

Compareu els beneficis en € d’aquestes dues empreses en termes relatius i traieu-ne conclusions:

Empresa 2011 2012 2013 2014 2015 2016
3P Sabateries 4.500 4.000 3.750 5.000 5.250 5.500
100 Peus Calçats 7.250 6.850 6.800 7.300 7.450 7.600

Evolució de beneficis:

Any 3P Sabateries
Euros
100 Peus Calçats
Euros
3P Sabateries
Variació %
100 Peus Calçats
Variació %
2011 4.500 7.250 0 0
2012 4.000 6.850 -11,11 -5,52
2013 3.800 6.800 -15,56 -6,21
2014 4.900 7.300 8,89 0,69
2015 5.250 7.450 16,67 2,76
2016 5.500 7.600 22,22 4,83

Els càlculs es fan prenent com a referència el primer any de la sèrie, és a dir, els beneficis de l’any 2011. Són els següents:

  • 2011:
    • (4.500 / 4.500) - 1 = 0
    • (7.250 / 7.250) - 1 = 0
  • 2012:
    • (4.000 / 4.500) - 1 = -0,11111 = -11,11%
    • (6.850 / 7.250) - 1 = 0,05517 = -5,52%
  • 2013:
    • (3.800 / 4.500) - 1 = -0,15555 = -15,56%
    • (6.800 / 7.250) - 1 = -0,06207 = -6,21%
  • Etc.

Conclusions:

L’evolució de l’empresa 3P Sabateries és millor, ja que la davallada de beneficis dels anys 2012 i 2013 queda compensada pels increments dels anys 2014, 2015 i 2016. En canvi, en l’empresa 100 Peus Calçats els increments de beneficis dels anys 2014, 2015 i 2016 no compensen les disminucions dels anys 2011 i 2012.

Anar a la pàgina següent:
Exercicis d'autoavaluació