Activitats

Anàlisi de dades amb R per a l'elaboració d'un informe

L’objectiu d’aquesta activitat és analitzar dades amb el programa estadístic R i per a l’elaboració d’un informe d’investigació comercial.

Disposeu del fitxer

transport.ods ( 13.5 KB )
que conté les dades recollides a través d’un qüestionari que s’ha fet a una mostra de 100 persones per determinar el tipus de transport que utilitzen amb més freqüència.

Per tal d’interpretar correctament les dades tingueu en compte que estan tabulades de la forma següent:

Variable Respostes
Edat Valor numèric
Sexe H = home
D = dona
Transport 1 = públic
2 = privat
Públic metro
bus
tren
taxi
altres

Importeu les dades del fitxer de dades al programa R i comproveu la consistència de les dades, és a dir, comproveu que no hi hagi cap incoherència. Per exemple, si la s’utilitza transport privat no pot haver-hi cap valor a la columna públic (perquè no té sentit si la resposta a la pregunta anterior és transport públic).

Seguint les pautes del material d’aquesta unitat i utilitzant el programa estadístic R, redacteu els apartats “Resultats” i “Conclusions” de l’informe d’investigació.

Incorporeu els gràfics que siguin necessaris per il·lustrar els resultats obtinguts.

És possible que us interessi obtenir la variable que expressa el tipus de transport públic en un valor numèric, en aquest cas, utilitzeu els valors següents: 1 = metro / 2 = bus / 3 = tren / 4 = taxi / 5 = altres.

El primer que cal fer és comprovar la consistència de les dades. A les files 51, 56, 58, 94 i 96 hi ha incoherències atès que la resposta al tipus de transport que s’utilitza és privat (2) i, en canvi, hi ha la indicació d’un transport públic a la columna següent. En aquest cas, cal invalidar les dades que no són coherents. Es pot optar per suposar que la resposta al tipus de transport (privat) és correcte i eliminar la informació de la columna següent que indica el nom d’un transport públic. La segona opció seria eliminar completament totes les observacions que contenen incoherències i només treballar amb les 95 restants.

Les dues possibilitats són correctes donat que no es disposa de més informació. Si tinguéssim els qüestionaris que s’han emprat per a la recollida de dades és possible que poguéssim determinar on està l’error.

Es proposa la solució de comptar aquestes observacions tenint en compte que seran considerades com a transport privat i, per tant, s’ha eliminat la informació de la columna següent.

Aquesta eliminació es fa abans d’importar el fitxer Excel des del programa R. (Observeu que els camps que no tenen informació, és a dir, la columna Públic en el cas que s’utilitza el transport privat, apareixen com a <NA>. Això és normal quan no hi ha dades en un camp).

Una de les primeres informacions que podem obtenir són és el resum de la taula de dades:

Fixeu-vos que les dades de la columna Edat ens proporciona informació sobre la distribució d’edats de la mostra (mínim, màxim, mitjana, 1r i 3r quartils). A la columna Sexe també s’obté una informació vàlida que és la distribució per sexes (53 dones i 47 homes) i a la columna Públic també hi apareix la informació sobre el tipus de transport utilitzat en cas que sigui transport públic (16 bus, 14 metro, 10 taxi, 10 tren i 9 altres).

En canvi, la informació de la columna transport no aporta cap informació perquè els valors que hi ha són 1 i 2 que corresponen a transport públic (1) i transport privat (2), per tant, cal convertir aquesta variable en factor.

Tot seguit es pot obtenir informació sobre la mitjana, la desviació típica i els quartils:


Resultats de la investigació:

Aquesta investigació té per objectiu conèixer quin és el tipus de transport que utilitzen els habitants de la població de Barcelona, a partir de l’estudi d’una mostra de 100 persones (53 dones i 47 homes).

Es pot observar que majoritàriament s’utilitza el transport públic 59% enfront del 41% de persones que utilitzen el transport privat.

La distribució de persones segons el tipus de transport públic que utilitzen és:

Transport Distribució
Bus 27,1%
Metro 23,7%
Taxi 16,9%
Tren 16,9%
Altres 15,3%
Total 100,0%

Tal com es pot observar el bus és el transport públic més utilitzat 27’1%, seguit del metro 23’7%, el taxi i el tren amb un 16’9% i altres amb un 15’3% (podrien ser el tramvia, el bicing, etc.).

El gràfic següent mostra la mitjana d’edat de les persones que utilitzen un transport públic i es pot observar com la mitjana d’edat dels usuaris que utilitzen el metro és la més baixa (28 anys) i, en canvi, els usuaris de taxi i tren tenen una mitjana d’edat superior, 33 i 34 anys respectivament.

Possiblement, com que el taxi és més car que la resta de transports públics, no està a l’abast del públic més jove, sovint amb menys recursos econòmics.

Pel que fa al tipus de transport utilitzat segons el sexe es pot comprovar com les dones utilitzen majoritàriament el transport públic (81,13%) i, en canvi, els homes utilitzen majoritàriament el transport privat (65,96%).

Com ja s’ha indicat, les persones que utilitzen el transport públic fan servir, sobretot el bus i el metro, però si es té en compte la distribució segons el sexe, es pot comprovar que els homes utilitzen majoritàriament el bus i el metro, en canvi, les dones utilitzen majoritàriament el bus i el taxi. El transport que registra més diferències segons el sexe és el taxi, utilitzat, sobretot, per les dones.

En el gràfic següent es pot observar que, a totes les franges d’edat, excepte a la dels 26-35 anys, s’utilitza majoritàriament el transport públic. Les persones que més utilitzen el transport privat són les de 18 a 35 anys.


Conclusions:

El transport públic és més utilitzat que el transport privat, el 59% enfront del 41%. Tanmateix els joves entre 26 i 35 anys utilitzen majoritàriament el transport privat i, a la franja de 18 a 25 anys, hi ha poca diferència entre la utilització del transport públic i privat.

Les dones utilitzen, majoritàriament el transport públic (81%), en canvi els homes utilitzen majoritàriament el transport privat (66%).

El transport públic més utilitzat és el bus i el metro.

Informe d'investigació comercial

L’objectiu d’aquesta activitat és elaborar un informe d’investigació comercial.

Disposeu del fitxer

esmorzar.ods ( 13.3 KB )
que conté les dades recollides a través d’un qüestionari que s’ha fet a una mostra de 75 persones per determinar el tipus de productes que consumeixen per esmorzar.

Seguint l’estructura bàsica de l’informe d’investigació comercial que es proposa en el material i utilitzant el programa estadístic R, confeccioneu un informe que reculli la informació necessària per tal de proporcionar una visió clara de la situació.

Podeu utilitzar el mateix programa estadístic per fer gràfics o bé el full de càlcul.

Inventeu, de forma racional, les dades necessàries que considereu. Tingueu en compte, però, que en un informe real disposaríeu de totes les dades.

Per tal d’interpretar correctament les dades tingueu en compte que estan tabulades de la forma següent:

Variable Respostes
Edat Valor numèric
Sexe H = home
D = dona
Medi 1 = urbà
2 = rural
Lloc esmorzar 1 = casa
2 = fora de casa
Resta de variables (s’entén que s’ha preguntat si es consumeix un determinat producte i la resposta era tancada 1 = sí
2 = no

La solució d’aquesta pregunta és completament oberta i es pot plantejar de múltiples formes.

Per donar una resposta adequada cal:

  1. Fer una anàlisi a fons de les dades disponibles utilitzant el programa estadístic R i/o un full de càlcul.
  2. Redactar un informe que inclogui els apartats següents:
    • Títol, autor i data.
    • Brífing.
    • Paraules clau.
    • Índex.
    • Introducció breu a l’objecte de l’estudi.
    • Objectius de la investigació.
    • Descripció de la metodologia emprada.
    • Resultats obtinguts.
    • Conclusions que es deriven dels resultats.
    • Recomanacions (si s’escau).
    • Bibliografia (opcional).
    • Annexos (opcional).