El primer que cal fer és comprovar la consistència de les dades. A les files 51, 56, 58, 94 i 96 hi ha incoherències atès que la resposta al tipus de transport que s’utilitza és privat (2) i, en canvi, hi ha la indicació d’un transport públic a la columna següent. En aquest cas, cal invalidar les dades que no són coherents. Es pot optar per suposar que la resposta al tipus de transport (privat) és correcte i eliminar la informació de la columna següent que indica el nom d’un transport públic. La segona opció seria eliminar completament totes les observacions que contenen incoherències i només treballar amb les 95 restants.
Les dues possibilitats són correctes donat que no es disposa de més informació. Si tinguéssim els qüestionaris que s’han emprat per a la recollida de dades és possible que poguéssim determinar on està l’error.
Es proposa la solució de comptar aquestes observacions tenint en compte que seran considerades com a transport privat i, per tant, s’ha eliminat la informació de la columna següent.
Aquesta eliminació es fa abans d’importar el fitxer Excel des del programa R. (Observeu que els camps que no tenen informació, és a dir, la columna Públic en el cas que s’utilitza el transport privat, apareixen com a <NA>. Això és normal quan no hi ha dades en un camp).
Una de les primeres informacions que podem obtenir són és el resum de la taula de dades:
Fixeu-vos que les dades de la columna Edat ens proporciona informació sobre la distribució d’edats de la mostra (mínim, màxim, mitjana, 1r i 3r quartils). A la columna Sexe també s’obté una informació vàlida que és la distribució per sexes (53 dones i 47 homes) i a la columna Públic també hi apareix la informació sobre el tipus de transport utilitzat en cas que sigui transport públic (16 bus, 14 metro, 10 taxi, 10 tren i 9 altres).
En canvi, la informació de la columna transport no aporta cap informació perquè els valors que hi ha són 1 i 2 que corresponen a transport públic (1) i transport privat (2), per tant, cal convertir aquesta variable en factor.
Tot seguit es pot obtenir informació sobre la mitjana, la desviació típica i els quartils:
Resultats de la investigació:
Aquesta investigació té per objectiu conèixer quin és el tipus de transport que utilitzen els habitants de la població de Barcelona, a partir de l’estudi d’una mostra de 100 persones (53 dones i 47 homes).
Es pot observar que majoritàriament s’utilitza el transport públic 59% enfront del 41% de persones que utilitzen el transport privat.
La distribució de persones segons el tipus de transport públic que utilitzen és:
Transport | Distribució |
Bus | 27,1% |
Metro | 23,7% |
Taxi | 16,9% |
Tren | 16,9% |
Altres | 15,3% |
Total | 100,0% |
Tal com es pot observar el bus és el transport públic més utilitzat 27’1%, seguit del metro 23’7%, el taxi i el tren amb un 16’9% i altres amb un 15’3% (podrien ser el tramvia, el bicing, etc.).
El gràfic següent mostra la mitjana d’edat de les persones que utilitzen un transport públic i es pot observar com la mitjana d’edat dels usuaris que utilitzen el metro és la més baixa (28 anys) i, en canvi, els usuaris de taxi i tren tenen una mitjana d’edat superior, 33 i 34 anys respectivament.
Possiblement, com que el taxi és més car que la resta de transports públics, no està a l’abast del públic més jove, sovint amb menys recursos econòmics.
Pel que fa al tipus de transport utilitzat segons el sexe es pot comprovar com les dones utilitzen majoritàriament el transport públic (81,13%) i, en canvi, els homes utilitzen majoritàriament el transport privat (65,96%).
Com ja s’ha indicat, les persones que utilitzen el transport públic fan servir, sobretot el bus i el metro, però si es té en compte la distribució segons el sexe, es pot comprovar que els homes utilitzen majoritàriament el bus i el metro, en canvi, les dones utilitzen majoritàriament el bus i el taxi. El transport que registra més diferències segons el sexe és el taxi, utilitzat, sobretot, per les dones.
En el gràfic següent es pot observar que, a totes les franges d’edat, excepte a la dels 26-35 anys, s’utilitza majoritàriament el transport públic. Les persones que més utilitzen el transport privat són les de 18 a 35 anys.
Conclusions:
El transport públic és més utilitzat que el transport privat, el 59% enfront del 41%. Tanmateix els joves entre 26 i 35 anys utilitzen majoritàriament el transport privat i, a la franja de 18 a 25 anys, hi ha poca diferència entre la utilització del transport públic i privat.
Les dones utilitzen, majoritàriament el transport públic (81%), en canvi els homes utilitzen majoritàriament el transport privat (66%).
El transport públic més utilitzat és el bus i el metro.