Organització i anàlisi de la informació secundària

Avui dia, l’accés a la informació no és un problema perquè la generalització de l’ús de les noves tecnologies de la informació de la comunicació ha millorat l’accessibilitat a les fonts d’informació digitals.

La informació que es pot trobar a les fonts secundàries és aquella que ha estat recollida per a altres propòsits però que és possible reutilitzar per diferents estudis. Així, la informació que una empresa ha obtingut com a conseqüència de la seva activitat habitual amb els clients és un recurs per a l’obtenció d’informació secundària interna. Aquesta informació es podria utilitzar, per exemple, per analitzar els hàbits de compra dels clients.

Quan la informació disponible a l’empresa o organització no és suficient per iniciar un procés d’investigació, es pot recórrer a les fonts d’informació secundària externa. Aquestes fonts contenen informació i dades que han estat utilitzades per altres investigacions i que poden constituir la base o el punt de partida per a altres estudis. Sovint, les dades d’altres estudis, convenientment adaptades i tractades des d’un altre punt de vista, constitueixen la base d’investigacions amb altres propòsits.

Per estalviar temps i diners, qualsevol empresa sempre hauria de començar comprovant si per a la investigació que ha de dur a terme ja hi ha alguna informació al seu abast o, el que és el mateix, si hi ha informació secundària.

Els aspectes bàsics que cal tenir en compte quan s’ha optat per utilitzar aquest tipus d’informació són:

  • D’on es pot obtenir informació ja elaborada que pugui ser d’utilitat per a la investigació.
  • Si la informació disponible es pot fer servir tal com s’ha trobat o necessita algun tipus de tractament per poder-la utilitzar.

En qualsevol cas, la informació secundària (interna o externa) sempre s’ha de seleccionar, organitzar i analitzar per determinar com es pot utilitzar.

Organització de les dades obtingudes

Tota la informació obtinguda a les fonts d’informació secundària s’ha d’organitzar i analitzar per, posteriorment, obtenir uns resultats a partir dels quals es podran extreure conclusions útils per la investigació.

Les conclusions que s’obtinguin, d’acord amb els objectius de la investigació, han de permetre poder prendre les decisions més encertades.

El primer que cal fer per organitzar les dades secundàries és determinar quines són útils i quines s’han de descartar, perquè no són útils per als objectius de la investigació que es vol portar a terme. Així doncs, cal establir mecanismes que permetin analitzar la informació i organitzar-la.

Un criteri per organitzar la informació disponible és determinar la seva fiabilitat i el grau d’utilitat per a la investigació que es vol iniciar.

Per a l’organització de la informació secundària disponible cal elaborar un llistat que inclogui, per a cadascuna de les fonts, les dades següents:

  • Nom de la font
  • Any de publicació
  • Objectiu de la publicació
  • Grau d’interès
  • Resum del que la informació pot aportar a la investigació

A la taula podeu veure un exemple de llistat per a l’organització de la informació secundària disponible.

Taula: Tendències del mercat laboral entre els joves universitaris
Font Any de publicació Objectiu de la publicació Grau d’interès Resum
INE Gener 2016 Inserció laboral dels estudiants universitaris Mitjà Dades d’inserció
CIS Novembre 2012 Adequació de la formació al mercat laboral Baix Característiques del mercat laboral
UB Setembre 2015 Informe sobre la relació dels estudiants amb el mercat laboral Alt Dades d’inserció dels estudiants de la UB
Investigació secundària

Si la font d’informació secundària inclou taules de dades convé recollir-les en un suport informàtic (base de dades, fulls de càlcul…) perquè es puguin analitzar i treballar estadísticament, segons el que convingui. Els gràfics són de molta utilitat per tenir una primera visió de la situació.

Exemple d'utilitat dels gràfics

Si analitzem les dades econòmiques d’un determinat país i seleccionem el producte interior brut (PIB) per càpita com a variable clau, un gràfic ens permetrà tenir una visió ràpida de l’evolució de la renda disponible per càpita o del poder adquisitiu de la població.

Quan només sigui d’interès una part de la informació, convé seleccionar i guardar només la informació que realment és útil per a l’estudi.

En el llistat no s’ha d’incloure la informació que no sigui útil per a l’estudi, ni la informació que no provingui d’una font fiable.

Una vegada seleccionada la informació vàlida, cal analitzar-la.

Anàlisi quantitativa i qualitativa de la informació secundària obtinguda

Les dades obtingudes en una investigació basada en fonts secundàries poden ser quantitatives o qualitatives. Segons la naturalesa de les dades, cal seleccionar una metodologia de treball diferent que permeti fer una anàlisi adequada de les dades disponibles.

Una anàlisi secundària és qualsevol anàlisi posterior d’un conjunt de dades que aporta interpretacions i conclusions addicionals o diferents de les que provenen del seu estudi inicial.

Les dades quantitatives procedents d’una font secundària poden ser analitzades i reinterpretades. Per tant, es poden utilitzar per trobar la resposta a preguntes d’un estudi diferent de l’original.

L’anàlisi de la informació secundària consisteix a seleccionar, transformar i integrar unes dades que es varen recollir, processar i analitzar, anteriorment, per a una finalitat diferent, però que es poden adaptar a altres investigacions.

La metodologia de treball per a l’anàlisi de dades secundàries es concreta en les tasques següents:

Reviseu, a l’apartat “Obtenció de la informació secundària disponible” d’aquesta unitat, com s’ha de validar la informació obtinguda a les fonts d’informació secundària.

  1. Recopilació de tota la informació que permeti conèixer la metodologia de treball, amb la finalitat de saber si la informació recollida és objectiva i fiable.
  2. Interpretació, tractament i anàlisi de la informació, amb l’objectiu d’entendre la informació en el context en el qual s’ha produït i evitar fer interpretacions subjectives.
  3. Avaluació dels aspectes més interessants que es puguin adaptar a la investigació, tenint en compte la seva utilitat i si satisfan els objectius que s’han plantejat prèviament.
  4. Anàlisi de la informació tenint en compte la naturalesa de les dades i del contingut.

Segons els tipus de dades secundàries, es poden fer els dos tipus d’anàlisi següents:

  • Anàlisi quantitativa: consisteix a analitzar les dades mitjançant procediments matemàtics o estadístics a partir dels quals s’obté un resum numèric de les dades.
    • Abans d’iniciar l’anàlisi de dades és recomanable que es verifiquin i es comparin, sempre que sigui possible, amb altres fonts d’informació.
    • Mitjançant aquest tipus d’anàlisi es pot aconseguir una visió diferent o un altre enfocament a partir de les dades numèriques obtingudes en una font secundària. D’aquesta manera, es poden adaptar les dades a les necessitats i als objectius d’una altra investigació.

Alguns exemples de dades quantitatives

  • Vendes d’un determinat producte durant un període de temps
  • Taxa d’atur d’un país o d’una comunitat
  • Índex de morositat dels clients d’una zona geogràfica
  • Marges comercials de diferents gammes de productes
  • Distàncies entre punts de venda
  • Anàlisi qualitativa: es fa a pa

rtir d’informació provinent d’entrevistes, observacions o altres documents. Per tant, no es treballa amb xifres, sinó amb paraules, conceptes, sensacions i experiències.

  • Aquest tipus d’informació no es pot tractar pels mateixos procediments que els utilitzats per a la informació quantitativa.
  • Normalment s’analitza de forma individual cada font d’informació i es compara la informació obtinguda amb la d’altres fonts. En aquest tipus d’anàlisi cal evitar la subjectivitat en la interpretació de la informació.

Alguns exemples de dades qualitatives

  • Motivacions, procés de compra i hàbits dels consumidors
  • Percepció de la imatge de marca i del producte
  • Estudis de la competència

Les dades secundàries, tant si són obtingudes de fonts internes com de fonts externes, són relativament fàcils d’obtenir en comparació amb les dades primàries.

Tot i això, com que no han estat elaborades específicament per a l’estudi que es vol portar a terme, és molt possible que no s’adeqüin completament a les necessitats.

Perquè les dades secundàries es puguin utilitzar per a la presa de decisions, cal tenir en compte les qüestions següents:

  • Característiques tècniques de l’estudi: determinats elements de l’estudi consultat s’han de correspondre amb les necessitats de l’estudi per al qual s’utilitzen, com ara la població, la mostra, les unitats de mesura utilitzades i el grau de resposta, entre d’altres.
  • Procedència i actualització de les dades: cal valorar si les dades provenen d’una empresa de prestigi reconegut i estan actualitzades.
  • Tractament necessari: possiblement les dades recollides han de ser reelaborades i tractades estadísticament per poder arribar a unes conclusions.

Un tractament estadístic molt bàsic permet establir un primer nivell d’anàlisi de les dades recollides. Aquest tipus d’anàlisi pot consistir en:

  • Estudi de la freqüència de determinats valors en un moment concret del temps
  • Estudi de la relació entre diferents dades
  • Estudi de l’evolució de les dades recollides

Estudi de freqüències

La freqüència és el nombre de vegades que es repeteix determinat valor o dada.

Per analitzar com es pot utilitzar la freqüència de les variables per treure’n conclusions, cal recordar alguns conceptes estadístics bàsics:

  • Població: conjunt d’elements sobre els quals es vol estudiar una determinada característica o comportament.
  • Mostra: grup d’elements escollit d’entre els elements de la població per realitzar un estudi efectiu, els resultats del qual seran generalitzats a la resta de la població.
  • Variable: característica atribuïble a la població que és objecte d’estudi i que pot prendre diferents valors. Són exemples de variables la quantitat d’un determinat producte consumida en un mes, l’audiència d’un programa de televisió determinat, el tipus d’establiment on els consumidors prefereixen fer les seves compres, les edats d’un grup de persones estudiades…

Els valors que pren la variable s’obtenen a partir de les vegades que aquesta s’observa per cada un dels elements de la mostra (ni). La suma de totes les dades o valors és igual al total d’observacions (N). L’agrupació de totes les dades recollides dóna lloc a la taula de distribució de freqüències.

Una taula de distribució de freqüències és una representació de les dades associades amb una freqüència (o nombre d’observacions que l’han originada).

Exemple de distribució de freqüències

Es pregunta a un grup d’alumnes del Cicle formatiu de grau superior d’Administració de sistemes informàtics sobre el seu mòdul preferit.

Cada un dels mòduls està codificat des de M1 fins a M8, d’acord amb el que es mostra en la taula.

Les respostes obtingudes van ser: M1, M3, M1, M4, M2, M3, M7, M5, M8, M6, M2, M2, M3, M1, M4, M5, M2, M1, M1, M6, M7, M1, M2, M7, M8, M5, M3, M1, M7, M2, M5, M4, M1, M6 i M2.

En aquest cas la variable a observar és “mòdul preferit”. Les dades són cada una de les respostes donades, i el total d’observacions N és de 35, que és el total de respostes.

La distribució de freqüències que correspon a les respostes donades es mostra en la taula.

Taula: La taula de distribució de freqüències
Crèdits Freqüència
M1 Sistemes informàtics 8
M2 Gestió de xarxes 7
M3 Implantació d’aplicacions informàtiques 4
M4 Fonaments de programació 3
M5 Desenvolupament de funcions en el sistema informàtic 4
M6 Sistemes gestors de bases de dades 3
M7 Relacions en l’àmbit de treball 4
M8 Formació i orientació laboral 2
Total N = 35

En definitiva, es tracta de comptar totes les vegades que es repeteix una resposta: M1, M2…

Les taules de distribució de freqüències també es poden construir a partir de respostes numèriques. Per exemple, el nombre de vegades que s’ha comprat en una botiga, el pes d’una persona, el nombre de clients d’una zona, etc.

Exemple de distribució de freqüències a partir de respostes numèriques

Es demana a un grup de persones la seva alçada en centímetres i s’obtenen les respostes següents: 169, 163, 154, 170, 164, 154, 166, 163, 162, 170, 173, 180, 177, 180, 161, 172, 165, 165, 169, 161, 171, 160, 170, 172, 172, 175, 169, 168, 170, 174, 162, 162, 166, 168, 160, 173, 175, 180, 171, 167, 174 i 178.

En aquest cas les respostes aportades o valors de la variable “alçada” són numèriques.

La taula mostra la distribució de freqüències segons les respostes obtingudes.

Taula: Distribució de freqüències
Alçada Freqüència Alçada Freqüència
160 2 171 2
161 2 172 3
162 3 173 2
163 2 174 2
164 1 175 2
165 2 176 0
166 2 177 1
167 1 178 1
168 2 179 0
169 3 180 3
170 4

En moltes ocasions les taules de distribució de freqüències contenen molts valors que fan que la lectura i la interpretació de la informació que presenten sigui complexa.

Aquestes dades es poden presentar de manera més simplificada si la variable que s’estudia és numèrica (per exemple, l’alçada, el pes o l’edat), ja que es pot agrupar en intervals (per exemple, agrupar les dades que pertanyen a l’interval entre 163 cm i 165 cm d’alçada, de 166 cm a 168 cm…).

Exemple de distribució de freqüències utilitzant classes

Les dades de la taula es poden agrupar utilitzant classes, ja que la distribució de freqüències té més de 15 valors diferents. Els resultats de l’agrupació es mostren en la taula.

Taula: Distribució de freqüències en classes
Classes Freqüència
160-164 10
165-169 10
170-174 13
175-179 4
180-184 3

Els intervals que s’utilitzen per agrupar els valors que presenta una variable s’anomenen classes.

Quan les dades són quantitatives i presenten més de 15 valors diferents, s’aconsella presentar-les per classes.

La marca de classe és el punt mitjà de cada classe, i s’obté sumant els límits superiors i inferiors de cada una i dividint-los entre dos.

Les taules de freqüències que mostren el nombre d’observacions que pren cada variable poden ser:

  • Absolutes: nombre real d’observacions d’una determinada variable.
  • Absolutes acumulades: suma de cada freqüència absoluta més la freqüència absoluta acumulada de la dada que la precedeix immediatament.
  • Relatives: quocient entre cada freqüència absoluta i la suma total d’observacions.
  • Relatives acumulades: suma de cada freqüència relativa més la freqüència relativa acumulada de la dada que la precedeix immediatament.

A partir de les taules de freqüències absolutes, es pot presentar el nombre d’observacions que pren cada variable respecte al nombre d’observacions total per calcular la freqüencia relativa que es pot expressar en forma de fracció, decimal o percentatge. Si es calcula en forma de percentatge, cal dividir cada freqüència entre el total d’observacions i multiplicar-la per 100.

El fet de presentar les freqüències en forma de percentatge (freqüències relatives) permet comparar dues distribucions de freqüències que tinguin un nombre d’observacions diferent.

Exemple de taula de freqüències absolutes, relatives i acumulades

La taula és una taula de freqüències absolutes, relatives i acumulades construïda a partir de les dades de la taula. Aquesta taula mostra la freqüència relativa i la freqüència relativa acumulada expressada en forma de fracció, decimal i percentatge però, normalment, només es calcula d’una d’aquestes tres maneres.

Taula: Taula de freqüències absolutes, relatives i acumulades
Classes Freqüència absoluta Fi Freqüència absoluta acumulada Fa Freqüència relativa fi
(fracció - decimal - percentatge)
Freqüència relativa acumulada fa
(fracció - decimal - percentatge)
160-164 10 10 10/40 - 0,25 - 25% 10/40 - 0,25 - 25%
165-169 10 20 10/40 - 0,25 - 25% 20/40 - 0,50 - 50%
170-174 13 33 13/40 - 0,325 - 32,5% 33/40 - 0,825 - 82,5%
175-179 4 37 4/40 - 0,1 - 10% 37/40 - 0,925 - 92,5%
180-184 3 40 3/40 - 0,075 - 8% 40/40 - 1 - 100%
Total 40 40/40 - 1 - 100%

Interpretació de freqüències

La representació de les dades d’una mostra utilitzant taules de freqüències aporta informació als responsables de la comercialització de productes i serveis que han de poder interpretar per poder prendre decisions estratègiques.

La interpretació que es pot extreure d’aquestes taules depèn de si les freqüències representades són absolutes, relatives o relatives acumulades.

Una taula de freqüències absolutes pot resultar útil en els casos següents:

  • Concentrar els esforços de màrqueting en aquelles dades que presentin valors superiors. Per exemple, una estadística que mostri les vendes realitzades en diferents àrees geogràfiques pot suggerir accions específiques per a aquelles àrees on les vendes hagin estat més elevades.
  • Analitzar l’evolució de les dades quan alguna variable està associada a una altra de caràcter temporal.
  • Observar una hipotètica relació entre dues variables. Per exemple, si hi ha una vinculació entre el nivell d’ingressos de les persones que formen part de la mostra i el tipus de vehicle que utilitzen. Tot i que per treure conclusions definitives en aquest aspecte, caldrà fer una anàlisi estadística més completa.

La utilització de freqüències relatives per analitzar dades presenta els avantatges següents respecte a les absolutes:

  • Permet comparar dos conjunts o més de dades, ja que l’interval de dades en què pot oscil·lar la variable fluctua de 0 a 1, o bé del 0% al 100%, si les dades es presenten en percentatges.
  • Permet establir el pes que té cada valor respecte del total de valors que ha pres la variable. Així, dir que hi ha 13 persones que tenen una alçada d’entre 1,70 i 1,74 no aporta gaire informació, però dir que hi ha un 33% de persones que té aquesta alçada dóna una idea de la importància d’aquest grup sobre el total de persones, ja que suposa un terç de la totalitat.

Dades relatives

Una empresa ven 80 unitats d’un producte a una determinada àrea geogràfica A i 100 unitats a una altra àrea B. A priori les dades indiquen que la zona B té una posició competitiva millor. No obstant això, si les vendes de totes les marques competidores a la zona A són de 150 unitats i a l’àrea B de 200, les dades en percentatge mostren que en realitat la posició competitiva a A és millor, ja que 80 unitats sobre 150 representa el 53% de les vendes totals mentre que 100 sobre 200 només el 50%.

Les freqüències relatives es poden interpretar com a probabilitats que es produeixi un fenomen determinat. La probabilitat d’un esdeveniment, d’acord amb la regla de Laplace, es calcula com el nombre de casos favorables dividit entre el nombre de casos possibles. En calcular la freqüència relativa es pot considerar que el nombre de vegades que una variable pren un valor determinat és el nombre de casos favorables, i que en dividir-la entre el total d’observacions es divideix entre el total de casos possibles.

Pierre-Simon Laplace (1749 - 1827)

Astrònom, físic i matemàtic francès. D’acord amb la regla de Laplace, la probabilitat d’un esdeveniment es calcula com el nombre de casos favorables dividit entre el nombre de casos possibles. Per exemple, la probabilitat de treure un as d’una baralla de cartes espanyola de 48 naips és 4/48 = 1/12 = 8,33% i la probabilitat de treure un 6 en llançar un dau és 1/6 = 16,67%.

Freqüències i probabilitat

Si se sap que en un grup la proporció de persones que fan entre 1,70 i 1,74 m d’alçada és del 33%, també es pot interpretar com que hi ha un 33% de probabilitat que si s’escull un alumne de la classe a l’atzar, la seva alçada estigui compresa entre 1,70 i 1,74 metres.

Les freqüències relatives acumulades mostren el percentatge de valors que se situen al mateix nivell o per sota d’un altre valor considerat. Si s’utilitzen intervals, aleshores la freqüència relativa acumulada mostrarà el percentatge de valors que són iguals o inferiors al límit superior de la classe o al límit inferior de la classe immediatament posterior.

Estudi de relacions entre dades

Pot resultar útil analitzar quina relació hi ha entre dues variables de les quals hi ha dades. Per veure-ho es poden presentar les dades en una taula de doble entrada que les relacioni. Per exemple, pot resultar interessant mirar si hi ha relació entre determinades característiques del perfil del consumidor (edat, sexe, nivell d’ingressos…) amb els patrons de compra d’un producte.

Aquesta relació es pot examinar utilitzant una distribució conjunta de freqüències.

La distribució conjunta és una forma de representar les distribucions de freqüències en una taula de doble entrada, de manera que es puguin examinar les relacions de causa i efecte entre dues variables.

Exemple de distribució conjunta de freqüències

En un estudi es pregunta a una sèrie d’individus quin és el mitjà de transport preferentment utilitzat per al desplaçament entre dues localitats properes. Es vol mirar d’examinar si hi ha algun tipus de relació entre el sexe de la persona entrevistada i el vehicle utilitzat. Les respostes obtingudes s’exposen en la taula.

Taula: Respostes sobre el mitjà de transport utilitzat en el desplaçament més habitual entre dues ciutats
Observacions Sexe Mitjà de transport Observacions Sexe Mitjà de transport
1 F Autobús 26 M Vehicle particular
2 F Vehicle particular 27 F Vehicle particular
3 F Tren 28 M Vehicle particular
4 F Vehicle particular 29 M Tren
5 M Tren 30 M Vehicle particular
6 M Vehicle particular 31 F Vehicle particular
7 F Autobús 32 F Tren
8 F Vehicle particular 33 F Vehicle particular
9 M Autobús 34 M Autobús
10 M Autobús 35 F Vehicle particular
11 M Taxi 36 F Taxi
12 F Vehicle particular 37 M Tren
13 F Vehicle particular 38 F Taxi
14 F Autobús 39 M Tren
15 M Tren 40 F Taxi
16 M Vehicle particular 41 F Vehicle particular
17 M Vehicle particular 42 F Taxi
18 M Autobús 43 F Vehicle particular
19 F Vehicle particular 44 F Taxi
20 F Vehicle particular 45 F Taxi
21 F Tren 46 F Vehicle particular
22 F Vehicle particular 47 M Tren
23 F Vehicle particular 48 M Autobús
24 F Taxi 49 M Tren
25 M Taxi 50 F Taxi

Per analitzar la relació de les dades es pot construir una taula en la qual a la columna es representi la variable independent (o la que es vol examinar, si constitueix la causa del fenomen a observar) i a la fila es representi la variable dependent (o variable que serà la possible conseqüència o efecte del fenomen observat).

En la taula es fa un recompte de les observacions trobades per cada parell de valors de la variable independent i la dependent.

Taula: Taula de distribució conjunta de freqüències
Sexe Vehicle particular Tren Autobús Taxi Total
Femení 16 3 3 8 30
Masculí 6 7 5 2 20
Total 22 10 8 10 50

Examinant la taula es pot veure que les persones enquestades del sexe femení utilitzen majoritàriament el vehicle particular (16 persones), mentre que dels enquestats del sexe masculí utilitzen, a més a més, el tren com a mitjà de transport habitual per al desplaçament entre les dues localitats que s’investiguen (6 i 7 persones, respectivament).

La suma de les freqüències absolutes de totes les categories ha de ser la mateixa que el nombre total d’observacions de la taula original de la qual s’han extret les dades (50).


Es pot presentar la mateixa informació que en la taula mostrant les dades en forma de freqüències relatives, i així les dades indiquen el pes que té cada parell de valors dins el conjunt, o també la importància relativa que té el mitjà de transport (efecte) sobre el sexe de l’entrevistat (causa).

Per reflectir les dades en forma de freqüències relatives cal dividir el nombre d’observacions associat a cada parell de valors (el marcarem com a nij) entre el nombre total d’observacions (el marcarem com a N), que en aquest cas és 50, i que dóna lloc als valors que es mostren en la taula.

Taula: Distribució conjunta de freqüències relatives
Sexe Vehicle particular Tren Autobús Taxi Total
Femení 0,32 0,06 0,06 0,16 0,6
Masculí 0,12 0,14 0,1 0,04 0,4
Total 0,44 0,2 0,16 0,2 1

En aquest cas, la suma total dels pesos de cada parell de valors ha de donar necessàriament 1.

La taula permet fer les interpretacions següents depenent de les caselles que s’observin:

  • La fila de totals mostra quin és el pes d’utilització dels diferents mitjans de transport respecte al total. D’aquesta manera s’observa que el 44% d’individus fa servir el vehicle particular, que és el mitjà de transport més utilitzat, seguit del tren i el taxi en la mateixa proporció, el 20%, i finalment, l’autobús, que s’utilitza en el 16% dels desplaçaments.
  • La columna de totals mostra la proporció d’homes i de dones entrevistats. Així, el 60% són dones i el 40% són homes, si s’expressen les dades en percentatge.
  • La resta de dades mostra la combinació de les dues variables, on es veu que un 32% dels entrevistats són dones que utilitzen el vehicle particular, per exemple, si s’expressen les dades en percentatge. També s’observa que només un 4% dels entrevistats són homes que fan servir el taxi com a mitjà de transport entre les dues localitats.

Estudi de l'evolució de les dades

Sovint es vol examinar com evoluciona una variable al llarg del temps. Pot resultar interessant analitzar si les dades augmenten o disminueixen, en quin grau i interpretar aquesta variació.

Una eina que permet analitzar la variació de dades entre diferents períodes són els nombres índex.

Els nombres índex són indicadors de la variació d’una variable respecte a un moment de temps considerat com a període base. Es calcula com la divisió entre la dada del moment que es vol comparar i la relativa a la del moment que es pren com a referència (període base).

La fórmula que dóna lloc al nombre índex és:

On:

  • xanyt és la dada l’evolució de la qual es vol analitzar.
  • xanybase és la dada de l’any que es pren com a referència per comparar la variació.
  • It-1 és el nombre índex expressat en tant per cent.

La variació es calcula com a:

Exemple d'aplicació dels nombres índex

La taula mostra la xifra de vendes d’una empresa expressada en milers d’euros, i els nombres índex expressats en percentatge. S’ha inclòs una columna al centre que mostra l’operació efectuada per calcular el nombre índex en tant per 1.

Taula: Evolució de les vendes d’una empresa (en milers d’euros)
Any Vendes Càlcul (en tant per 1) Nombre índex
1997 309 309/309 100%
1998 335 335/309 108%
1999 359 359/309 116%
2000 479 479/309 155%
2001 362 362/309 117%
2002 299 299/309 97%
2003 284 284/309 92%
2004 230 230/309 74%
2005 312 312/309 101%
2006 327 327/309 106%
2007 343 343/309 111%
2008 352 352/309 114%

L’any que s’ha pres com a referència per analitzar l’evolució ha estat el 1997. Quan el nombre índex és superior a 100 significa que hi ha hagut un augment de vendes respecte a l’any base (1997). Quan el nombre índex és inferior a 100, això significa que hi ha hagut una disminució de les vendes respecte a aquest mateix any.

De l’anàlisi de les dades de la taula es desprèn que l’any 1998 va haver-hi una variació positiva del 8%; l’any 99, del 16%; l’any 2000, del 55%, i el 2001, del 17%. Del 2002 fins al 2004, en canvi, es van produir variacions negatives: el 3% el 2002 (diferència entre 100 i 97), una disminució del 8% l’any 2003, i del 26% el 2004. A partir del 2005 torna a canviar la tendència.

La informació presentada en nombres índex, per exemple, permet establir comparacions amb altres empreses de la competència, independentment de la seva mida, i veure si en relació amb aquestes l’empresa ha augmentat o disminuït les seves vendes en major o menor grau.

Aquest tipus d’anàlisi numèrica s’hauria de complementar amb un altre tipus d’anàlisi de caràcter qualitatiu que ajudés a interpretar les causes dels canvis en els períodes analitzats.

Presentació de les dades

La presentació de les dades obtingudes en les fonts d’informació secundària, un cop han estat tractades, es pot fer bàsicament de les tres formes següents:

  • Presentació textual
  • Presentació tabular
  • Presentació gràfica

Presentació textual

La presentació mitjançant text consisteix a mostrar la informació qualitativa i les sèries de dades que inclouen pocs valors mitjançant un informe escrit. L’ús del llenguatge escrit és la forma més senzilla de presentar i explicar el comportament de les dades, així com de destacar la informació més important.

Presentació tabular

La presentació tabular consisteix a mostrar les dades a través de taules, formades per files i columnes ordenades de forma lògica. Aquesta forma de presentació és molt útil perquè la informació es pot mostrar de forma més exacta que amb la presentació escrita d’informes.

Les taules consten de les parts següents:

  • Títol: descriu el contingut de la taula.
  • Capçalera: formada per diferents subtítols que es col·loquen a la part superior de cada columna i n’identifiquen el contingut.
  • Columna principal: primera columna de la taula i sol servir per classificar el contingut de les files que hi ha a continuació.
  • Cos: part que conté totes les dades numèriques de la taula i està organitzada en files. Cadascuna de les files representa una observació o un conjunt d’observacions.
  • Font: indicació del lloc de procedència del contingut de la taula.
  • Notes: apartat que s’utilitza per fer aclariments o observacions sobre algunes qüestions de la taula que no s’expliquen en altres apartats.

Presentació gràfica

Quan es disposa de moltes dades, abans d’iniciar anàlisis estadístiques més complexes, un primer pas per resumir la informació consisteix a presentar-la en forma de gràfics.

Els gràfics permeten presentar les dades de forma més sistemàtica i resumida.

Els gràfics són més expressius que les taules de dades i permeten fer-se una idea de la informació més ràpidament. Fins i tot, permeten treure alguna conclusió sobre les dades que conté.

Quan s’analitzen dades, se seleccionen algunes característiques considerades rellevants que s’anomenen variables.

Una variable és una característica dels individus o dels elements objecte de la investigació. Les variables poden ser qualitatives (o categòriques), si s’expressen en forma de categoria o característiques dels individus o objectes d’estudi, o quantitatives, si s’expressen de forma numèrica.

Les variables numèriques poden ser contínues o discretes. Les variables contínues poden prendre qualsevol valor positiu (fins i tot amb decimals) i acostumen a ser el resultat de mesurar algun fenomen. D’altra banda, les variables discretes només prenen valors enters positius i generalment provenen de comptar unitats d’individus o elements.

Exemples de tipus de variables

Tipus de variable Exemple Valors que pot prendre
Qualitativa Gènere Home
Dona
Estat civil Solter/a
Casat/ada
Divorciat/ada
Vidu/vídua
Nivell d’estudis Primaris
Secundaris
Superiors
Quantitativa discreta Persones que consumeixen un producte 1
2
Etc.
Quantitativa contínua Consum mitjà anual d’un producte 5
6,5
8,1
Etc.

Hi ha diversos tipus de gràfics que es poden utilitzar segons el tipus de dades que s’hagin de representar.

Els principals tipus de gràfics són els següents:

  • Diagrama de barres: consisteix en la representació mitjançant barres o rectangles, amb base constant i altura proporcional a la freqüència absoluta corresponent. S’utilitza quan la variable és discreta o qualitativa, i també quan es vol representar una evolució.
  • Histograma: es tracta d’un diagrama de barres per a distribucions quantitatives contínues.
  • Gràfics de línies: mostren una sèrie com un conjunt de punts connectats mitjançant una sola línia i són molt útils per mostrar l’evolució d’una variable.
  • Diagrama de sectors: divideixen el cercle en parts proporcionals segons el valor de les freqüències relatives (també anomenats circulars o de pastís).

Exemple de representació gràfica de dades

Suposem que volem representar gràficament el nombre de persones, agrupades per edats, que utilitzen un servei determinat.

Les dades són les següents:

Edat Nombre d’usuaris
15-25 97
26-35 128
36-50 110
+50 54

Aquestes dades es poden representar gràficament mitjançant un diagrama de barres com el següent:

També es poden representar mitjançant un diagrama de sectors com el següent:

Incorporació de la informació a la base de dades

Tota la informació recollida de les fonts d’informació secundària s’ha d’incorporar a les bases de dades de l’empresa, perquè pot ser útil per a estudis futurs i convé que estigui accessible de forma immediata.

El sistema d’informació de l’empresa ha de permetre, mitjançant les aplicacions informàtiques, classificar i emmagatzemar tota la informació que s’hagi recollit, així com la que s’hagi generat a partir del tractament i anàlisi de les dades secundàries.

D’altra banda, el sistema d’informació de l’empresa també ha de permetre que la informació estigui disponible per a totes les persones de l’organització que puguin necessitar-la. Per això, s’han de preveure els procediments per a la difusió de la informació que s’ha obtingut i que s’ha generat.

Els sistemes de gestió integrada permeten emmagatzemar i posar a disposició dels usuaris interessats tota la informació que s’ha generat en els processos d’investigació exploratoris. Aquesta informació pot contribuir en la presa de decisions i, per tant, cal que estigui a l’abast de les persones responsables tant dels nivells estratègics com operatius.

La incorporació a les bases de dades de la informació secundària obtinguda en fase exploratòria es pot fer mitjançant l’ús de diferents eines informàtiques.

Les petites i mitjanes empreses normalment gestionen les dades mitjançant aplicacions informàtiques de full de càlcul i sistemes gestors de bases de dades. Aquestes eines permeten fer una gestió de les dades i de la informació que permet a les empreses complir amb un dels objectius de màrqueting més importants: incrementar la satisfacció dels clients i aconseguir la seva fidelitat.

Les bases de dades relacionals permeten interrelacionar fàcilment registres amb informació completa i provinent de diferents fonts, mitjançant la utilització de codis comuns.

Exemple de base de dades relacional en una empresa

Suposem que una empresa disposa de dues taules amb la informació següent:

  • Taula 1 - Clients. Aquesta taula recull les dades següents de cada client: número de client, NIF, nom de l’empresa, activitat, adreça, correu electrònic, telèfon i persona de contacte.
  • Taula 2 - Factures. Aquesta taula recull les dades de totes les factures que ha emès l’empresa: número de client, número de factura, import, data d’emissió, data de pagament i referències dels productes.

Com que es tracta d’una base de dades relacional, ens permet relacionar les dues taules a partir d’un determinat codi comú que ha de contenir cada taula. En aquest cas és el número de client.

Si relacionem les dues taules, es poden obtenir diversos tipus d’informació:

  • Si volem saber les factures pendents de cobrament per al proper mes, només cal relacionar les dues taules i fer una consulta per obtenir un llistat de les factures que s’han de cobrar durant el proper mes.
  • Si volem saber quin és el volum de compra de cada client durant el darrer trimestre, també es pot fer a partir de les dades d’aquestes taules. Simplement cal relacionar les dues taules i podem obtenir una relació de l’import de les compres de cada client durant els darrers tres mesos.
  • Si estem fent una investigació per determinar on tenim els clients que compren més i els que compren menys, també ho podem fer a partir de la informació continguda en aquesta base de dades.

Aquest és un procediment d’obtenció immediata d’informació interna que permet analitzar les dades disponibles amb l’objectiu de prendre les decisions més adequades. Per exemple, per a la definició d’estratègies comercials.

Amb els fulls de càlcul també es poden dissenyar bases de dades, però en aquest cas només serveixen per recollir dades sempre que no es tracti d’un volum molt gran. Tot i que els fulls de càlcul també permeten fer consultes i selecció de dades, les aplicacions de bases de dades relacionals permeten gestionar volums més grans dades i establir relacions més complexes entre les dades, la qual cosa representa poder obtenir més informació i de més qualitat.

Aplicacions informàtiques per a la gestió de dades

Les dades i la informació són un valor molt preuat per a totes les empreses i s’han convertit en un motor de creixement i de generació de riquesa. Però, per obtenir-ne el màxim rendiment, és convenient transformar la informació en coneixement.

Per facilitar el tractament i la comprensió de dades hi ha diverses eines que ajuden a recollir-les, analitzar-les, interpretar-les i contrastar-les perquè estiguin disponibles per a la seva reutilització mitjançant procediments simples.

Normalment, les petites i mitjanes empreses utilitzen aplicacions informàtiques com les bases de dades i els fulls de càlcul per al tractament i emmagatzematge de dades, però les grans empreses solen disposar de grans volums de dades que no poden tractar amb aquest tipus d’eines informàtiques.

Avui dia hi ha moltes les eines informàtiques que fan possible que les empreses puguin gestionar els grans volums d’informació per treure’n el màxim rendiment. Una d’aquestes eines és Open Data Kit (ODK) (www.opendatakit.org), de codi obert, que permet a qualsevol organització o usuari gestionar grans volums de dades a través d’internet i sense que calgui cap llicència d’ús. A partir d’una base de dades amb la informació que es vol tractar, s’incorpora a aquesta eina, i es poden obtenir gràfics, mapes i diferents tipus de visualitzacions que afavoreixen la comprensió de grans volums de dades.

L’anàlisi i el tractament de dades complexes es fa mitjançant tecnologies avançades que faciliten l’anàlisi de la informació que no es podria aconseguir amb altres sistemes.

Les principals tecnologies per al tractament de grans volums de dades són:

  • Magatzem de dades (data warehouse)
  • Mineria de dades (data mining)
  • Dades massives (big data)
  • Processament analític en línia (online analytical processing - OLAP)

Magatzem de dades ('data warehouse')

Un magatzem de dades és una base de dades corporativa que es caracteritza per integrar i depurar la informació d’una o més fonts diferents per, posteriorment, processar-la i analitzar-la des d’infinitat de perspectives i amb una gran velocitat de resposta.

La creació d’un magatzem de dades representa el primer pas, des del punt de vista tècnic, per a la implantació d’una solució completa i fiable d’intel·ligència de negoci.

Intel·ligència de negoci ('business intelligence')

Conjunt de metodologies, aplicacions i tecnologies que permeten recollir, depurar i transformar dades en informació útil que, posteriorment, es pot convertir en coneixement i donar suport a la presa de decisions.

L’avantatge principal d’aquestes bases de dades és l’estructura en què es desa la informació, de forma jeràrquica, la qual cosa permet crear una gran quantitat d’interrelacions per afavorir una anàlisi sistemàtica i l’obtenció de models de comportament.

Mineria de dades ('data mining')

La mineria de dades és un conjunt de tècniques i tecnologies que permeten analitzar i explotar de forma automàtica bases de dades grans, amb l’objectiu de trobar patrons repetitius, tendències o regles que expliquin el comportament de les dades en un determinat context.

L’objectiu de la mineria de dades és, bàsicament, ajudar a comprendre el contingut d’un conjunt de dades gran, mitjançant tècniques estadístiques i algorismes pròxims a la intel·ligència artificial i a les xarxes neuronals.

Intel·ligència artificial

Part de la informàtica que desenvolupa algorismes que permeten a una màquina (ordinador) prendre decisions intel·ligents o comportar-se com si tingués una intel·ligència semblant a la humana.

Les dades són la matèria primera bruta, i quan l’usuari els atribueix un significat determinat es converteixen en informació. Quan es troba un model que permet interpretar la informació s’aconsegueix un valor afegit, que s’anomena coneixement.

Dades massives ('big data')

Les dades massives són més conegudes pel seu terme anglès (big data). Fan referència a un conjunt d’eines informàtiques que permeten el maneig, la gestió i l’anàlisi de grans volums de dades. Aquestes dades no es podrien gestionar mitjançant altres sistemes convencionals, ja que superen els límits i les capacitats de les aplicacions informàtiques més usuals.

'Big data'

Podeu ampliar la informació sobre el concepte big data a l’enllaç següent: www.goo.gl/1QG9MG.

L’objectiu principal de l’anàlisi de grans volums de dades és posar a disposició de les empreses més informació i ajudar-les a prendre decisions de negoci. Hi ha diversos professionals que treballen amb els grans volums d’informació, analitzant totes les dades que es recullen en les diverses transaccions que fan les empreses, per explotar la intel·ligència de negoci.

Quan es parla de grans volums de dades es fa referència, per exemple, a:

  • Registres en els servidors web i les dades de navegació a internet
  • Contingut dels mitjans socials i als informes d’activitat de les xarxes socials
  • Textos dels missatges de correu electrònic dels clients
  • Respostes a una enquesta
  • Detall de les trucades de telèfons mòbils

Dades com aquestes es poden analitzar per obtenir-ne informació i coneixement que pot ser útil per a les empreses.

Exemples d'ús de dades massives

L’empresa Abertis té la concessió de diverses autopistes i disposa d’un sistema que li permet comptar els cotxes que passen per un determinat peatge. També pot saber els trajectes que fan. Per exemple, si es retorna a l’origen el mateix dia o no. Aquesta informació es pot recollir a través de senyals bluetooth o mitjançant els lectors de targetes de crèdit en el moment de pagar el peatge. Tota aquesta informació, que, evidentment, representa un gran volum de dades, es pot emmagatzemar i la seva anàlisi pot ajudar a fer previsions. D’aquesta manera es poden preveure els increments de fluxos de vehicles i prendre les decisions més adequades en cada moment.

Un altre exemple de l’ús de dades massives és el que poden fer els supermercats a partir de la informació que obtenen a través de les targetes de fidelització o altres sistemes de recollida de dades. Alguns supermercats i hipermercats disposen d’un sistema anomenat scan & go que consisteix a posar a disposició dels clients uns carrets dotats d’un sistema lector de codis de barres o bé de lectura per radiofreqüència. Aquest sistema, a més de permetre que el client faci la compra de forma habitual, també li estalvia la molèstia d’haver de treure del carret tots els productes en el moment de passar per caixa perquè s’escanegin. El client s’estalvia fer cues i guanya temps, però aquest sistema representa una enorme avantatge per a l’establiment comercial: conèixer l’ordre en què els clients fan les compres, la qual cosa és molt valuosa en el moment de distribuir els productes en el punt de venda.

La majoria d’empreses que utilitzen aquesta tecnologia per a l’anàlisi de dades ho fan per conèixer el perfil dels seus clients, les seves necessitats i l’opinió que tenen sobre els seus productes i serveis. Això permet a les empreses oferir un producte cada vegada més ajustat a les necessitats reals i demandes dels clients.

Viure amb el 'big data'

Si mireu el vídeo “Tu vida entera está en Internet… y pueden usarla contra ti” podreu veure fins a quin punt les dades estan a l’abast de qualsevol persona i que si bé, per una banda, poden millorar les relacions entre els clients i l’empresa, per l’altra, poden revelar aspectes interns i personals molt delicats.

Processament analític en línia (OLAP)

És una solució que ofereix consultes ràpides en una base de dades. Es pot fer servir per a informes de qualsevol àrea de l’empresa: vendes, màrqueting, compres, direcció…

El principal avantatge d’aquest sistema és la velocitat de resposta. Una base de dades relacional emmagatzema taules que es poden relacionar, però les consultes complexes sobre diferents taules es poden alentir molt i és millor una base de dades multidimensional. La seva característica principal és la rapidesa més gran a l’hora de fer seleccions, insercions, actualitzacions i eliminacions de dades.

Aquest sistema permet fer una disposició de les dades en vectors anomenats cubs, la qual cosa permet fer una anàlisi més ràpida que la que es podria fer amb una base de dades relacional. Per tant, és un sistema adequat per al tractament de grans volums de dades.

Anar a la pàgina anterior:
Annexos
Anar a la pàgina següent:
Activitats