Resum

La realitat, la seva conceptualització i la seva ulterior representació informàtica són tres mons diferenciats:

  • El món real. Està constituït pels objectes (materials o no) de la realitat que ens interessen i amb els quals haurem de treballar.
  • El món conceptual. És el conjunt de coneixements o informacions obtinguts gràcies a l’observació de la part del món real que ens interessa. Un mateix món conceptual pot donar lloc a diferents mons conceptuals, en funció de la manera de percebre la realitat o els interessos de l’observador d’aquesta.
  • El món de les representacions. Està format per les representacions informàtiques, o dades, del món conceptual, necessàries per treballar.

Fases per a la conversió de les concepcions en dades:

  • Fase de disseny lògic. Es treballa amb el model abstracte de dades obtingut al final de l’etapa de disseny conceptual, per tal de traduir-lo al model de dades utilitzat pel sistema gestor de bases de dades (SGBD) amb el qual es vol implementar i mantenir la futura base de dades (BD).
  • Fase de disseny físic. Es poden fer certes modificacions sobre l’esquema lògic obtingut en la fase de disseny anterior, per tal d’incrementar l’eficiència en algunes de les operacions que s’hagin de fer amb les dades.

La informació és la interpretació que es fa de les dades. Les informacions es caracteritzen, fonamentalment, per tres elements: entitats, atributs i valors.

Les entitats són els objectes del món real que conceptualitzem. Són identificables, és a dir, distingibles els uns dels altres. I ens interessen algunes (com a mínim una) de les seves propietats.

Els atributs són les propietats que ens interessen de les entitats.

Els valors són els continguts concrets dels atributs, les determinacions concretes que assoleixen.

A més dels tres elements bàsics que caracteritzen la informació (és a dir, entitats, atributs i valors), cal tenir en compte el factor cronològic.

Entitat tipus: es tracta d’un tipus genèric d’entitat o, si es prefereix, d’una abstracció, que fa referència a una classe de coses com, per exemple, els cotxes en general.

Entitat instància: es refereix a la conceptualització d’un objecte concret del món real, com ara un cotxe concret, distingible dels altres objectes del mateix tipus, gràcies a alguna propietat (com podria ser el valor de l’atribut Matricula).

Anomenem domini tot el conjunt de valors que un atribut determinat pot prendre vàlidament.

Un tipus de dada defineix un conjunt de valors amb unes característiques comunes que els fan compatibles entre ells, per la qual cosa també defineix una sèrie d’operacions admissibles sobre aquests valors.

L’expressió valor nul indica l’absència de qualsevol valor associat a un determinat atribut d’una entitat instància concreta.

Un atribut identificador és el que permet distingir inequívocament cada entitat instància de la resta, perquè el seu valor és únic i no es repeteix en diferents entitats instància. Tot atribut o conjunt d’atributs que permeten identificar inequívocament entre ells les instàncies d’una entitat s’anomenen claus.

La representació més freqüent en l’àmbit informàtic de les BD és l’anomenada representació tabular (o, el que és el mateix, en forma de taula).

Cada taula representa una entitat genèrica, i està estructurada en files (agrupacions horitzontals de cel·les) i columnes (agrupacions verticals de cel·les):

  • Cada fila representa una entitat instància.
  • Cada columna representa un atribut.
  • Cada cel·la (és a dir, cada intersecció d’una fila i d’una columna) emmagatzema el valor que tingui l’atribut de l’entitat instància de què es tracti.

S’entén per fitxer la implementació informàtica d’una taula, amb les dades estructurades en registres i camps.

La implementació de cada entitat instància s’anomena registre, i equival a una fila de la representació tabular.

La implementació de cada atribut s’anomena camp, i equival a una columna de la representació tabular.

Cada intersecció d’un registre i d’un camp emmagatzema el valor que tingui el camp del registre de què es tracti.

Les interrelacions són informacions que permeten associar les entitats entre elles.

Una BD consisteix en un conjunt de fitxers de dades interrelacionats.

En general, hi ha dues maneres bàsiques d’accedir a les dades:

  • L’accés seqüencial a un registre determinat, que implica l’accés previ a tots els registres anteriors.
  • L’accés directe a un registre concret, que implica l’obtenció directa del registre desitjat.

A més, hi ha una altra classificació habitual de tipologies d’accessos:

  • L’accés per valor, que permet l’obtenció del registre desitjat en funció del valor d’algun (o alguns) dels seus camps, sense considerar la posició que ocupa el registre.
  • L’accés per posició, que obre l’accés a un registre que ocupa una posició determinada, sense considerar el contingut del registre.

Les quatre tipologies d’accés a dades més freqüents:

  • SP (accés seqüencial per posició). Després d’haver accedit a un registre que es troba en una posició determinada, s’accedeix al registre que ocupa la posició immediatament posterior.
  • DP (accés directe per posició). S’obté directament un registre pel fet d’ocupar una posició determinada.
  • SV (accés seqüencial per valor). Després d’haver accedit a un registre que té un valor concret, s’accedeix al registre que ocupa la posició immediatament posterior, segons l’ordenació establerta a partir un camp determinat (o més). L’ordre serà creixent o decreixent, si es tracta d’un camp numèric, o alfabètic ascendent o descendent, si es tracta d’un camp de caràcters.
  • DV (accés directe per valor). S’obté directament un registre pel fet de tenir un valor determinat en un dels seus atributs (o més).

L’organització i enregistrament de les dades, i l’accés a aquestes es poden considerar des de dos punts de vista, més o menys propers a la implementació física de l’enregistrament de les dades:

  • Nivell lògic. Permet treballar amb les dades de manera més senzilla, independentment de la implementació física concreta, que no cal conèixer. És la manera de treballar més productiva i, per tant, la més recomanable, sempre que les circumstàncies no ens obliguin a fer optimitzacions a nivells més baixos.
  • Nivell físic. Implica un coneixement a baix nivell de la implementació física de l’organització de les dades i l’accés a aquestes.

Una BD és la representació informàtica dels conjunts d’entitats instància corresponents a diferents entitats tipus, i de les relacions entre aquestes. Aquest conjunt estructurat de dades ha de poder ser utilitzat de manera compartida i simultània per una pluralitat d’usuaris de diferents tipus.

S’utilitzen tres nivells d’abstracció (físic, lògic i de vistes) per amagar aquestes estructures complexes i simplificar, d’aquesta manera, la interacció dels usuaris amb el sistema.

Els models de dades són uns conjunts d’eines lògiques per descriure les dades, les relacions entre aquestes, el seu significat, i les restriccions que cal aplicar per tal de garantir-ne coherència.

Els models de dades més utilitzats al llarg del temps han estat els següents, exposats per ordre cronològic d’aparició:

  • Jeràrquic
  • En xarxa
  • Relacional
  • Relacional amb objectes / orientat a objectes

Les BD jeràrquiques emmagatzemen la informació en una estructura jeràrquica que podem imaginar amb una forma d’arbre invertit, on cada node pare pot tenir diferents fills. El node superior, que no té pare, es coneix com a arrel. I els nodes que no tenen fills s’anomenen fulles.

Al començament del anys setanta, en el mercat, van anar sorgint BD que seguien un model en xarxa, semblant al model jeràrquic, amb registres interrelacionats mitjançant una estructura en forma d’arbre invertit, però més flexible, ja que permetia que els nodes tinguessin més d’un sol pare.

El model relacional es basa en la lògica de predicats i en la teoria de conjunts. Actualment, és el sistema més àmpliament utilitzat per modelitzar dades. En els models de dades anteriors, les dades s’estructuraven gràcies a dos elements: els registres i les interrelacions. Però el model relacional només consta d’un element: les relacions o taules.

El model de dades relacionals amb objectes és una extensió del model relacional en sentit estricte.

Els SGBD són un tipus de programari que té com a finalitats la gestió i el control de les BD.

Evolució dels SGBD:

  • Anys cinquanta: processament seqüencial
  • Anys seixanta i setanta: sistemes centralitzats
  • Anys vuitanta: SGBD relacionals
  • Anys noranta: BD distribuïdes, arquitectures client/servidor, i llenguatges de quarta generació

Un gestor de dades () consisteix en rèpliques elaborades de les dades generades pel funcionament quotidià de l’organització o l’empresa de què es tracti, durant un cert període de temps, per tal de realitzar anàlisis estratègiques d’índole financera, de mercats, etc.

La utilització de dades estructurades mitjançant l’estàndard XML resulta especialment interessant en l’intercanvi d’informació entre sistemes basats en plataformes poc compatibles entre ells.

Tots els SGBD del mercat volen satisfer, amb més o menys encert, una sèrie d’objectius i funcionalitats que actualment es consideren indispensables per al bon funcionament de qualsevol sistema d’informació:

  • Possibilitar les consultes no predefinides de qualsevol complexitat.
  • Garantir la independència física i la independència lògica de les dades.
  • Evitar o solucionar els problemes derivats de la redundància.
  • Protegir la integritat de les dades.
  • Permetre la concurrència d’usuaris.
  • Contribuir a la seguretat de les dades.

La redundància consisteix en la repetició indesitjada de les dades, que incrementa els riscos de pèrdua d’integritat d’aquestes quan s’actualitzen.

Un altre tipus de duplicitat admissible és la constituïda per les anomenades dades derivades. Es tracta de dades emmagatzemades en la BD, que en realitat són el resultat de càlculs realitzats amb altres dades també presents en la mateixa BD.

Mitjançant les regles d’integritat, el sistema valida automàticament certes condicions en produir-se una actualització de dades, i l’autoritza si les compleix, o denega el permís en cas contrari.

Una transacció consisteix en un conjunt d’operacions simples que s’han d’executar com una unitat.

Un bloqueig consisteix a impedir l’accés a determinades dades durant el temps en què estiguin sent utilitzades per una transacció. Així, s’aconsegueix que les transaccions s’executin com si estiguessin aïllades, de tal manera que no es produeixen interferències entre elles.

Les tècniques d’encriptació permeten emmagatzemar la informació utilitzant codis secrets que no permeten accedir a les dades a persones no autoritzades i que, per tant, no disposen dels codis esmentats.

Els llenguatges de BD es poden classificar en dues grans tipologies segons la seva finalitat:

  • Llenguatges de definició de dades (data definition languages, en anglès, o DDL). Estan especialitzats en la definició de l’estructura de les BD, mitjançant l’especificació d’esquemes.
  • Llenguatges de manipulació de dades(data management languages, en anglès, o DML). Possibiliten la consulta, modificació i eliminació de les dades emmagatzemades, i també la inserció de noves informacions.

El llenguatge més utilitzat per interaccionar amb els SGBD relacionals és l’SQL.

Podem diferenciar tres categories diferents d’usuaris de SGBD, en funció de la manera en què interactuen amb el sistema: externs, sofisticats i programadors d’aplicacions.

Els administradors són uns usuaris especials que realitzen tasques d’administració i control centralitzat de les dades, i gestionen els permisos d’accés concedits als diferents usuaris i grups d’usuaris, per tal de garantir el funcionament correcte de la BD.

El 1975, el comitè ANSI/X3/SPARC va proposar una arquitectura per als SGBD estructurada en tres nivells d’abstracció (intern, conceptual i extern), que resulta molt útil per separar els programes d’aplicació de la BD considerada des d’un punt de vista físic.

El components funcionals dels SGBD més importants són el gestor d’emmagatzemament i el processador de consultes.

Anar a la pàgina anterior:
Introducció
Anar a la pàgina següent:
Mapa conceptual