Resum

Un dels components bàsics en un sistema informàtic són les dades que s’hi puguin introduir i com ho fa aquest sistema per emmagatzemar-les per usar-les posteriorment o mostrar-les de nou.

Les dades són representacions d’aspectes del món real i se solen recollir per fer càlculs, mostrar-les, organitzar-les, etc., amb l’objectiu que posteriorment algú en pugui fer alguna cosa: prendre decisions, generar noves dades…

Atesa la seva arquitectura, els ordinadors emmagatzemen la informació en binari i, per tant, tota la informació que s’hi pot emmagatzemar sempre es representarà en uns i zeros (1, 0).

Els tipus de dades estructurats són agrupacions d’altres tipus de dades (normalment tipus més senzills).

Els fitxers de text emmagatzemen la informació lletra per lletra d’una manera similar a com ho faria un humà en escriure. Ho fan fent servir estàndards de codificació de caràcters.

Els fitxers de marques també intenten aconseguir les característiques més interessants dels fitxers binaris i dels de text.

Les marques són una sèrie de codis que s’incorporen als documents electrònics per determinar-ne el format, la manera com s’han d’imprimir, l’estructura de les dades, etc. Per tant, són anotacions que s’incorporen a les dades però que no en formen part.

Els llenguatges de marques són una manera de codificar un document de text de manera que per mitjà de les marques (l’equivalent de les metadades dels fitxers binaris) s’hi incorpora informació relativa a com s’ha de representar el text, sobre quina estructura tenen les dades que conté…

Entre els llenguatges de marques destaquen especialment HTML i XML.

XML és un llenguatge estàndard, una recomanació del World Wide Web Consortium basat en l’estàndard ISO SGML.

L’XML és un llenguatge per crear llenguatges de marques.

A diferència d’HTML, l’XML permet buscar, moure, visualitzar i manipular la informació continguda en els documents.

L’XML permet separar el contingut de la manera com serà presentat aquest contingut als usuaris.

Els documents XML poden ser representats gràficament en forma d’arbre per comprendre’n millor l’estructura.

Els documents XML són simples documents de text i, per tant, tot i que hi ha editors especialitzats, es pot fer servir un simple editor de text per crear-los.

XML defineix un nombre infinit d’etiquetes que poden contenir contingut i atributs.

Els atributs són un parell de valors separats per un ”=” que només s’especifiquen en les etiquetes d’obertura.

El contingut d’un element serà tot allò que hi hagi entre les etiquetes d’obertura i de tancament.

L’XML permet definir les nostres etiquetes i atributs lliurement però no totes les combinacions possibles són acceptables. Els noms de les etiquetes i dels atributs han de complir unes regles per ser considerats “correctes”.

L’especificació és una línia que defineix una manera d’identificar que un document és XML per mitjà d’una etiqueta especial anomenada declaració XML, que serveix per indicar que un document és XML.

Comprovar la correctesa d’un document XML és comprovar que no s’incompleix cap de les regles de definició d’XML.

Un document XML és considera correcte si compleix les regles següents:

  • Només hi pot haver un element arrel.
  • Totes les etiquetes que s’obren s’han de tancar.
  • Les etiquetes han d’estar imbricades correctament.
  • Els noms de les etiquetes han de ser correctes.
  • Els valors dels atributs han d’estar entre cometes.

Un processador d’XML (o parser) és un programa que permet llegir un document XML i accedir-ne a l’estructura i a les dades que conté.

Anar a la pàgina anterior:
Introducció
Anar a la pàgina següent:
Resultats d'aprenentatge