Activitats

El text en ordinadors

L’objectiu d’aquesta activitat és entendre com ho fan els ordinadors per emmagatzemar text.

S’ha rebut un missatge per mitjà d’un llapis USB espatllat i amb un procés complex només hem pogut recuperar els bits d’un en un.

1001000 1101111 1101100 1100001 0100000 1100011 1101111 1101101 0100000 1110110 1100001 0100000 1110100 1101111 1110100 0100001

Si sabem que qui va enviar el missatge feia servir un ordinador amb ASCII de 7 bits. Quin era el contingut del missatge?

Només cal agrupar els bits de 7 en 7, trobar-ne el valor numèric i buscar quina és la correspondència en la taula ASCII

El primer caràcter serà:

1001000

Que si el passem a decimal ens dóna 72. Si busquem el 72 en la taula ASCII descobrim que és la “H”

Si fem el procediment fins al final descobrirem que el contingut del missatge és:

Hola com va tot?

Conversió entre formats

L’objectiu d’aquesta activitat és veure que els llenguatges de marques, gràcies a les seves característiques, poden ser convertits fàcilment a altres formats.

Una de les característiques interessants dels llenguatges de marques és que permeten que les dades siguin convertides entre formats de manera relativament senzilla.

Vegeu aquest document de marques, que està en format XML:

  1. <?xml version="1.0"?>
  2. <cataleg>
  3. <llibre id="bk101">
  4. <autor>Garcia, Frederic</autor>
  5. <titol>La formiga</titol>
  6. <preu>14.95</preu>
  7. <publicacio>2011-05-01</publicacio>
  8. <descripcio>
  9. En aquest llibre es descriuen amb detall les tasques
  10. diàries que fan les formigues
  11. </descripcio>
  12. </llibre>
  13. <llibre id="bk102">
  14. <autor>Puigdevall Garcés, Marcel</autor>
  15. <titol>Carns a la brasa</titol>
  16. <preu>5.95</preu>
  17. <publicacio>2012-10-01</publicacio>
  18. <descripcio>
  19. S'hi descriuen les bondats alimentàries de coure
  20. la carn a la brasa a més de truquets per incrementar-ne
  21. el gust
  22. </descripcio>
  23. </llibre>
  24. <llibre id="bk103">
  25. <autor>Bisbe, Bernat</autor>
  26. <titol>Diari d'un idiota</titol>
  27. <preu>14.5</preu>
  28. <publicacio>2012-07-30</publicacio>
  29. <descripcio>
  30. L'autor descriu en clau d'humor la vida de la gent
  31. actual, que descriu genèricament com a "idiotes"
  32. </descripcio>
  33. </llibre>
  34. </cataleg>

Representeu les dades que conté aquest document en el format de text CSV.

El format CSV emmagatzema la informació en línies en què no s’hi inclouen les metadades. Per solucionar aquest problema és bastant habitual que es posin les metadades en la primera línia del fitxer de dades.

Per fer aquest exercici cal analitzar el fitxer XML i veure que simplement estem davant d’una llista de llibres, de manera que per representar-ho en CSV les dades de cada llibre seran representades en una línia.

  1. <llibre id="bk101">
  2. <autor>Garcia, Frederic</autor>
  3. <titol>La formiga</titol>
  4. <preu>14.95</preu>
  5. <publicacio>2011-05-01</publicacio>
  6. <descripcio>
  7. En aquest llibre es descriuen amb detall les tasques
  8. diàries que fan les formigues
  9. </descripcio>
  10. </llibre>

Posant les dades de text entre cometes i separant cada un dels camps amb comes tindrem:

  1. "bk101", "Garcia, Frederic", "La formiga", 14,95, 2011-05-01, "En aquest llibre es descriuen amb detall les tasques diàries que fan les formigues"

Si fem el mateix amb els tres llibres el resultat serà:

  1. "id", "autor", "titol", "preu", "publicacio", "descripcio"
  2. "bk101", "Garcia, Frederic", "La formiga", 14.95, 2011-05-01, "En aquest llibre es descriuen amb detall les tasques diàries que fan les formigues"
  3. "bk102", "Puigdevall Garcés, Marcel", "Carns a la brasa", 5.95, 2012-10-01, "S'hi descriuen les bondats alimentàries de coure la carn a la brasa a més de truquets per incrementar-ne el gust "
  4. "bk103", "Bisbe, Bernat", "Diari d'un idiota", 14.5, 2012-07-30, "L'autor descriu en clau d'humor la vida de la gent actual, que descriu genèricament com a 'idiotes'"

Podeu comprovar que el fitxer que heu generat es pot carregar fàcilment en un full de càlcul.

Metadades

L’objectiu d’aquesta activitat és veure quins són els avantatges que aporten les metadades als fitxers de dades.

Emmagatzemeu el gràfic següent format per punts de color en un fitxer:

Figura Imatge per representar ampliada perquè es vegin els punts que la formen

Per fer-ho s’ha establert que el millor és que la imatge es defineixi prenent com a base els punts de colors que la formen. S’ha definit un estàndard que estableix quin és el caràcter que representa cada un dels colors:

Taula: Representació dels caràcters
Color Caràcter
Negre N
Blanc B
Vermell V
Blau L
Groc G
Verd D

1. En un editor de text representeu la imatge fent servir el nostre conveni.

La resolució d’aquest exercici només requereix una mica de paciència. Si el representem de la mateixa manera que està en el dibuix tindrem:

DDDDDDDNNNNNNDDDDDDD
DDDDDNNGGGGGGNNDDDDD
DDDDNGGGGGGGGGGNDDDD
DDDNGGGGGGGGGGGGNDDD
DDNGGGBBBGGBBBGGGNDD
DNGGGGBLLGGLLBGGGGND
DNGGGGBLLGGLLBGGGGND
NGGGGGGGGGGGGGGGGGGN
NGGGGGGGGGGGGGGGGGGN
NGGGGGGGGGGGGGGGGGGN
NGBBBBBBBBBBBBBBBBGN
NGGBBBBBBBBBBBBBNGGN
NGGNNNNNNNNNNNNNNGGN
NGGGNNNNVVVVVNNNGGGN
DNGGGGNVVVVVVVNGGGND
DDNGGGGGGGGGGGGGGNDD
DDDNGGGGGGGGGGGGNDDD
DDDDNGGGGGGGGGGNDDDD
DDDDDNNGGGGGGNNDDDDD
DDDDDDDNNNNNNDDDDDDD

2. Un dels usos possibles de les metadades és fer-les servir per reduir la mida dels fitxers. Representeu la imatge fent servir un sistema on abans de representar un punt es mira si els següents són del mateix color. Si els següents són del mateix color els representarem amb un número que indicarà quants n’hi ha i la lletra que representa el color. Si el següent punt és de color diferent es representa de la mateixa forma que en sistema anterior.

Per exemple: Si hem de representar cinc punts verds seguits en comptes de representar-los d’aquesta forma ‘DDDDD’ es representaran amb ‘5D’ mentre que si només hem de representar un sol punt groc el representarem de la mateixa forma que abans ‘G’

Si fem servir el sistema amb metadades tindrem:

7D6N12D2N6G2N9DN10GN7DN12GN5DN3G3B2G3B3GN3DN4GB2L2G2LB4GN2DN4GB2L2G2LB4GNDN18G2N18G2N18G2NG16BG2N2G13BN2G2N2G14N2G2N3G4N5V3N3GNDN4GN7VN3GN3DN14GN5DN12GN7DN10GN9D2N6G2N12D6N7D

3. Quin estalvi ha representat fer servir el segon mètode?

Amb el primer mètode han calgut 400 caràcters per representar la imatge, mentre que amb el segon mètode n’han calgut 174; per tant, l’estalvi d’espai és d’un 56,5%.

1 – (174/400) = 0,565

Tipus de llenguatges de marques

L’objectiu d’aquesta activitat és prendre consciència de la gran quantitat de llenguatges de marques que s’estan fent servir actualment en tots els camps de la informàtica.

Localitzeu a Internet 10 llenguatges de marques i classifiqueu-los segons si són llenguatges de marques procedimentals i de presentació o si són descriptius o semàntics.

Intenteu que entre els llenguatges de marques especificats n’hi hagi alguns que no siguin descendents d’SGML.

Una solució possible seria:

Taula: Llenguatges de marques
Llenguatge Tipus Descendent d’SGML
XML Descriptiu o semàntic
HTML Procedimental i de presentació
JSON Descriptiu o semàntic no
BBCODE Procedimental i de presentació
TeX Procedimental i de presentació no
SVG Procedimental i de presentació no
Troff Procedimental i de presentació no
Markdown Procedimental i de presentació no
GML Descriptiu i semàntic
Office Open XML Procedimental i de presentació

Anar a la pàgina següent:
Exercicis d'autoavaluació