Resum

La reproducció en temps real s’acostuma també a anomenar amb el terme anglosaxó streaming, que vol dir ‘corrent’ o ‘flux’, que al cap i a la fi és una metàfora per indicar com flueixen les dades que s’estan transmetent.

La conversió d’un senyal analògic a digital, en aquest cas un senyal d’àudio, es fa mitjançant un procediment anomenat modulació per impulsos codificats (PCM, Pulse Code Modulation) a través d’un conversor analogicodigital (ADC, A/D o analog-to-digital converter), i consta de tres etapes principals: mostreig, quantificació i codificació.

Els principals paràmetres que s’han de tenir en compte en la conversió d’un senyal analògic a digital són:

 • Freqüència de mostratge
 • Resolució (nombre de bits per mostra)
 • Nombre de canals

Un còdec és un codificador que permet la compressió del senyal digital per al seu emmagatzematge o transmissió i també el descodificador per a la seva reproducció. De fet, còdec és l’abreviació de codificador-descodificador.

Els principals formats d’àudio digital són:

 • Formats d’àudio no comprimits:
  • WAV (Waveform Audio File Format): format desenvolupat per Microsoft i IBM.
  • AIFF (Audio Interchange File Format): format desenvolupat per Apple.
  • AU: format desenvolupat per la desapareguda Sun Microsystems (absorbida per Oracle el 2010).
 • Formats d’àudio comprimits sense pèrdua (lossless compression).
  • FLAC (Free Lossless Audio Codec): format obert i lliure de royalties mantingut per la fundació Xiph.Org.
  • ALAC (Apple Lossless Audio Codec): format desenvolupat per Apple. El còdec que dona nom al format, tot i que inicialment era propietari, actualment està publicat sota una llicència de codi obert i lliure de royalties.
  • WMA lossless (Windows Media Audio): format propietari desenvolupat per Microsoft.
 • Formats d’àudio comprimits amb pèrdua (lossy compression):
  • MP3 (MPEG Audio layer III): format molt popular desenvolupat pel Moving Picture Experts Group.
  • WMA lossy (Windows Media Audio): format propietari desenvolupat per Microsoft.
  • OGG/Opus: Opus és un còdec obert i lliure de royalties desenvolupat per la fundació Xiph.Org i estandarditzat per Internet Engineering Task Force (IETF) com a RFC6716. Aquest còdec sol anar dins del format contenidor obert OGG (Ogg Vorbis).
  • AAC (Advanced Audio Coding): dissenyat per ser el successor de l’MP3, aconsegueix taxes de compressió superiors a aquest tot mantenint la mateixa qualitat. Com a container usa el format MP4 (a vegades l’extensió és M4A per identificar clarament que és un fitxer d’àudio). És el còdec/format usat per iTunes i YouTube, entre altres grans distribuïdors.
  • AC3 (Audio Codec 3): també conegut com a Dolby Digital, és un format molt estès en el cinema i en els DVD, entre d’altres.
  • RA (Real Audio): format molt utilitzat per a la reproducció d’àudio en temps real (es va reproduint mentre es fa la descàrrega). Avui en dia ha perdut força popularitat.

Les llistes de reproducció (en anglès, playlists) són llistes de fitxers d’àudio (també poden ser de vídeo) preparades per ser reproduïdes en algun mitjà, tant de forma seqüencial com aleatòria. Les entrades de fitxer d’àudio poden estar referenciades de forma externa, és a dir, fer referència a una cançó en un altre servidor. A més, les playlists poden contenir informació addicional, com ara títol, autor, disc, etc.

La sindicació és una de les principals característiques de la subscripció d’àudio. Fa que permeti la descàrrega automàtica d’arxius, principalment d’àudio, però també de vídeo, notícies, text o imatges.

La taxa de bits (en anglès, bitrate) es defineix com la freqüència amb què es transmeten les dades per un canal o, dit d’una altra manera, el nombre de bits que es transmeten per segon i que defineixen l’ample de banda. Les unitats en el sistema internacional són els bits/segon.

Per poder fer aquesta transmissió s’usen uns protocols especials que fan que no calgui usar tot l’ample de banda disponible. Una característica comuna a tots aquests protocols és descarregar inicialment un buffer (memòria intermèdia temporal) per tal de corregir possibles fluctuacions en el senyal (jitter). D’aquesta manera, la part descarregada sempre va per davant de la part que s’està reproduint. Els protocols més coneguts per a la transmissió de dades en temps real són l’RTP i l’ RTCP.

Per a la reproducció en temps real de continguts d’àudio i vídeo es pot utilitzar el protocol RTSP (Real Time Streaming Protocol), que estableix i controla un o diversos fluxos sincronitzats tals com àudio o vídeo. Aquests fluxos poden incloure fonts de dades en viu o clips emmagatzemats. Pot treballar per sobre d’RTP (no és obligatori), però també per sobre d’UDP o de TCP directament.

Un altre protocol utilitzat és l’RTMP (Real-Time Messaging Protocol). Aquest és un protocol propietari desenvolupat inicialment per Macromedia (actualment, Adobe) per a l’streaming d’àudio i vídeo entre les diferents plataformes Flash. L’streaming de bitrate adaptatiu (adaptive bitrate streaming) és una tècnica actual usada en la reproducció de continguts multimèdia. Consisteix a detectar la disponibilitat d’ample de banda per part del servidor i el client per tal d’ajustar el flux (stream) i la qualitat d’aquest. Gairebé exclusivament treballen sobre HTTP i estan dissenyats per treballar de forma eficient.

Es defineix la profunditat del color com el nombre de bits necessaris per codificar un color. Els dos principals tipus d’imatges digitals són el mapa de bits i les imatges vectorials.

Els formats d’imatges més estesos són:

 • JPEG (Joint Photographic Experts Group)
 • GIF (Graphics Interchange Format)
 • PNG (Portable Network Graphics)
 • BMP (Windows BitMaP)
 • TIFF (Tagged Image File Format)
 • SVG (Scalable Vector Graphics)

Un format contenidor (o simplement format) és un tipus de fitxer que pot contenir diversos tipus de dades, en aquest cas de vídeo. No obstant això, el més normal és que dins d’aquests contenidors hi hagi també dades d’àudio, a vegades múltiples. Per exemple, àudios en diferents idiomes o en diferents formats (estèreo, 5.1, etc.). Alguns també admeten la possibilitat d’incloure dades de text, com per exemple els subtítols.

Els formats contenidors més coneguts són:

 • AVI (Audio Video Interleave, intercalat d’àudio i vídeo): contenidor desenvolupat per Microsoft.
 • WMV (Windows Media Video): contenidor de Microsoft per a determinats còdecs propietaris seus.
 • FLV (Flash Video): contenidor específic per a Flash d’Adobe.
 • MOV: contenidor del QuickTime d’Apple.
 • MP4: contenidor estàndard per a continguts multimèdia en MPEG-4.
 • MKV (Matroska): contenidor obert i gratuït.
 • 3GPP (3rd Generation Partnership Project): format contenidor utilitzat en telèfons mòbils de tercera generació.

Els còdecs de vídeo més usats són:

 • H.264
 • H.265
 • VP6
 • VC-1
 • MPEG-4 Part 2
 • MPEG-2 Part 2
 • DV (Digital Video)

El pseudostreaming (també anomenat descàrrega progressiva) és una tècnica basada en Flash que consisteix a descarregar un fitxer multimèdia en parts petites que ja es poden anar reproduint. Una de les característiques més destacades és que permet cercar una posició concreta de l’arxiu multimèdia.

La principal funció de les videoconferències és permetre la comunicació a un determinat nombre de persones que poden estar ubicades en diferents llocs a través de la comunicació simultània i en temps real de serveis d’àudio i de vídeo, tot i que pot incloure altres serveis com xat, transmissió de documents, etc. D’aquesta manera es permet que la situació geogràfica no sigui un impediment per a reunions de qualsevol tipus, la qual cosa permet un estalvi econòmic important tant per a les empreses com per als individus en particular.

Depenent del nombre de participants en una videoconferència, podem tenir videoconferències punt a punt i multipunt.

 • Punt a punt: és la forma més simple de videoconferència. Bàsicament, un usuari busca en el seu directori un altre usuari i inicia una trucada per fer la videoconferència.
 • Multipunt: quan hi ha més de dos participants, el sistema requereix algun dispositiu que actuï com a nucli per tal de rebre i redistribuir el senyal. Aquests dispositius s’anomenen unitat de control multipunt (MCU, Multipoint Control Unit).

Els principals conjunts de normatives/estàndards que es fan servir per a les videoconferències són l’estàndard H.323 i el protocol SIP.

Anar a la pàgina anterior:
Introducció
Anar a la pàgina següent:
Resultats d'aprenentatge