You are on page 1of 6

EIE 452 02 Sistemas Computacionales

Pontificia Universidad Catlica de Valparaso Escuela de Ingeniera Elctrica

Trabajo N4 de Investigacin

Formato Compresin de Audio MP3

Autor: Andrs Arias Silva Profesor: Juan Vignolo Barchiesi EIE 452 02 Sistemas Computacionales Fecha de entrega: 5/12/2011

EIE 452 02 Sistemas Computacionales

Introduccin Uno de los formatos de compresin de audio ms usados hoy en da es el MP3, el siguiente trabajo aborda la historia del nacimiento del este formatos, temas tcnicos relacionados al clculo del espacio que utilizan estos archivos, tasa de muestreo, tasa de compresin lograda y el algoritmo que permite obtener dicha compresin. El odo humano juega un rol fundamental en la compresin MP3, se vern estas caractersticas y la relacin con la calidad del sonido del audio en este formato.

La Compaa MPEG; Nacimiento del MP3 El formato MP3 (Fig.1) fue desarrollado en el ao 1986 por Karlheinz Brandenburg1, director de tecnologas de medios electrnicos en el Instituto Fraunhofer IIS2, quien propuso desarrollar un mtodo para transmitir audio en un formato digital comprimido, creando un algoritmo (tambin llamado codec) capaz de comprimir el sonido sin perder la calidad de este. Aunque fue desarrollada aos atrs solo en julio de 1995 Brandenburg utiliz por primera vez la extensin .mp3 para los archivos que guardaba en su computadora. En 1992, la compaa Motion Picture Experts Group 3 (MPEG) aprob la tecnologa creada en Alemania as y naci el MP3 (MPEG-1 Audio Layer III). Tiempo despus se aprob el MPEG-II Audio Layer III, que fue anunciado en 1994 como el nuevo estndar de codificacin de vdeo que permita seales de vdeo entrelazadas, audio en multicanal, Dolby 5.1, codificacin de audio en frecuencias ms bajas (que supona an ms compresin que su predecesor MPEG-I).

Fig.1: Uno de los logos usados para identificar al formato MP3

Ingeniero Elctrico y Matemtico en la Universidad de Erlangen-Nremberg,). 1989 obtuvo en la misma universidad el doctorado en Ingeniera Elctrica por su trabajo en la codificacin digital de audio y tcnicas de medida perceptual. Los resultados de la investigacin de su doctorado son la base para sus logros en MPEG-1 Layer 3 (MP3), MPEG-2 Advanced Audio Coding (AAC) y otros esquemas modernos de compresin de audio. 2 Instituto Fraunhofer IIS, perteneciente al Fraunhofer-Gesellschaft una organizacin de investigacin alemana que comprende 58 institutos esparcidos por toda Alemania, cada uno con una especializacin en un campo diferente de las ciencias aplicadas. 3 Motion Picture Experts Group, es un grupo de trabajo del ISO/IEC encargado de desarrollar estndares de codificacin de audio y vdeo. Su primera reunin fue en Mayo de 1988 en Ottawa, Canad. Desde su primera reunin, el MPEG ha crecido hasta incluir 350 miembros de distintas industrias y universidades. La designacin oficial del MPEG es ISO/IEC JTC1/SC29 WG11.
2

EIE 452 02 Sistemas Computacionales

El Odo Humano; Efecto Enmascaramiento El odo humano (Fig.2) puede percibir entre un rango de frecuencias de los 20 Hz. y los 20 Khz. La sensibilidad del odo se hace mayor en la zona alrededor de los 2 a 4 Khz. de forma que el sonido resulta ms difcilmente audible en cuanto ms cercano a los extremos de esta escala se est. El enmascaramiento es aquel efecto que se produce cuando dos seales de frecuencia similar se superponen. Entonces solo se puede percibir aquella que posee ms volumen y, por lo tanto, la de volumen menor es susceptible de ser eliminada. Este efecto se produce cuando una componente de una seal que tiene una energa elevada y que est a cierta frecuencia, el odo no puede percibir componentes de menor energa en frecuencias cercanas, tanto inferiores como superiores.

Fig.2: Las partes internas del odo humano

A una cierta distancia de la frecuencia enmascaradora, el efecto se reduce tanto que resulta despreciable; el rango de frecuencias en las que se produce el fenmeno se denomina banda crtica (critical band). Las componentes que pertenecen a la misma banda crtica se influyen mutuamente y no afectan ni se ven afectadas por las que aparecen fuera de ella. La amplitud de la banda crtica es diferente segn la frecuencia, datos se obtienen por experimentos psicoacsticos4, que se realizan con expertos entrenados en percepcin sonora, dando origen con sus impresiones a los modelos psicoacsticos. Muestreo; Digitalizacin de una Seal Las seales digitales requieren un ancho de banda mucho mayor que una seal analgica, por ello se realiza un estudio intensivo en lo referente a la compresin de datos. El proceso de digitalizacin se compone de dos fases, muestreo y cuantificacin. En el muestreo se divide el eje del tiempo en segmentos discretos, es decir, la frecuencia de muestreo ser la inversa del tiempo que medie entre una medida y la siguiente. En estos momentos se realiza la cuantificacin, que, en su forma ms sencilla, consiste simplemente en medir el valor de la seal en amplitud y guardarlo.
4

Psicoacstica, ciencia estudia la compresin sonora, tales como la amplitud, ecualizacin y acstica. Estas cualidades o caractersticas del sonido estn, a su vez, determinadas por los propios parmetros del sonido, principalmente, frecuencia y amplitud. Tambin estudia la relacin entre la sensacin percibida por un sonido determinado y los parmetros de este
3

EIE 452 02 Sistemas Computacionales

El teorema de Nyquist garantiza que la frecuencia necesaria para muestrear una seal que tiene sus componentes ms altas a una frecuencia dada es como mnimo 2 veces esa frecuencia. Por tanto, la frecuencia que garantiza un muestreo adecuado para cualquier sonido audible ser de unos 40 Khz. En lo referente a la cuantificacin, entre ms bits se utilicen para la divisin del eje de la amplitud, ms fina ser la particin y menor el error al atribuir una amplitud concreta al sonido en cada instante. El proceso completo (muestreo y cuantificacin) se denomina habitualmente PCM (Pulse Code Modulation) Audio MP3; Grabacin en un CD La digitalizacin de la seal mediante PCM (Fig.3) es la forma ms simple de codificacin de la seal, y es la que utilizan los CDs convencionales. El muestreo PCM inevitablemente aade ruido a la seal, y cuantos menos bits se usen en el muestreo y cuantificacin, mayor ser el error al aceptar valores discretos para la seal continua. Para evitar que el ruido alcance un alto nivel se emplea un gran nmero de bits, de forma que muestreando a 44.1 Khz. (con esta frecuencia se obtiene sonido de alta calidad en un CD), graba 44.100 muestras de 16 bit (2 bytes) en cada segundo. Al multiplicar 2 bytes * 44.100 para una seal de doble canal (estreo) se obtiene que se necesitan 88.200 bytes por segundo en cada canal. Multiplicando por 60 (segundos), se aprecia que en un solo minuto de grabacin en calidad CD ocupa 10.584.000 bytes, es decir, 10.09 Mb por minuto.)

Fig.3: Muestreo y cuantificacin de una onda senoidal ( color rojo) en cdigo PCM de 4-bits

Gran parte de esta informacin es innecesaria y ocupa un ancho de banda que podra liberarse, aumentando la complejidad del sistema que decodifica incurriendo en la prdida de calidad del sonido. Calidad Telfono Radio AM Radio FM CD DAT Muestreo 8 KHz 11.025 Khz 22.050 Khz 44.1 Khz 48 Khz Bits/Muestra 8 8 16 16 16 Modo Mono Mono Estreo Estreo Estreo Tasa de Bits 64 kbps 88 kbps 705.6 kbps 1411.2 kbps 1536 kbps

Tabla 1.1: Tabla comparativa entre distintos formatos de calidad de audio

EIE 452 02 Sistemas Computacionales

Una mejor manera de codificar la seal es mediante PCM no-lineal o cuantificacin logartmica, que consiste en dividir el eje de la amplitud de tal forma que los escalones sean mayores cuanta ms energa tiene la seal, con lo que se consigue una relacin seal/ruido igual o mejor con menos bits. Con este mtodo se puede reducir el canal de CD audio a 350 kbps, lo cual es una mejora, aunque puede reducirse mucho ms. Otros sistemas similares llevan a la cuantificacin adaptativa (APCM), diferencial (DPCM) y la mezcla de ambas, ADPCM. As prosigue la reduccin del ancho de banda, pero sin llegar a los niveles que proporciona el tener en cuenta los efectos del enmascaramiento. El Bitrate; Tasa de Compresin Este formato permite seleccionar la relacin de compresin del archivo de origen. Los mrgenes a nivel domstico se sitan entre los 8 Kbps y los 340 Kbps, siendo 128 Kbps la tasa de transferencia equivalente a la calidad CD. El Bitrate es la unidad de medida de la tasa de transferencia de datos de lectura de un archivo MP3. En cuanto mayor sea la tasa bitrate de un archivo MP3 (Fig.4), mayor ser la cantidad de datos que un reproductor puede obtener en un segundo). A ms contenido instrumental o calidad contiene un archivo de audio mayor es la tasa de transferencia que este requerir para reproducir con totalidad la informacin, as es como se define la calidad del archivo MP3, ya que si al comprimir el archivo se reduce ese ancho de banda, se sacrifican algunos de esos datos, traducindose a prdidas de informacin que influirn en el resultado final de la conversin.

Fig.4:En la imagen el programa MP3 Quiality Modifier, un convertidor de bitrate comercial para archivos en formato MP3 5

EIE 452 02 Sistemas Computacionales

Conclusiones El formato descrito presenta una gran ventaja al momento de elegir un archivo de menor tamao para introducirlo en un dispositivo de audio que reproduzca MP3. La calidad de estos archivos sin embargo es mucho menor si se comprimen a una baja tasa (bitrate), el ms utilizado es el de 128 Kbps pero hoy en da los amantes de la msica que utilizan el MP3 comprimen sus archivos a una tasa de 320 Kbps que si bien es ms pesada ofrece una mayor calidad sonora. Existen muchos formatos de audio como por ejemplo WAV, AIFF o AU (sin prdidas); FLAC,MPEG-4 SLS, MPEG-4 ALS, MPEG-4 DST, WavPack, Shorten, TTA, ATRAC (comprimidos sin prdidas) y Vorbis, Musepack, AAC y WMA (con prdidas). A pesar de la variedad el MP3 sigue siendo el principal formato que reina en internet.

Referencias http://wikipedia.org /Definiciones, Historia http://howstuffworks.com/mp3 / Muestreo, Bitrate http://www.pcdoctor.com.mx /Informacin general http://www.configurarequipos.com /Bitrate http://whatis.techtarget.com /Definiciones, informacin general

You might also like