Formatos de audio

Comprensión sobre compresión, sonido, y música en 4 mini tomos

Tomo 1

¿Quién se robo mi música ?

Antes de nada, hay que saber diferenciar entre “formato de archivo” y “códec”. El primero es el que debemos tener en cuenta a la hora de elegir lo que buscamos, o las características que va a tener ese archivo; el “codec” simplemente codifica y decodifica el archivo a la hora de usarlo.
El formato de un archivo depende el “ratio de compresión” y de la “frecuencia de muestreo” utilizados, lo que nos dará un tamaño y una calidad concretos, dependiendo de nuestras necesidades (transmisión por la Red, streaming, correo-e o el simple almacenamiento en un disco duro en casa). El ratio de compresión es la relación que va a tener el archivo comprimido con el original respecto al tamaño, una relación directamente proporcional: a mayor ratio mayor compresión. No debemos confundir la compresión de audio (procesamiento de dinámica en audio para conseguir más profundidad y presencia de una señal en concreto) con la compresión de un formato. La frecuencia de muestreo es el número de muestras por segundo a la hora de pasar una onda de audio de analógico a digital

Onda de sonido analógica

Proceso de muestreo

En el caso de la calidad CD, la frecuencia de muestreo es de 44.1 (44.100 muestras por segundo), dado que esta es la que mejor refleja el rango de frecuencias de un oído joven y sano (de 20Hz a 20KHz.). También conviene utilizar una frecuencia de muestreo acorde con la naturaleza del sonido que vayamos a grabar, pues podemos economizar en este aspecto. Por ejemplo, si queremos registrar la voz de una cantante soprano, no habrá frecuencias relevantes de 10 a 20KHz, por lo tanto un “sample rate” de 44.1 sería innecesario.
Existen 3 tipos de formatos: sin comprimir (WAV, AIFF o AU), comprimidos sin pérdida (o también conocidos como “lossless”, WMA, FLAC, TTA, ATRAC) y comprimidos con pérdida (o “lossy”, como el famoso MP3, AAC… etc.).
En el caso del formato sin comprimir, en el que no existe ningún tipo de procesamiento de la señal, el audio que escuchamos es el audio real que se grabó; por otro lado, el formato comprimido sin pérdida, simplemente es un aprovechamiento de los silencios y otros factores para que el archivo pese algo menos, pero sin pérdida de señal o recorte en frecuencias. Y por último, los formatos con pérdida directamente recortan “frecuencias no audibles” para hacer que el archivo de audio sea muy liviano.
Personalmente os propongo que escuchéis un audio en MP3 y otro en WAV para que veáis la enorme diferencia que existe entre ambos formatos, la pérdida es considerable y para mi gusto un “temazo” en MP3 no tiene nada que ver con la misma canción en WAV.
Ahora veamos algunas características de algunos formatos de los formatos más populares:

WAV

Si queremos que no se pierda calidad, yo recomiendo el WAV (o su equivalente en Mac, el formato AIFF), pero ocupan mucho espacio. (Por eso, en los CDs sólo caben 15-20 canciones en este formato). Un minuto de música en calidad CD ocupa aproximadamente unos 15 Megas; audio a 44.100 Hz a 16 bits en estéreo ocupa 172 Kbps, dato nada despreciable, y más si lo que queremos es mover dicho archivo por Internet. Una canción en formato WAV suele rondar los 45 megas. Archivos con este formato pondrán a prueba nuestra paciencia en la red. Si fuese de un ordenador a otro por conexión de área local no habría mucho problema, pero en Internet la cosa es diferente. La solución será comprimir el archivo o bajarlo de calidad. La compresión ofrece, obviamente, muchas más garantías. Éste y otros formatos sin compresión similares, son “fieles al oído humano” y reproducen lo grabado en todo el espectro audible (20Hz-20KHz), proporcionando una escucha real y fiel del producto o el archivo de audio en cuestión (por esto me alegro de que mi reproductor de música del coche solo reproduzca calidad CD y no MP3), pero el formato WAV no es nada popular en la red debido a su enorme tamaño.

MP3

Aún así, todo parece indicar que el MP3 es “el mejor formato”, pero si lo que queréis son unos graves profundos, redondos, y unos agudos brillantes, o un estéreo con abertura y espacio sonoro, con el MP3 no va a ser posible conseguirlo, pues se sabe que este formato hace una criba conservando solo frecuencias comprendidas aproximadamente entre los 200Hz-15KHz…se come por completo las frecuencias fundamentales de instrumentos como el bajo, el bombo, el charles o el imprescindible crash de la batería. Con el uso de formatos en MP3 o MP4, archivos que ocupaban 45 megas pasan a ocupar 4 o 5 megas o menos, lo cual hace que el sistema de distribución por paquetes de Internet y las relaciones y “feedbacks” entre profesionales del audio sea muchísimo más llevadera y fácil, sacrificando un poco de calidad por tener unos archivos muchísimo más manejables. El MP3 a 192K es pues del formato más cómodo y eficiente a la hora de moverlo de un sitio o de un programa a otro. En la relación “calidad-espacio” es el que mejor resultados da. Mis compañeros de equipo/grupo y yo, solemos usar este formato para intercambiar preliminares de mezclas o fragmentos de música, pero jamás se nos ocurriría utilizar este formato a la hora de distribuir nuestro trabajo. Igualmente, cuando sonorizamos algo y le mandamos un preliminar al director utilizaremos dicho formato. Pero solo para preliminares, el producto final se lo damos en mano o por correo en cualquier formato con mayor calidad, es decir, aunque el producto final siempre será presentado en .wav, todo lo demás en MP3 a 192Kbps.

MP4

Otro formato bastante importante y que ha tenido un boom en los últimos años es el MP4. En realidad la calidad de este formato es muy parecida a la del MP3, pero con un tamaño mucho más reducido. También podemos encontrar este tipo de compresión en los famosos FLV de Youtube y muchas otras páginas de Internet. El MP4 es el rey de los formatos de audio en Internet, y generalmente es el que encontraremos a la hora de reproducir audio en la Web y sobre todo en smartphones y cualquier otro pequeño dispositivo. Dada su versatilidad y su extraordinaria compresión es el formato ideal para mover archivos por la Red.

RAX

En el caso de los famosos “streamings” se utiliza casi exclusivamente un formato conocido como RealAudio (RAX), basado en el formato ACC propiedad de Apple que mejora el rendimiento del MP3 y está destinado principalmente a reproductores portátiles.

FLAC

Sin embargo si lo único que queremos es preservar nuestros discos de música favoritos, una de las mejores opciones a elegir es el formato libre de compresión sin pérdida FLAC (o .FLA). Una canción comprimida mediante este formato pesa entre el 70% y el 50% que la original (menos que en ZIP), con una gran calidad y reproducible en la mayoría de los reproductores de los distintos sistemas operativos (Linux, Microsoft, Apple…etc.). No es una gran reducción, pero eso es debido a que no elimina información del contenido original. Con la creciente irrupción de conexiones con mayor ancho de banda, este formato se ha convertido en un o de los favoritos a la hora de comprar música por Internet y como una de las alternativas al MP3 para no perder tanta calidad con la reducción de tamaño. No es que unos sean mejores que otros, todo depende de lo que queramos hacer con los archivos de audio que vamos a utilizar, la calidad que estemos buscando o el espacio del que dispongamos para almacenar dichos archivos. Si queremos enviar por mail algún archivo de audio, o moverlo por la red, la mejor manera sin duda es en MP3 o MP4, dado que son los formatos que menos espacio ocupan y por lo tanto los que menos problemas nos va a dar a la hora de enviarlos.
A la hora de elegir un formato de audio en nuestros proyectos (vídeos, canciones o películas Flash) lo mejor es usar la mejor calidad posible y luego ya convertiremos la mezcla final o el archivo final al formato que deseemos para moverlo por la Red. No sería buena idea utilizar archivos de audio en MP3 y luego pretender que la mezcla final tenga la calidad de un .wav o un .flac. Mi consejo es que utilicéis la mejor calidad posible en vuestra estación de trabajo y, a la hora de distribuir el producto final, utilicéis el formato que más os guste para moverlo por Internet (.FLAC, .MP3 -a 192Kbps, mi recomendación-) o .MP4). Si habéis utilizado una buena calidad en la premezcla y el campo sonoro (el estéreo) es rico y con matices, al reducir la calidad no desaparecerá por completo y el destinatario podrá hacerse una idea de cómo sonaría en calidad óptima.
También hay que tener en cuenta el tema de la distribución. Vivimos en un mundo de libre mercado y es prácticamente imposible estandarizar todo a tres únicos formatos. A las empresas les interesa que haya una diferenciación. Por eso, por lo general Windows tiende a un formato (WMA), Apple a otro (ACC), Sony (ATRAC)….etc.
A continuación os dejo una tabla de formatos de audio para que podáis echar un rápido vistazo y decidir cuál es el formato que os interesa o más se ajusta a vuestras necesidades:

	Formato		Descripción
Formatos sin compresión	WAV		Formato propio de Windows
	AU		Formato de UNIX ( Linux )
	AIFF		Formtao propio de Mac OS
Formatos comprimidos	Formatos “lossy” (con pérdida)	MPEG-1Audio Layer 3(mp3)	Se considera el estándar de audio digital. Relación de compresión de 10:1 patentado.
		MP3PRO (mp3)	Evolución del mp3. La mitad de peso en un mp3 normal con la misma calidad.
		ACC	Mejora el rendimiento del MP3. Propiedad de Apple. Reproducible en dispositivos portátiles.
		ACC+	Evolución del ACC. Mejora su calidad.
		OGG	Formato libre. Mejora la calidad de un MP3 del mismo tamaño.
		MPC	Ofrece una mejor calidad de audio a altas relaciones de datos (Kbps). Soporte portátil nulo.
		WMA	Competencia de Microsoft para el MP3. Calidad muy parecida a éste.
		RealAudio (RAX)	Formato casi exclusivo para el streaming. Basado en el formato ACC.
		AC3	Propio de los dvd. Permite varios canales de audio (5.1 y 7.1).
		ATRAC3 (Atrac)	Formato exclusivo de Sony para sus reproductores.
	Formatos sin pérdida	flac	Reduce entre un 30% y un 50% el tamaño de un archivo de audio manteniendo intacta la calidad.
		Monkey´s Audio (ape)	Alcanza grandes relaciones de datos (hasta 700kbps) conservando intacta la calidad.
		Apple Lossless (alac)	Creado especialmente para el Ipod.
		Shorten (shn)	Similar al flac, pero usa menos recursos para su reproducción.
		WavPack	Híbrido entre lossy y lossless, pequeño tamaño pero excelente calidad.

Resulta un poco incómodo todo este tema de los formatos y te puede llegar a parecer un laberinto, pero a medida que se trabaja con ellos y uno empieza a familiarizarse, acabas por apreciarlos, pues cada uno tiene unas características y unas funciones específicas dentro de la producción/procesamiento de cualquier tipo de audiovisual y cuanto más herramientas específicas tengamos a nuestra disposición, tanto mejor.

Tomado de internet y reproducido integramente
Autor José María Guiu

Tomo 2

Descripción de la técnica de compresión MP3

1. Introducción: Qué es el MP3
MP3 es un formato de datos que debe su nombre a un algoritmo de codificación llamado MPEG 1 Layer 3, el cual, a su vez, es un sistema de compresión de audio que permite almacenar sonido con una calidad similar a la de un CD y con un índice de compresión muy elevado, del orden de 1:11. En la práctica, esto significa que en un CD-Rom se pueden grabar unos 11 CD de audio, es decir, unas 150 canciones aproximadamente.
El sistema de codificación que utiliza MP3 es un algoritmo de pérdida. Es decir, el sonido original y el que obtenemos posteriormente no son idénticos.
Esto se debe a que MP3 aprovecha las deficiencias del oído humano y elimina toda aquella información que no somos capaces de percibir. Se han realizado multitud de estudios de percepción acústica descubriendo que hay una serie de efectos que pueden ayudar a la codificación del sonido con el objetivo de reducir todo lo posible la cantidad de información inútil o redundante. Los más importantes son:

Los límites de audición.
Nuestro oído solo trabaja con frecuencias que van entre los 20 Hz y los 20 Khz aproximadamente, con lo que las frecuencias restantes son descartables.

Efecto de enmascaramiento.
Es aquel que se produce cuando dos señales de frecuencia similar se superponen. Entonces solo podemos percibir aquella que posee más volumen y, por lo tanto, la de volumen menor es susceptible de ser eliminada.

Redundancia de estéreo.
Existen redundancias entre los componentes tonales y no tonales del sonido en los dos canales estéreo, y, además, por debajo de una cierta frecuencia el oído humano no es capaz de percibir la direccionalidad del sonido, por lo cual por debajo de estas frecuencias es posible incluso codificar un solo canal, junto con información complementaria para restaurar la sensación espacial para el otro canal.
Para realizar ésta acción de "pérdida de información" se utiliza un sistema llamado Codificación de SubBandas, proceso por el cual la señal se
descompone en subbandas a través de un banco de filtros. Éstas subbandas se comparan a continuación con el original mediante un modelo psicoacústico que es el encargado de determinar que bandas se pueden eliminar y cuales no. Dependiendo de la calidad que deseemos obtener, se eliminarán más o menos
bandas. Para finalizar el proceso, se cuantifican y codifican las subbandas resultantes, y el resultado final se comprime mediante un algoritmo estándar,
obteniendo así el fichero MP3 resultante. El proceso de codificación es mucho más complicado que el de decodificación, por ello se tarda mucho más en
codificar un archivo MP3 que en reproducirlo.
Este algoritmo de codificación perceptual fue desarrollado por la sociedad MPEG (Moving Picture Expert Group) en conjunción con el Instituto Tecnológico de Franunhofer, y se ha estandarizado como una norma ISO.

2. Descripción de la técnica de compresión MP3 para audio

2.1. Digitalización.
El sonido es una onda continua que se propaga a través del aire u otros medios, formada por diferencias de presión, de forma que puede detectarse por la medida del nivel de presión en un punto. Las ondas sonoras poseen las características propias y estudiables de las ondas en general, tales como reflexión, refracción y difracción. Al tratarse de una onda continua, se requiere un proceso de digitalización para representarla como una serie de números. Actualmente, la mayoría de las operaciones realizadas sobre señales de sonido son digitales, pues tanto el almacenamiento como el procesado y transmisión de la señal en forma digital ofrece ventajas muy significativas sobre los métodos analógicos. La tecnología digital es más avanzada y ofrece mayores posibilidades, menor sensibilidad al ruido en la transmisión y capacidad de incluir códigos de protección frente a errores, así como encriptación. Con los
mecanismos de decodificación adecuados, además, se pueden tratar simultáneamente señales de diferentes tipos transmitidas por un mismo canal. La desventaja principal de la señal digital es que requiere un ancho de banda mucho mayor que el de la señal analógica, de ahí que se realice un exhaustivo estudio en lo referente a la compresión de datos, algunas de cuyas técnicas serán el centro de nuestro estudio.
El proceso de digitalización se compone de dos fases: muestreo y cuantización.
En el muestreo se divide el eje del tiempo en segmentos discretos: la frecuencia de muestreo será la inversa del tiempo que medie entre una medida y la
siguiente. En estos momentos se realiza la cuantización, que, en su forma más sencilla, consiste simplemente en medir el valor de la señal en amplitud y guardarlo. El teorema de Nyquist garantiza que la frecuencia necesaria para muestrear una señal que tiene sus componentes más altas a una frecuencia dada f es como mínimo 2f. Por tanto, siendo el rango superior de la audición humana en torno a los 20 Khz, la frecuencia que garantiza un muestreo adecuado para cualquier sonido audible será de unos 40 Khz.
Concretamente, para obtener sonido de alta calidad se utilizan frecuencias de 44'1 Khz, en el caso del CD, por ejemplo, y hasta 48 Khz, en el caso del DAT. Otros valores típicos son submúltiplos de la primera, 22 y 11 Khz. Según la naturaleza de la aplicación, por supuesto, las frecuencias adecuadas pueden ser muy inferiores, de tal manera que el proceso de la voz acostumbra a realizarse a una frecuencia de entre 6 y 20 Khz. o incluso menos. En lo referente a la cuantización, es evidente que cuantos más bits se utilicen para la división del eje de la amplitud, más "fina" será la partición y
por tanto menor el error al atribuir una amplitud concreta al sonido en cada instante.
Por ejemplo, 8 bits ofrecen 256 niveles de cuantización y 16, 65536. El margen dinámico de la audición humana es de unos 100 dB. La división del eje se puede realizar a intervalos iguales o según una determinada función de densidad, buscando más resolución en ciertos tramos si la señal que se trata tiene más componentes en cierta zona de intensidad, como veremos en las técnicas de codificación.
El proceso completo se denomina habitualmente PCM (Pulse Code Modulation) y así nos referiremos a el en lo sucesivo. Se ha descrito de forma sumamente simplista, principalmente porque está ampliamente tratado y es sobradamente conocido, siendo otro el campo de estudio de este trabajo. Sin embargo, entra
remos en detalle en todo momento que sea necesario para el desarrollo de la exposición.

2.2 Codificación y Compresión
Antes de describir los sistemas de codificación y compresión, debemos detenernos en un breve análisis de la percepción auditiva del ser humano, para comprender por qué una cantidad significativa de la información que proporciona el PCM puede desecharse.
El centro de la cuestión, en lo que a nosotros respecta, se basa en un fenómeno conocido como enmascaramiento.El oído humano percibe un rango de frecuencias entre 20 Hz. y 20 Khz. En primer lugar, la sensibilidad es mayor en la zona alrededor de los 2-4 Khz., de forma que el sonido resulta más difícilmente audible cuanto más cercano a los extremos de la escala. En segundo lugar está el enmascaramiento, cuyas propiedades utilizan exhaustivamente los algoritmos más interesantes: cuando la componente a cierta frecuencia de una señal tiene una energía elevada, el oído no puede percibir componentes de menor energía en frecuencias cercanas, tanto inferiores como superiores. A una cierta distancia de la frecuencia enmascaradora, el efecto se reduce
tanto que resulta despreciable; el rango de frecuencias en las que se produce el fenómeno se denomina banda crítica (critical band). Las componentes que
pertenecen a la misma banda crítica se influyen mutuamente y no afectan ni se ven afectadas por las que aparecen fuera de ella. La amplitud de la banda crítica es diferente según la frecuencia en la que nos situemos y viene dada por unos determinados datos que demuestran que es mayor con la frecuencia. Hay que señalar que estos datos se obtienen por experimentos psicoacústicos, que se realizan con expertos entrenados en percepción sonora, dando origen con sus impresiones a los modelos psicoacústicos.
Este que hemos descrito es el llamado enmascaramiento simultáneo o en frecuencia. Existe, asimismo, el denominado enmascaramiento asimultáneo o en el tiempo (ver apéndice 2), así como otros fenómenos de la audición que no resultan relevantes en este punto. Por ahora, centrémonos en la idea de que ciertas componentes en frecuencia de la señal admiten un mayor ruido del que generalmente consideraríamos tolerable y, por tanto, requieren menos bits para ser codificadas si se dota al codificador de los algoritmos adecuados para resolver máscaras.
La digitalización de la señal mediante PCM es la forma más simple de codificación de la señal, y es la que utilizan tanto los CD como los sistemas DAT. Como toda digitalización, añade ruido a la señal, generalmente indeseable.
Como hemos visto, cuantos menos bits se utilicen en el muestreo y la cuantización, mayor será el error al aceptar valores discretos para la señal continua, esto es, mayor será el ruido. Para evitar que el ruido alcance un nivel excesivo hay que emplear un gran número de bits, de forma que a 44'1 Khz. y utilizando 16 bits para cuantizar la señal, uno de los dos canales de un CD produce más de 700 kilobits por segundo (kbps). Como veremos,
gran parte de esta información es innecesaria y ocupa un ancho de banda que podría liberarse, a costa de aumentar la complejidad del sistema decodificador e incurrir en cierta pérdida de calidad. El compromiso entre ancho de banda, complejidad y calidad es el que produce los diferentes estándares del mercado y formará la parte esencial de nuestro estudio.

Tabla 1: comparación de formatos de calidad de audio

Un modo mejor de codificar la señal es mediante PCM no - lineal o cuantización logarítmica, que como ya comentamos consiste en dividir el eje de la amplitud de tal forma que los escalones sean mayores cuanta más energía tiene la señal, con lo que se consigue una relación señal/ruido igual o mejor con menos bits. Con este método se puede reducir el canal de CD audio a 350 kbps, lo cual evidentemente es una mejora sustancial, aunque puede reducirse mucho más. Otros sistemas similares nos llevan a la cuantización adaptativa (APCM), diferencial (DPCM) y la mezcla de ambas, ADPCM.
Así prosigue la reducción del ancho de banda, pero sin llegar a los niveles que proporciona el tener en cuenta los efectos del enmascaramiento.

2.3 Codificación sub-banda (SBC).
La codificación sub-banda o SBC (sub-band coding) es un método potente y flexible para codificar señales de audio eficientemente. A diferencia de los métodos específicos para ciertas fuentes, el SBC puede codificar cualquier señal de audio sin importar su origen, ya sea voz, música o sonido de tipos variados. El estándar MPEG Audio es el ejemplo más popular de SBC, y lo analizaremos posteriormente en detalle.
El principio básico del SBC es la limitación del ancho de banda por descarte de información en frecuencias enmascaradas. El resultado simplemente no es el mismo que el original, pero si el proceso se realiza correctamente, el oído humano no percibe la diferencia. Veamos tanto el codificador como el decodificador que participan en el tratamiento de la señal.
La mayoría de los codificadores SBC utilizan el mi smo esquema. Primero, un filtro o un banco de ellos, o algún otro mecanismo descompone la señal de entrada en varias subbandas. A continuación se aplica un modelo psicoacústico que analiza tanto las bandas como la señal y determina los niveles de enmascaramiento utilizando los datos psicoacústicos de que dispone. Considerando estos niveles de enmascaramiento se cuantizan y codifican las muestras de cada banda: si en una frecuencia dentro de la banda hay una componente por debajo de dicho nivel, se desecha.
Si lo supera, se calculan los bits necesarios para cuantizarla y se codifica. Por último se agrupan los datos según el estándar correspondiente que estén utilizando codificador y decodificador, de manera que éste pueda descifrar los bits que le llegan de aquél y recomponer la señal.
La decodificación es mucho más sencilla, ya que no hay que aplicar ningún modelo psicoacústico. Simplemente se analizan los datos y se recomponen las bandas y sus muestras correspondientes.
En los últimos diez años la mayoría de las principales compañías de la industria del audio han desarrollado sistemas SBC. A finales de los años ochenta, un grupo de estandarización del ISO llamado Motion Picture Experts Group (MPEG) comenzó a desarrollar los estándares para la codificación tanto de audio como de vídeo.

Texto tomado de Paraguas Malva y reproducido integramente

Tomo 3

Propiedades de la serie armónica

El primer sonido de la serie, o sonido fundamental, tiene una frecuencia que coincide con la de la nota cuya altura se percibe. El resto de los sonidos se añaden a éste sin alterar su altura aparente, pues el oído funde o integra todos los armónicos en una sola sensación.
El segundo sonido de la serie tiene una frecuencia doble de la del primero. Su altura es una octava por encima de aquél.
El tercer sonido tiene una frecuencia triple de la del primero, y está en una proporción de 3 a 2 con la del segundo; su altura es una quinta justa por encima de éste, y una doceava (intervalo compuesto por una octava más una quinta) por encima del primero.
El cuarto sonido tiene una frecuencia doble de la del segundo; su altura será una octava por encima de éste, y por tanto serán dos octavas por encima del fundamental. Cada vez que el número de orden (o índice) de un armónico es doble, su altura estará siempre una octava por encima.

En una teoría simplificada del timbre musical, cada uno de los sonidos de la serie armónica es un componente del timbre o color del sonido representado por una nota cuya frecuencia es la del sonido fundamental. A los sonidos de la serie armónica, componentes del timbre, se les llama sonidos armónicos o simplemente armónicos.

Desde el punto de vista energético, los armónicos con un índice mayor transportan más energía a igual amplitud de la vibración. El espectro del conjunto de armónicos está limitado en su frecuencia, en función de la energía total. Lo más común, pues, es que los primeros armónicos tengan mayor amplitud y que ésta vaya disminuyendo progresivamente a lo largo de la serie, hasta extinguirse. Sin embargo, al excitar un cuerpo sonoro con una energía mayor, el sonido será más rico en armónicos agudos, sobre todo en el momento del ataque y durante poco tiempo. Esto se cumple en las cuerdas frotadas, pulsadas o percutidas, y en los tubos, tanto de bisel como de lengüeta o boquilla: cuando aumenta la intensidad del ataque, el timbre es más claro y brillante.

La contribución de cada armónico al timbre del sonido, en su lugar correspondiente dentro de la "mezcla", es el que sigue:
El sonido fundamental proporciona por sí solo la misma sensación de altura que el fundamental con todos sus armónicos; decimos que la frecuencia de la nota que se oye es igual a la del sonido fundamental.
Debido al fenómeno de la "fundamental fantasma" que tiene su explicación en el carácter no lineal del oído humano, el sonido fundamental no es imprescindible para percibir el conjunto como una nota con la misma altura, siempre y cuando existan o suenen el resto de los sonidos de la serie. El oído "reconstruye" el sonido que falta como si dedujese este resultado de una ecuación cuya única solución posible es esta fundamental.
Los sonidos números 2, 4, 8 y todos los que forman una relación igual a una potencia de 2 con la fundamental, refuerzan el carácter inequívoco de la sensación de altura del conjunto.
Los sonidos 3, 6, 12 y todos aquellos que forman con el 3 una relación que es una potencia de 2, aportan un timbre nasal al conjunto.
Los sonidos 5 y 10 producen un timbre o color "redondo", "profundo", "cálido" y otros adjetivos semejantes.
Los sonidos 7, 11, 13 y 15 son disonantes y dan un carácter "áspero" al sonido.
Al crecer el número de orden de un armónico, su aportación es de más brillantez o claridad; más brillantez que claridad si es un número múltiplo de los 16 primeros excepto los que hemos denominado como disonantes.

wikipediazo

Tomo 4

Finale energico ma non tanto

Los textos anteriores sobre la tecnología usada en los archivos sonoros y música, nos explica que pasa técnicamente con ellos y cual nos conviene usar en cada caso.
Comencé a acumular música desde los 15 años, y la tecnología nos va cambiando la perspectiva de lo que vemos, aprendemos, o escuchamos, y es el caso de la música.
Como les decía, comencé a guardar en mp3 para tener mas archivos (oh “my precious”), y claro, en muchos lugares te decían que 128 era un buen bitrate para la música, aunque también estaban los exquisitos que decían que no, que el mp3 320 era la neta o los equilibrados y del justo medio, que aseguraban que 192 es el bitrate correcto y perfecto, pues se escuchan todos los registros audibles para el oído humano, también las compañías contribuyeron a todo este barullo cuando salieron los ipod y los etcéteras pots, se popularizó el uso de mp3, y todos contentos. Podías llevar toda tu discoteca (bueno ya no se puede decir discoteca, tal vez fonoteca o audioteca), en el bolsillo, y se escucha de poca madre, y todos fuimos felices. (so happy together)

pero...

Repentinamente esa felicidad y tranquilidad que nos daba el mp3 se hizo un poco turbia al aparecer otro formato, el Flac y las comunidades de lossless, ¿que era eso que nos perturbaba? y no solo llegaron los Flac, también los solitarios sibaritas sonoros, que propugnaban por el 24/96 wav??? y los gourmets auditivos con los .DFF que casi nadie puede leer y una canción te ocupa los 400 Megas, también las hordas de análogos exigían sus cálidos sonidos y así, las comunidades sonoras se diversificaron.

pero...

He estado leyendo un poco sobre la diferencia entre mp3 y wav, pues un día estábamos en casa unos amigos y el Javier dijo, pues yo no percibo la diferencia entre mp3 y wav, el Roberto le respondió que el mp3 era una mierda y que no debía existir, y Jaime decía que a ojos cerrados no se podia diferenciar si era un mp3 o un wav, Roberto respondió que si lo escuchabas en un pinche Ipod con micro-audífonos chafas, no podrías diferenciar si era Pearl Jam o Arthur Rubinstein, a lo cual Jaime lo retó a que lo demostrara, total, casi terminan a madrazos esa noche.

Una noche que había trabajado mucho, eran como las 3 de la mañana, y por el cansancio no podía dormir, decidí escuchar un poco de música para relajarme y poder descansar, se me antojó algo de Janis Joplin, un buen blusesito, tenía varias versiones una en 24/96 otra en mp3 320 y otras más, me coloqué los audífonos y escogí el mp3 por tenerlo más al alcance, sonaba brillante, lo podías sentir frente de ti, aquí justo a 2 milímetros del tímpano y la coclea, mmm que delicia, repentinamente me acordé que tenía la version 24/96 y me dije a ver a ver... (o mejor a oír a oír).
Puse la version 24/96 y ¡tomala guey! se escuchaba más bajito y más lejano, no lo podía creer, volví a poner la version mp3 y lo escuchaba aquí en plena cara y orejas ???????? y mas ???????.
¿cómo es posible que el mp3 se escucha mejor que mi preciada version HHHDDD?, a ver.
Prueba científica.
Metodo y precisión.
Equipo: reproducción en computadora con tarjeta de salida externa, audífonos Sennheiser de estudio (6 meses pagando los audífonos, y bueno... suenan muy bien) y decidí revisar el archivo en Audition ccc 666 y si en efecto tenía menos volumen, luego, revision del mp3 y hasta arriba, o sea, le metieron el compresor al líumite, mmm.

Primera observación:
- MP3 todo esta al tope con el compresor. No existe rango dinámico, todo esta arriba es un pinche bloquesote de sonido, no siempre sucede esto de los compresores a tope, pero si aplana y sube los sonidos. Supongo para compensar.

- 24/96 wav tiene menos volumen pero mas rango dinámico. Lo cual me permite subir el volumen sin problemas de saturación y mantener el rango dinámico (vale la pena mencionar que a mi parecer, es bueno digitalizar en 24/96 si estas pasando material de vinil a digital, de lo contrario el material que se manufactura en digital casi siempre esta en 44,100 hz y 16 bits, no tiene sentido pasarlo a 96000 hz y claro un buen equipo de reproducción, pues si no se reproduce con calidad no se graba con calidad).
Luego paré oreja y voy descubriendo que el mp3 te pone todo en primer plano, ...mm... o sea que tienes un solo plano con todo aquí en plena oreja.

- Wav permite 3 dimensiones sonoras, (a chinga ¡y eso que es?) altura en frecuencias (los bajos y los agudos), anchura en el estéreo (canal derecho, canal izquierdo) y profundidad (o sea, donde acomodaste los instrumentos, unos están mas alejados o más pa'tras y otros mas pa'lante) pero ya clavadísimo y me caí que no me había metido nada, descubro que la profundidad no solo era posición de los instrumentos sino también la profundidad que tienen los armónicos en el timbre de los instrumentos y los armónicos en los acordes y la mezcla total (revisar párrafos sobre armónicos y efectos de enmascaramiento).

Actualmente están promocionando programas para revisar el espectro acústico, que nos da una aproximación de que contiene un sonido o una canción en cuanto a sus registro en hertz, lo cual según nos dice si es un mp3 o un Wav o un Flac, y mas o menos es verdadero, pues si tienes un corte abrupto alrededor de los 20khz o a los 16khz etc. pues si!, el archivo fue recortado por los esbirrios del codificador, también tendría que tomarse en cuanta que por ejemplo:

Instrumento                  Fundamental      Armónicos
Flauta                       261-2349 Hz      3-8 KHz
Tambor                       100-200 Hz       1-20 KHz
Bombo                        30-147 Hz        1-6 KHz
Bajo acústico                41-294 Hz        1-5 KHz
Guitarra eléctrica (amplif.) 82-1319 Hz       1-3.5 KHz
Piano                        28-4196 Hz       5-8 KHz
Cantante                     87-392 Hz        1-12 KHz

Si se observa la mayoría no pasa de los 12 khz, lo cual me hace pensar que si tomas el registro de una voz y un guitarra acústica, imposible que llegue a los 20 khz, como leíamos en el texto sobre archivos sonoros nadie percibe mas allá de los 20 khz a menos que seas un perro o un murciélago, que si es el caso no estarías leyendo esto, no han alfabetizado a los perros, o si ?
Otra cosa que no se observa, son los registros bajos, pues en el espectrograma vemos que las frecuencias lleguen a los 22 khz, pero no te define claramente que frecuencias se están registrado en la zona baja, si lo observamos con la función en Audition cc 6 (o la versión que tengan, da igual) sobre las notas vemos que se pierden algunas notas bajas, y si observamos más atentamente el espectrograma veremos que la densidad en el registro cambia entre un Wav y un MP3, que es donde afecta el enmascaramiento, pues seguimos viendo registro en cuanto a altura pero no en profundidad.
Yo tenia toda mi música en Wav, pero un día un amigo me dijo estas un poco guey, has de tener poquita música o un montón de dinero (aunque los discos duros cada día están más blandos de precio) y me mencionó los archivos Flac, me informé y hasta el momento al parecer todo indica que no hay pérdida alguna al usar este formato en lugar de Wav y ganas hasta un 30 0 40 % de espacio o más, y todo parece confiable, a no ser que en el futuro salgan con que algo se perdió, mas allá de la inocencia. Y el brillante sonido del Corno Francés cambio de nacionalidad y se transformo en el nasal Corno Inglés??.

Reflexión 1:
Alguien por ahí acusó de estar pasando archivos Mp3 a Flac o wav, y me pregunto... de manera técnica ¿que sentido tiene, pues al subir un Mp3 no sube la calidad solo sube el peso del archivo, pero la calidad queda igual aunque si ocupa mas espacio en la banda, no se pa'que carajos se usa ese espacio, pero bueno, así que surgieron dudas... si lo hacés para que tus amiguitos digan que estás subiendo material de buena calidad, pues como no va firmado quien lo hizo y en la red todo termina yendose pa'todos lados, no sabés quien lo subió, ya sea para felicitarlo o para mentarle la madre, así que, por la fama o por ego no creo que funcione. ¡Pa’joder!, que gana con llenarle el disco duro con espacios vacíos, a menos que venda discos duros y gane dinero, o estará trabajando para otros gratuitamente (que pendejo) o que las empresas productoras de Almacenaje digital estén pagando a internautas traidores y vendidos para que le llenen el disco duro al personal que noblemente comparte música y compren mas discos duros???? mmmmm

Reflexion 2:
Al ir quitando los armónicos de los sonidos de un instrumento va modificándose el timbre o sea el sonido característico del instrumento, o sea, es como si fueras perdiendo poco a poco la definición de tu cara, que es lo que te identifica y diferencía, mmmm.
También la sonoridad característica de los acordes y la mezcla de las frecuencias en un conjunto sonoro se unifican y aplanan y se pierde profundidad en la armonía, en el sentido estrictamente físico. Me la imagino como estar en el campo con montañitas, arbolitos, vaquitas haciendo muuu, el viento refrescando la cara, y en lugar de eso una proyección de 2 mts. cuadrados a color cinemascope y surround sound en la pared de tu casa y un ventilador.
(Esto de los armónicos opera de manera totalmente diferente en música o sonidos producidos en su totalidad de manera digital)

Reflexion 3:
Que va a pasar si en nuestra memoria colectiva esa percepción de una realidad (real) deja de existir y nuestra realidad cotidiana se convierte en una realidad de un solo plano, sin profundidad, y ya no puedes diferenciar entre un Mp3 comprimido y un archivo sin comprimir, y si algún día no sabes como sonaba fisicamente un Oboe y sólo te queda el registro de un sonido digitalizado con frecuencia recortada, comprimida y modificada.

Reflexion 4:
Me quedo pensando...
Y Para que digitalizar los discos o Cd’s?, bueno, papasarlos a Internet o para cuidar tus originales. ¿Y para que subirlos a Internet? o cuidar los originales?, bueno, en Internet para compartir, es bueno compartir con los amigos la música que nos gusta. Y cuidar los originales pues??? ...mmm bueno, cuando existían los vinilos, el problema es que se rayaban o maltratan muy fácilmente y costaban precios en algunos casos altos, un importado en los 70’s en México era casi imposible conseguir, los de una tienda llamada Yoko o tiendas parecidas (bueno, solo había un par de tiendas que importaban) llegaban a tardarse 6 meses en traértelo, si es que llegaba, algunos discos sólo los vi en revistas, tardaron 10 años en llegar a México, pude haberme ido caminando a Estados Unidos a traerlo, aunque el riesgo era que me detuvieran en la frontera por tráfico sonoro o por ser indocumentado.
También produjo cantidad de paranoico-ezquizofrénicos que te podían partir la cara o algo más si ponías tus dedotes en el disco, luego por suerte, suerte? llegó el cd (nos saltamos por comodidad y economía de espacio los cassettes de 8 track, las cintas y etceteras) y con el cd pensamos que va a durar mucho mas la música, cosa que no es cierto, descubro ahora tristemente que cd’s originales después de 10 años aproximadamente (no es un dato científicamente comprobado, pero se aproxima) se esta perdiendo la música, actualmente en mi audioteca, de cada 100 cd’s originales de 30 a 40 aún a pesar de haberlos cuidado celosamente, se les esta perdiendo la información, los piratas son peor, el 99% de los discos piratas que compré se perdió la información, pero esto solo es asunto y responsabilidad de los usuarios de material discográfico?...
¡No, ni madres!
Todo comenzó a registrarse en (pensemos del rock and roll para-aca) vinilos, luego la industria sacó cintas en diferentes track 8, 4, 2, etc. y luego Cd’s, luego Ipod’s y así, y en cada caso no solo era que cambiaban formato de material reproducible, te vendían todo el equipamiento para poder escucharlo, y claro a cada nueva llegada de nuevo formato el anterior se perdía así que... a mi me pasó por guey, el disco de Axis Bold as Love de Jimi Hendrix lo compré primero en vinilo version nacional, luego tuve la oportunidad de conseguirlo importado con su maravillosa portada doble y por que la versión nacional se rayó en las primeras 50 pasadas, luego lo compré en Cd pues dejaron de vender las pastillas y agujas para el tocadiscos que tenía, y el Sd se rayó con no muchas veces que lo puse, bueno si algunas muchas pero… se rayan los Cd’s?, pues si y muy rápidamente, así que el material que tanto me gustaba de Hendrix, lo compre y pagué 3 veces, el mismo material... ¿por que? por pendejo. después decidí que era suficiente y me lo conseguí por Internet con la buena banda que comparte, en 24/96 en una reedición y remasterización y (un solo de voz y guitarra bonus track que hizo Hendrix desde el mas allá), pinches compañías tramposas, me han vendido varias veces el mismo material y sus instrumentos para poderlos reproducir, y no me voy a poner a discutir si el músico recibe regalías por el material que grabo hace 50 años, ademas que los royalties los tienen gueyes como Bono o Mccartney. Pero el asunto es que eso del trafico ilegal de música, me parece que es más sucia y pervertida a nivel de la industria del fonograma, y realmente en EU y otros países que pelean tanto por los derechos de autor en el material musical que se comparte en Internet, es sólo paseguir chingandose (chorean) un platal insultante a costa de los tarugos que gustan de la música, que creo que son muchos, en cambio el personal que según estos pinches piratotas del mundo sonoro acusan, lo transmiten sin costo alguno, o sea, es sin interés económico, es por el puro gusto de compartir con tus similares, aunque algunos obsecuentes que no ganan nada, ni pierden nada, critican dicha acción, como si ellos fueran los que pierden dinero, nadie pierde solo unas cuantas o muchas?, ratas no ganan.

Reflexion 5:
Por supuesto que es muy bueno poder viajar y llevarte tu música preferida sin tener que cargar con tu equipo high fidelity, equalizador de 50 bandas y monitores de respuesta plana y traer tu material en un pequeño artefacto reproductor con unos audífonos medianamente decentes para disfrutar y bueno... no hay peor sonido que el que no existe, aunque claro en casa se quedo "my precious" en formatos que nos permitan guardar la historia sonora real y verdadera de la música y el sonido que algunos patológicamente atesoramos.

O como decía

"Quien no conoce su historia está condenado a repetir sus errores"

Paul Preston

O sea: si únicamente escuchas en Mp3 tu música, no sabras como era el mundo sonoro tridimensional.
Claro por suerte también queda la opción de ir a ver y escuchar a los músicos y vivir la experiencia de compartir la creatividad humana y por que no, una cerveza o algo mas.
¡SALUD!
CA.

Comentarios

Jorge4 de febrero de 2016 a las 19:21
Hola!!

En el mundo "desarrollado"cada vez mas se usa la pc como fuente de sonido.Le adicionan DACs de alta calidad,asíncronos por usb. Y la conectan al equipo de sonido.
Son caros pero se nota la diferencia-
Si querés algo gratis y que realmente funciona de maravillas es un programita que se llama Fidelizer,que aparentemente desactiva o apaga todo lo que no sea esencial para el sonido en Windows,logrando una gran calidad y apertutura de la escena sonora .Probálo,no te vas a arrepentir

Saludos
Jorge
Bahia Blanca
ResponderEliminar
Respuestas
francisco santos7 de julio de 2017 a las 14:06
porqur los datos GONE!...
ResponderEliminar
Respuestas

Añadir comentario

Cabeza de Moog !

Buscar este blog