El Amiga me Encanta - AMIGA.InFo Nº3 - Música: Muestras digitales de sonido, Una muestra de buena música


	Revistas en Papel

AMIGA.InFo • Mayo/Junio 1995 • Número 3

MUESTRAS DIGITALES DE SONIDO

MÚSICA

Santi
Maspons

NOTA: Pulsando sobre las fotos con borde azul ampliarás la imagen.

Una muestra de Buena
Música

Aunque el título de este artículo puede sugerir que comentamos una extraordinaria composición musical, dejamos esta función para los especialistas en el tema y nos referimos en esta ocasión a las muestras digitales de sonido. No tratamos de presentar la última novedad del mercado en chips de sonido ni de predecir el futuro de la música. Solamente haremos un repaso a algunos conceptos básicos de la teoría de la digitalización

Los bajos precios de la tecnología digital han permitido la popularización de esta forma de tratamiento del sonido. La integración de circuitos complejos en chips minúsculos ha propiciado que todos los fabricantes de ordenadores domésticos o personales que se precien incluyan de origen, o bien con tarjetas de expansión, circuitería para grabar o reproducir sonido digital.

Los sonidos que podemos oír o captar con un micrófono en la naturaleza, en la calle o a través de las débiles paredes de un piso, son un tipo de señales clasificadas como analógicas y continuas. el micrófono recoge las oscilaciones del aire con una membrana pegada a una bobina de material conductor que al vibrar alrededor de un imán genera corriente eléctrica. Cuanto mayor sea la intensidad del sonido, más potente será la electricidad generada. Cuando mencionamos la palabra señal para referenciar al sonido, nos referimos a la señal de tipo eléctrico que proporciona el micrófono o cualquier artilugio con una funcionalidad equivalente. Si pudiéramos medir alguna característica de esta señal, como puede ser el volumen sonoro, en cada instante obtendríamos un valor diferente.

Gráfica que representa el volumen de un sonido imaginario que aumenta desde 0 hasta 10 en 1 segundo.

Si escogemos un valor del volumen del sonido cada décima de segundo, la representación en digital puede ser similar a esta.

Debemos recordar que el sonido es una perturbación en el aire con el comportamiento de una onda y puede describirse con la amplitud del volumen y la frecuencia con que varía. La señal eléctrica sigue este mismo comportamiento. Por esta particularidad nos es posible introducir y tratar el sonido en circuitos eléctricos u chips. Supongamos que el volumen va creciendo desde 0 hasta su nivel máximo durante un período de tiempo de 1 segundo. Para simplificar, suponemos que el volumen máximo es 10. Esta señal es tan simple que en realidad no la podríamos ni oír. Pero sigamos con esta especie de experimento mental tal como hacía Albert Einstein con sus contertulios al explicar sus geniales ideas.

Si dispusiéramos de la colaboración de un duende científico que midiera la intensidad sonora, nos la comunicara y pudiéramos anotar todos los valores durante este segundo, ¿cuántas anotaciones tendríamos que hacer? ¿Qué tipo de números usaríamos?, ¿Podríamos usar los números NATURALES? ¿o usaríamos los interminables REALES? Está claro que el primer valor sería un 0 y el último el valor máximo 10. Pero para anotar los valores intermedios que continuamente van aumentando hasta 10 debemos poner un poco más de atención.

Con unos conocimientos básicos de matemáticas, es ´fácil ver que necesitariamos la colaboración de los números REALES para representar todos los valores que puede tomar el volumen de nuestro sonido. AL tratarse de una señal continua quiere decir que no hay discontinuidades entre un valor y el siguiente, el salto entre dos números consecutivos es infinitamente pequeño. Esto permitiéndonos la libertad de suponer que podemos distinguir dos puntos consecutivos. Podemos deducir también que nunca acabaremos de anotar esos valores. ¿Cuántos decimales apuntamos? Un número REAL puede tener infinitas cifras. Es más, una infinidad de números REALES tienen infinitas cifras.

¿Qué pasa si el duende es muy rápido y nos entrega muchos valores? ¿Cuánto es ser muy rápido? El problema parece crecer exponencialmente, si no podemos contar cuántos valores diferentes hay y ni siquiera podemos apuntar uno solo, ¿debemos abandonar nuestra empresa por imposible?

Todo No Puede Ser

Bueno, siempre hay un "pero". Para obtener una copia idéntica del sonido, deberíamos usar unas matemáticas más avanzadas modelizando el comportamiento del volumen del sonido con funciones matemáticas. Aproximando rectas, parábolas o curvas de mayor grado. Este método es perfecto para comportamientos simples como los lineales, senoidales y otros. Es nuestro experimento, quizás sería la solución idónea, pero para un sonido complejo puede resultar tan difícil como imposible. La tecnología actual permite muchas maravillas, pero no hace milagros. ¿Os imagináis la pista sonora de una película representada de esa forma? Para poder avanzar en el tratamiento de nuestro sonido deberemos renunciar a algunos lujos. Aceptaremos que no podemos obtener un duplicado perfecto del sonido original. El micrófono, por bueno que sea, dista mucho de la perfección. Para describir el sonido con dígitos, reduciremos nuestro grado de ambición. En primer lugar, renunciaremos a estar continuamente anotando valores. Esta tarea, aunque inocente, es imposible en la práctica. ¿Cuántos instantes tiene un segundo? ... 10, 10 millones 10^100 instantes...

El veterano AudioMaster fue uno de los primeros en romper la barrera de los 28,867 KHz y 128 KB en las muestras de sonido de AMIGA. Observamos que podemos reproducir 56,818 KHz en la versión IV.

El famoso DSS8+ ofrece un software integrado de digitalización y secuenciador. También permite reproducir hasta 51,136 muestras por segundo.

El Octamed usa el chip de sonido de forma tradicional a 28,867 KHz con un máximo de 128 KB de longitud en modo 4 pistas/MIDI. En cambio, si usamos los modos de 5-8 pistas, no tenemos límite en el tamaño de las muestras aunque la precisión baja a 7 bits.

Nos decidiremos, por ejemplo, a anotar sólo un valor cada centésima de segundo (supongamos que nos acompaña un duende escritor moderadamente rápido). En segundo lugar deberemos renunciar a la precisión exacta de la medida, ya que un n´mero real puede tener infinitas cifras. Nos quedaremos con 3 decimales para anotar los valores del volumen. De esta manera podremos tener una "copia" del sonido tomando 101 muestras, siendo cada muestra un número entre 0 y 10 con 3 cifras decimales de precisión. El número de valores diferentes que podemos obtener es 10.000. Sólo hay que contar cuántos valores diferentes hay entre 0 y 10 si nos limitamos a 3 cifras decimales. Descuidamos por un momento que si solamente tomamos 101 muestras, efectivamente hay sólo 101 valores diferentes. Estos 10.000 valores se refieren a los posibles valores que puede tomar cada una de estas 101 muestras.

Hagamos Números

En este experimento mental han aparecido ya unos conceptos importantes en la conversión de señales analógicas en digitales: la velocidad de muestreo y la precisión de la muestra. Se aclara el origen de la denominación de "muestra" para el sonido digital. La traducción literal en inglés y conocida por todos, es "sample" y tiene las mismas interpretaciones que en castellano. El procedimiento realizado en el experimento de proceso de digitalización. En la vida cotidiana tiene una similitud en el informe del tiempo meteorológico. Cuando se nos dan las temperaturas de la mañana, melodía y noche diariamente, de hecho estamos digitalizando la temperatura. Aunque la temperatura va variando continuamente para nuestra percepción, sólo tomamos tres valores diarios con una simple cifra decimal de precisión.

Un proceso análogo se realiza en el interior de los "samplers" o digitalizadores de audio. Normalmente, los digitalizadores se pueden configurar para que tomen el número de muestras por segundo que necesitamos para cada tipo de sonido. La velocidad de muestreo se indica en KHz. Se lee kilohercios e indica el número de miles de muestras tomadas por segundo: 12 KHz indica 12.000 muestras por segundo. El hecho de leer una muestra cada décima de segundo lo representamos como 0.1 Hz ó 0.0001 KHz. Un valor realmente tan bajo no es operativo para reproducir posteriormente le sonido de forma filedigna, pero es útil un ejemplo con fines divulgativos.

Cuando nos disponemos a adquirir un digitalizador, el mercado nos puede confundir con la cantidad de ofertas. La palabería publicitaria puede ser muy ingeniosa, pero nos debemos fijar en las especificaciones técnicas. Seguramente nos informarán de la velocidad máxima de muestreo y de la precisión de las muestras indicada en número de bits por muestra. Estos valores suelen ser 8, 12 16 o más bits. Con 8 bits podemos representar el volumen con 256 valores, con 12 bits 4.096 valores y 65.536 con 16 bits. En general podemos representarlo con dos elevado al número de bits. En nuestro ejemplo usaremos 10.000 valores para codificar el nivel de volumen, esto corresponde más o menos a usar 13 bits. el hecho de usar 16 bits en el experimento mental, sería parecido a usar 4 decimales en las muestras. Si no fuera por la lenta velociad de muestreo que hemos supuesto, el experimento habría resultado bastante realista.

Ahora ya estamos en condiciones de analizar algunos productos que hay en el mercado. El reproductor de discos compactos tiene fama de sonido de calidad y representa un símbolo de referencia para los estándares de calidad. Sus características básicas son muestras de 16 bits a una velocidad de muestreo de 44.100 KHz. Un sencillo cálculo nos da la cantidad de 606 MB para una hora de sonido estéreo.

Algunos instrumentos musicales de 16 bits disponen de samples a una frecuencia de 48 KHz. como veremos más adelante, cuanto mayor sea la velocidad de muestreo, mejor respuesta obtenemos para sonidos muy agudos. Los equipos profesionales destinados al proceso de sonido necesitan más precisión y velociad que los equipos destinados a la simple reproducción. La razón es que se realizan operaciones y aplican efectos al sonido original para darle una atmósfera diferente. Las operaciones pueden ir degradando la información original, pero si disponemos de mucha precisión, podemos permitirnos tener pérdidas obteniendo un resultado final excelente para el oído humano.

El Amiga tiene circuitería para reproducir 4 voces de 8 bits a una frecuencia de 28,867 KHz. Los sonidos pueden tener un tamaño máximo de 131.072 muestras de 8 bits (128 KB). Para reproducir las muestras, es necesario que estén en la memoria chip accesible por los "custom chips". No obstante, estas limitaciones iniciales del Amiga han sido superadas gracias a la habilidad de los programadores y ahora es posible reproducir a velocidades superiores a 50.000 muestras por segundo unos sonidos de cualquier tamaño mientras quepan en la memoria gráfica, en la memoria normal o incluso en el disco duro u otros dispositivos de almacenamiento.

¿Va Sobrado El Amiga?

Como hemos visto, tener un sonido en formato digital significa haber renunciado inicialmente a una parte de la información que trasmite la señal original. La cantidad de información que estamos dispuestos a perder vendrá marcada por la utilidad final de la muestra. SI va destinada a la audición, consideraremos la capacidad auditiva humana. Si necesitamos operar con el sonido, exigiremos las máximas prestaciones disponibles. Un humano normal puede oír sonidos entre 20 Hz y 20 KHz. Con estos datos podemos pensar que las prestaciones sonoras del AMIGA son generosas. Hemos mencionado que puede reproducir 28,867 KHz o llegar incluso a 50 KHz. Por otro lado, también podríamos suponer que los discos compactos usan más información de la necesaria o quizá se pueda doblar su duración si bajáramos la velocidad de muestreo a la mitad. La realidad es dura y complicada como la vida misma.

El TechnoSound Turbo II también permite sobrepasar los 50 KHz en la reproducción de muestras. Destaca la cantidad de efectos a tiempo real que incluye.

Las cosas no son tan sencillas. No debemos confundir la frecuencia de muestreo o reproducción con la frecuencia del sonido a digitalizar. Aunque exista una relación muy directa, son dos conceptos diferentes. La frecuencia del sonido depende de la naturaleza del mismo sonido. La velocidad de muestreo se escoge según las necesidades. Vamos a deducir la relación entre ambas frecuencias con otro experimento mental.

Imaginemos que queremos digitalizar un sonido simple que consta de una onda senoidal de 10 KHz. Veamos cual es la mínima cantidad de muestras que debemos tomar por ciclo. Si tomaramos un solo valor por ciclo, este valor sería el único representante de los infinitos valores que toma la señal entre 0 y 10. Estaríamos aproximando una función variable con una constante. Ajustar una función seno con una recta horizontal no es una buena aproximación.

Si tomamos muchas muestras, sería perfecto, pero quizás tendríamos que manejar demasiada información. En la práctica se considera que una buena aproximación es muestrear como mínimo al doble de la frecuencia más alta que contenga el sonido. Si queremos digitalizar una señal de 10 KHz deberemos tomar valores a una velocidad de 20.000 muestras por segundo. Ahora podemos sacar algunas conclusiones más. Si el oído humano puede captar sonidos de hasta 20 KHz, deberemos digitalizar a una velocidad mínima de 40 KHz. NOs damos cuenta que en un disco compacto no se derrocha demasiada información al funcionar a 44,1 KHz. Permite reproducir de forma aceptable frecuencias de hasta 22,05 KHz. Valor que está por encima del espectro auditivo humano. De la misma manera entendemos las urgentes medidas de mejora que introdujeron los programadores para superar la barrera de los 28,867 KHz de los custom chips del AMIGA.

En este gráfico podremos observar la aparición del efecto "aliasing" al digitalizar. La señal debería ser senoidal, pero esos picos de frecuencia más alta nos traerán problemas.

Al digitalizar encontramos esta muestra en la que aparecen los picos de las altas frecuencias que alteran el resultado final.

Esta es la muestra que esperábamos obtener al digitalizar una señal senoidal de baja frecuencia sin tener en cuenta el efecto "aliasing".

Con esta frecuencia se podían reproducir sonidos correctamente sólo hasta los 14 KHz. Es un valor aceptable para fines lúdicos como juegos o multimedia doméstica, pero insuficiente para usos profesionales. Las altas frecuencias no pueden ser reproducidas. Esto significa que el sonido del Amiga, en un principio, tendría que sonar apagado y grave. Nuestro ordenador es muy complejo, en el buen sentido de la palabra, y permite realizar muchos trucos. Con los programas reproducir muestras hasta una velocidad superior a 50 KHz.

Filtrando Los Problemas

Cuandos los ingenieros de Amiga diseñaron la circuitería de audio, colocaron un filtro en la salida de sonido para suavizar un efecto no deseado que se producía al reproducir muestras por debajo de los 40 KHz. Se trata de un filtro pasa bajos que atenúa las frecuencias altas (entre 7 y 12 KHz). Este filtro puede resultar un poco polémico porque solucionaba un problema pero creaba otro: el sonido resultaba poco brillante, sin agudos. Afortunadamente, ya hace muchos años que este filtro se puede desactivar y activar mediante programas según los gustos o necesidades del usuario.

Una de las primeras utilidades que lo realizaba era un pequeño programa de pocos bytes llamado LED por modificar la luminosidad del led de "POWER" del Amiga para indicar si estaba o no activado. Hoy todos los programas de sonido permiten controlar este filtro. La razón de incorporar este filtro es comprensible si se conoce el origen de un problema llamado "aliasing". El problema del "aliasing" aparece en muchos campos de la tecnología digital, posiblemente estéis familiarizados con él en los contornos de gráficos curvilíneos. Se manifiesta con los cuadrados que estropean esa magnífica circunferencia que habíamos planeado. En el sonido sucede algo similar. Un sonido de la vida cotidiana está compuesto por múltiples sonidos básicos de varias frecuencias. Si lo digitalizamos a baja frecuencia de muestreo pensando en que el sonido no necesita mucha calidad, parte de la baja calidad inherente a esta velocidad, aparecen una serie de valores que crean un ruido metálico al reproducir la muestra.

La causa radica en que al tomar una muestra, en lugar de corresponder a un sonido de baja frecuencia, leemos un valor de un pico de otro sonido de alta frecuencia, con lo que aleatoriamente tenemos valores no deseados. La finalidad del filtro es atenuar esos valores. Si digitalizamos a mucha velocidad (más de 40 KHz), este problema, aunque existe, se minimiza porque no lo percibimos. Debemos recordar que cuando se diseñaron los chips de sonido del Amiga, se suponía que la máxima frecuencia eran los 28,867 KHz que corresponden a 14.4 KHz de sonido real, bastante lejos de los 50 KHz actuales.

Conseguir Un Buen Nivel

A la hora de digitalizar, podemos haber ajustado la velocidad de muestreo al máximo, disponer de una resolución de 16 bits y estéreo, pero de nada nos servirá si no llega un nivel suficiente de señal a la entrada del digitalizador. El nivel adecuado lo delimitan el ruido propio de los aparatos eléctricos y la sobresaturación que provocan niveles excesivamente altos. Para evitar el ruido necesitamos que la señal tenga gran intensidad, pero debemos evitar sobrepasar el nivel de saturación. De lo contrario, la señal se verá amplificada por encima del valor máximo y en general se asignará este valor máximo a todos los puntos que lo sobrepasen, perdiéndose la información de la forma original de la señal.

Generalmente, los programas de digitalización monitorizan la entrada que reciben a modo de osciloscopio. Ajustaremos el volumen del sonido que suministramos al digitalizador guiándonos en este monitor. Un consejo general a seguir es poner el nivel de forma que el pasaje con más volumen del sonido no quede recortado en la pantalla del monitor. No obstante, la experimentación y la práctica os aportarán muchos conocimientos que son difíciles de transmitir en un breve artículo para conseguir un buen nivel y obtener una muestra de buena música.

GLOSARIO

ALIASING: Aparición de valores no deseados en una muestra a causa de usar una frecuencia de muestreo baja y leer valores correspondiente a frecuencias altas. Se evita filtrando previamente el sonido a muestrear con un filtro pasa bajos.

AMPLITUD: Valor máximo que toma una señal periódica.

ANALOGICA: Señal que varía en el tiempo de forma continua.

CICLO: Oscilación. Por ejemplo: 50 ciclos por segundo equivale a que algo sucede 50 veces durante cada segundo.

CIRCUITERÍA: Conjunto de cables y chips que conforman algún sistema.

DIGITAL: Representación con cifras.

DIGITALIZAR: Proceso de tomar una muestra.

FILTRO PASA BAJOS: Dispositivo que atenúa o elimina las frecuencias más altas a una cierta frecuencia base, dejando intactas las frecuencias inferiores.

Hz: Hercio. un ciclo por segundo. En general sirve para indicar cuantas cosas suceden por segundo. Por ejemplo: 1000 muestras por segundo equivale a 1000 Hz o abreviado 1 KHz.

KHZ: 1000 hercios.

MUESTRA: (sample, en inglés) Subconjunto de valores de un conjunto mayor. Por ejemplo: Tomar unos pocos números de una larga lista. En audio se entiende como sonido digital.

PERIODICA: Que se repite.

PICO: Valor alto que destaca de una serie de valores.

SOBRESATURACIÓN: Amplificación de una señal por encima del valor máximo aceptado.

Envía esta página web a un amigo:
Esta opción está desactivada temporalmente, rogamos disculpen las molestias

Volver a la página anterior	Al menú principal