Un micrófono es un transductor que convierte ondas sonoras acústicas en señales eléctricas correspondientes, generalmente detectando variaciones en la presión del aire y transformándolas en salidas de voltaje o corriente a través de principios como la inducción electromagnética, la capacitancia variable o la piezoelectricidad. Estos dispositivos son esenciales para capturar audio para aplicaciones que van desde telecomunicaciones y radiodifusión hasta grabación de sonido y amplificación de actuaciones en vivo.[3]
La invención del micrófono se remonta a 1876, cuando Alexander Graham Bell patentó el teléfono, que incluía un transmisor líquido como el primer diseño práctico de micrófono. Esto pronto fue mejorado por Emile Berliner, quien presentó una patente para un micrófono de carbono refinado en 1877 utilizando gránulos de carbono sueltos para variar la resistencia eléctrica en respuesta a las vibraciones inducidas por el sonido en un diafragma, lo que permitió una transmisión de voz más clara y sentó las bases para la industria telefónica. Los primeros micrófonos estaban basados principalmente en carbono debido a su simplicidad y bajo costo, pero las limitaciones en la fidelidad llevaron a avances; El micrófono de condensador fue inventado por E.C. Wente en 1916, y en la década de 1920 surgieron micrófonos de condensador para mayor sensibilidad y respuesta de frecuencia, y Georg Neumann introdujo el primer modelo producido en masa en 1928.
Los micrófonos modernos se clasifican en varios tipos principales según sus mecanismos de transducción. Los micrófonos dinámicos funcionan mediante inducción electromagnética, donde una bobina unida a un diafragma se mueve dentro de un campo magnético para generar señales, lo que los hace resistentes y adecuados para entornos con altos niveles de presión sonora, como voces o instrumentos en vivo.[8] Los micrófonos de condensador, también conocidos como micrófonos de condensador, dependen de cambios en la capacitancia entre un diafragma vibratorio y una placa posterior fija, lo que requiere alimentación fantasma para funcionar y sobresalen en la grabación de estudio debido a su amplio rango de frecuencia y bajo ruido. Los micrófonos de cinta, una variante de los tipos dinámicos, utilizan una fina cinta metálica suspendida en un campo magnético para obtener un sonido cálido y natural, aunque son más frágiles y se utilizan normalmente en la captura de audio profesional.[10] Además, los micrófonos cuentan con varios patrones polares, como omnidireccional para capturar sonido desde todas las direcciones, cardioide para captación frontal enfocada o bidireccional para sensibilidad del lado opuesto, para optimizar el rendimiento en diversos escenarios.[11]
micrófonos
Introducción
Un micrófono es un transductor que convierte ondas sonoras acústicas en señales eléctricas correspondientes, generalmente detectando variaciones en la presión del aire y transformándolas en salidas de voltaje o corriente a través de principios como la inducción electromagnética, la capacitancia variable o la piezoelectricidad. Estos dispositivos son esenciales para capturar audio para aplicaciones que van desde telecomunicaciones y radiodifusión hasta grabación de sonido y amplificación de actuaciones en vivo.[3]
La invención del micrófono se remonta a 1876, cuando Alexander Graham Bell patentó el teléfono, que incluía un transmisor líquido como el primer diseño práctico de micrófono. Esto pronto fue mejorado por Emile Berliner, quien presentó una patente para un micrófono de carbono refinado en 1877 utilizando gránulos de carbono sueltos para variar la resistencia eléctrica en respuesta a las vibraciones inducidas por el sonido en un diafragma, lo que permitió una transmisión de voz más clara y sentó las bases para la industria telefónica. Los primeros micrófonos estaban basados principalmente en carbono debido a su simplicidad y bajo costo, pero las limitaciones en la fidelidad llevaron a avances; El micrófono de condensador fue inventado por E.C. Wente en 1916, y en la década de 1920 surgieron micrófonos de condensador para mayor sensibilidad y respuesta de frecuencia, y Georg Neumann introdujo el primer modelo producido en masa en 1928.
Los micrófonos modernos se clasifican en varios tipos principales según sus mecanismos de transducción. Los micrófonos dinámicos funcionan mediante inducción electromagnética, donde una bobina unida a un diafragma se mueve dentro de un campo magnético para generar señales, lo que los hace resistentes y adecuados para entornos con altos niveles de presión sonora, como voces o instrumentos en vivo.[8] Los micrófonos de condensador, también conocidos como micrófonos de condensador, dependen de cambios en la capacitancia entre un diafragma vibratorio y una placa posterior fija, lo que requiere alimentación fantasma para funcionar y sobresalen en la grabación de estudio debido a su amplio rango de frecuencia y bajo ruido. Los micrófonos de cinta, una variante de los tipos dinámicos, utilizan una fina cinta metálica suspendida en un campo magnético para obtener un sonido cálido y natural, aunque son más frágiles y se utilizan normalmente en la captura de audio profesional.[10] Además, los micrófonos cuentan con varios patrones polares, como omnidireccional para capturar sonido desde todas las direcciones, cardioide para captación frontal enfocada o bidireccional para sensibilidad del lado opuesto, para optimizar el rendimiento en diversos escenarios.[11]
Más allá de la ingeniería de audio, los micrófonos desempeñan funciones fundamentales en las mediciones científicas, como la aeroacústica y el monitoreo del ruido, donde diseños especializados como variantes piezoeléctricas o MEMS (sistemas microelectromecánicos) detectan cambios sutiles de presión con alta precisión.[12] En contextos profesionales y de consumo, los micrófonos inalámbricos, comercializados por primera vez por Shure en 1953, han revolucionado la movilidad en actuaciones y presentaciones al transmitir señales a través de frecuencias de radio.[13] Las innovaciones en curso, incluidas las membranas ultrasensibles basadas en grafeno, continúan mejorando la sensibilidad y reduciendo el tamaño para aplicaciones en audífonos, teléfonos inteligentes y sistemas de vigilancia avanzados.[14]
Historia
Desarrollos tempranos
El fonautógrafo, inventado por el tipógrafo e inventor francés Édouard-Léon Scott de Martinville en 1857, representó el primer dispositivo conocido para capturar sonido, aunque funcionaba mecánicamente en lugar de eléctricamente al visualizar ondas acústicas como rastros gráficos en papel cubierto de hollín usando un diafragma vibratorio y un lápiz óptico. Esta herramienta de grabación no reproducible sentó las bases para la transducción del sonido, pero no permitió la reproducción ni la transmisión eléctrica.[17]
En 1876, Alexander Graham Bell desarrolló un transmisor líquido para sus primeros experimentos telefónicos, donde vibraciones sonoras movían agua acidificada en un recipiente para variar la resistencia eléctrica entre electrodos, lo que marcó un paso inicial hacia la señalización sonora eléctrica. El año siguiente, 1877, se produjo la invención independiente del micrófono de carbono por parte del inventor británico-estadounidense David Edward Hughes, quien demostró un dispositivo que utilizaba contactos de carbono sueltos para modular la corriente eléctrica basándose en las vibraciones del diafragma, mejorando significativamente la sensibilidad del teléfono. Al mismo tiempo, el inventor alemán-estadounidense Emile Berliner patentó un transmisor de carbono de contacto suelto en 1877, empleando una varilla de carbono que variaba la resistencia bajo la presión del diafragma para convertir el sonido en señales eléctricas, lo que se convirtió en parte integral de los primeros sistemas de telefonía.
En 1878, el inventor estadounidense Thomas Edison refinó el micrófono de carbono para uso práctico en teléfonos, incorporando una cámara de gránulos de carbono que comprimía y alteraba la resistencia eléctrica en respuesta a las vibraciones del diafragma, permitiendo una transmisión de voz más clara a distancia. Ese mismo año, Francis Blake presentó el micrófono de botón de carbono, que presentaba un disco de carbono denso presionado contra una punta de platino por el diafragma para lograr una variación de resistencia estable, que Bell Telephone Company adoptó por su confiabilidad en líneas comerciales.
Estos primeros micrófonos basados en carbono, si bien fueron revolucionarios para la telefonía, padecían limitaciones inherentes, incluido un alto ruido inherente debido a la fricción de los gránulos que producía un silbido persistente, baja fidelidad debido a una respuesta de frecuencia restringida que distorsionaba los tonos de audio más altos y susceptibilidad a la humedad que provocaba que las partículas de carbono se agruparan y degradaran el rendimiento.
Innovaciones del siglo XX
El siglo XX marcó una era crucial en la tecnología de los micrófonos, con la transición de diseños rudimentarios basados en carbono a transductores sofisticados de alta fidelidad que permitieron una captura acústica precisa para transmisiones de radio y grabaciones de sonido. A principios de siglo, la invención del micrófono de condensador por Edward C. Wente en los Laboratorios Bell en 1916 revolucionó la transducción de audio mediante el principio de capacitancia variable, donde las ondas sonoras hacen vibrar un diafragma delgado en relación con una placa posterior fija, alterando la capacitancia para generar una señal eléctrica. Este diseño ofrecía una sensibilidad y respuesta de frecuencia superiores en comparación con los micrófonos de carbono, que habían servido como precursores en aplicaciones telefónicas y de grabación temprana.
Basado en principios electromagnéticos, el micrófono dinámico de bobina móvil experimentó un refinamiento práctico en la década de 1920, y su patente fundacional se originó en Ernst Werner von Siemens en 1877, aunque su adopción generalizada siguió a los avances en imanes permanentes y amplificadores. El concepto de Siemens implicaba una bobina unida a un diafragma que se movía dentro de un campo magnético para inducir voltaje, proporcionando durabilidad para uso en vivo y retransmisiones. En la década de 1930, Shure Brothers comercializó modelos robustos como el Modelo 33N, haciendo accesibles micrófonos dinámicos de alta calidad para aplicaciones profesionales.[33][34]
Un salto significativo se produjo con el micrófono de cinta, introducido por Harry F. Olson en RCA en 1931, que presentaba una delgada cinta de aluminio corrugado suspendida en un campo magnético que vibraba para producir una salida sensible a la velocidad con calidez natural y bajo ruido. El RCA PB-31, el primer prototipo de Olson, estableció estándares para patrones bidireccionales y fue fundamental para capturar matices orquestales y vocales. Estas innovaciones impulsaron la adopción de micrófonos en la radiodifusión en la década de 1920, donde los modelos dinámicos y de condensador reemplazaron las bocinas acústicas, permitiendo una transmisión clara del habla y la música desde estudios como los de Westinghouse y NBC.
Los avances posteriores a la Segunda Guerra Mundial mejoraron aún más la versatilidad y el rendimiento. El Neumann U 47, lanzado en 1947, fue el primer micrófono de condensador de patrón conmutable comercialmente exitoso, que permitía seleccionar entre modos cardioide y omnidireccional a través de una cápsula de doble diafragma y amplificación de válvulas, que se convirtió en un elemento básico en los estudios por su respuesta tonal equilibrada. En 1962, James E. West y Gerhard M. Sessler de Bell Laboratories inventaron el micrófono de condensador electret, incorporando un material electret cargado permanentemente en el diafragma para eliminar la necesidad de voltaje de polarización externo, simplificando así el diseño y reduciendo los costos de aplicaciones portátiles y de consumo. La aparición de técnicas de grabación estéreo en la década de 1950, como la configuración Decca Tree que utiliza tres micrófonos omnidireccionales para obtener imágenes espaciosas, integró estos micrófonos de alta fidelidad para capturar paisajes sonoros inmersivos.
Estos desarrollos influyeron profundamente en la grabación de música, particularmente en los géneros de jazz y rock. En el jazz, la microfonía cercana con micrófonos de cinta y de condensador, como se inició en las sesiones de Rudy Van Gelder durante las décadas de 1950 y 1960, permitió una captura íntima de la dinámica de improvisación y las texturas del conjunto, enfatizando matices sutiles en artistas como John Coltrane. Para el rock, los micrófonos dinámicos facilitaron la microfonía agresiva de instrumentos amplificados, permitiendo la energía cruda de los gabinetes de guitarra y la batería en grabaciones multipista desde la década de 1950 en adelante, como lo ejemplifica el papel del Shure SM57 en la captura de fuentes de alto SPL sin distorsión. En general, las innovaciones en micrófonos del siglo XX cambiaron el enfoque hacia la fidelidad con calidad de estudio, transformando la transmisión en un medio de masas y la grabación en una forma artística de precisión sonora.
Avances modernos
La llegada de los micrófonos con sistemas microelectromecánicos (MEMS) marcó un cambio fundamental en la tecnología de los micrófonos a partir de principios de la década de 2000, lo que permitió una miniaturización y una rentabilidad sin precedentes para la electrónica de consumo. Knowles introdujo los primeros micrófonos MEMS comercializados en 2002, con diafragmas basados en silicio que reemplazaron los materiales electretos tradicionales, lo que permitió factores de forma más pequeños y la integración en conjuntos de múltiples micrófonos. Esta innovación facilitó la incorporación de conjuntos de micrófonos diminutos y de bajo costo en teléfonos inteligentes, donde varias unidades podían capturar audio espacial manteniendo una alta sensibilidad y relaciones señal-ruido (SNR) por encima de 60 dB. Al aprovechar los procesos de fabricación de semiconductores, los diseños MEMS redujeron los costos de fabricación hasta en un 50 % en comparación con los micrófonos convencionales, lo que impulsó su adopción generalizada en dispositivos portátiles.[43]
Paralelamente, en la década de 2000 surgió el desarrollo de micrófonos digitales con convertidores analógico-digital (ADC) integrados, que simplificaban el procesamiento de audio mediante la salida de señales digitales directas. Knowles fue pionero en la interfaz de modulación de densidad de pulso (PDM) durante este período, que combinaba el sensor MEMS con un ADC sigma-delta en chip para producir un flujo digital de un solo bit, minimizando las necesidades de circuitos externos y el consumo de energía a menos de 1 mW. Esta integración resultó esencial para aplicaciones con batería limitada, permitiendo una conectividad perfecta en dispositivos como auriculares inalámbricos y relojes inteligentes. En la década de 2010, los micrófonos MEMS proliferaron en los ecosistemas de Internet de las cosas (IoT), con envíos que superaban los 4 mil millones de unidades anuales a mediados de la década, compatibles con sensores habilitados por voz en hogares inteligentes y dispositivos portátiles.[43]
Los avances en los conjuntos de micrófonos avanzaron aún más con técnicas de formación de haces para la captura de voz de campo lejano, particularmente en los asistentes inteligentes lanzados después de 2014. El dispositivo Echo de Amazon utilizó una matriz circular de siete micrófonos que empleaba formación de haces acústicos para centrarse en las voces de los usuarios a una distancia de hasta 3 metros, suprimiendo el ruido y la reverberación a través del procesamiento de señales alineado en fase para mejorar la direccionalidad y ganancias SNR de 10 a 15 dB. Las innovaciones recientes de la década de 2020 han abordado los desafíos de sostenibilidad y autonomía. La investigación sobre micrófonos autoamplificados mediante la recolección de energía acústica, utilizando nanogeneradores piezoeléctricos para convertir ondas sonoras en electricidad, ha dado como resultado prototipos que generan hasta 10 μW/cm², eliminando las baterías para los nodos de IoT de baja potencia.[45] La cancelación de ruido mejorada por IA, como en el modelo MV7+ de Shure con eliminador de ruido DSP en tiempo real, reduce la interferencia ambiental al filtrar de forma adaptativa las señales que no son de voz, logrando una reducción de ruido de hasta 20 dB sin cambios de hardware.[46] Los esfuerzos de fabricación sostenible incluyen membranas libres de PFAS, reemplazando sustancias perfluoroalquiladas y polifluoroalquiladas con alternativas biodegradables para minimizar el impacto ambiental durante la producción.[47]
Principios de funcionamiento
Transducción acústica a eléctrica
Los micrófonos convierten ondas sonoras, que son variaciones de la presión del aire que se propagan a través de un medio, en señales eléctricas mediante un proceso conocido como transducción acústica a eléctrica.[51] Estas ondas de presión, que suelen tener una amplitud de 20 μPa a más de 100 Pa para sonidos audibles, inciden en un diafragma delgado y flexible dentro de la cápsula del micrófono, lo que hace que vibre en sintonía con la energía acústica incidente. El desplazamiento del diafragma es proporcional a la presión del sonido, y la sensibilidad está determinada por las propiedades y el diseño del material, lo que permite capturar frecuencias de aproximadamente 20 Hz a 20 kHz relevantes para la audición humana.[52]
El mecanismo de transducción central se basa en el movimiento mecánico del diafragma para generar una salida eléctrica mediante varios principios físicos, como la inducción electromagnética, la variación de la capacitancia electrostática o los efectos piezoeléctricos. En general, el proceso se desarrolla en etapas secuenciales: la entrada acústica en forma de ondas de presión induce el desplazamiento mecánico del diafragma; este movimiento modula luego un elemento generador asociado para producir una señal eléctrica proporcional; finalmente, la salida de bajo nivel a menudo se amplifica a nivel de línea para uso práctico en sistemas de grabación o transmisión.[51] El nivel de presión sonora (SPL), una medida logarítmica de la intensidad acústica, cuantifica esta entrada mediante la fórmula
donde PPP es la presión sonora cuadrática media en pascales y P0=20 μPaP_0 = 20 \ \mu\text{Pa}P0=20 μPa es la presión de referencia estándar correspondiente al umbral de la audición humana a 1 kHz.[53]
La fidelidad en la transducción, o la precisión de la señal eléctrica al representar el sonido original, está influenciada por las características del diafragma, incluidas su masa y rigidez, que determinan la frecuencia de resonancia del sistema.[54] La frecuencia de resonancia natural fff del diafragma, modelada como un oscilador armónico simple, viene dada por
donde mmm es la masa efectiva del diafragma y kkk es su rigidez.[55] Una masa más baja reduce la inercia para una respuesta más rápida a las altas frecuencias, pero puede aumentar la susceptibilidad al ruido, mientras que la rigidez óptima sintoniza la resonancia por encima del rango audible (normalmente 5 a 10 kHz para diseños de condensadores) para minimizar la coloración y garantizar una respuesta de frecuencia plana. Estos factores en conjunto garantizan altas relaciones señal-ruido y baja distorsión, fundamentales para aplicaciones que van desde la grabación de estudio hasta la medición científica.[51]
Mecanismos físicos clave
Los mecanismos físicos clave que subyacen a la transducción del micrófono convierten las variaciones de presión acústica en señales eléctricas a través de distintos principios, principalmente efectos electromagnéticos, electrostáticos, piezoeléctricos y resistivos. Estos mecanismos explotan el movimiento o la deformación de un diafragma en respuesta a las ondas sonoras, generando cambios eléctricos mensurables que representan la señal de audio.[57]
En la inducción electromagnética, aplicada a ciertos transductores dinámicos, el movimiento del diafragma impulsa una bobina o conductor a través de un campo magnético, induciendo un voltaje de acuerdo con la ley de inducción electromagnética de Faraday. La fuerza electromotriz inducida VVV está dada por
donde NNN es el número de vueltas de la bobina y dΦdt\frac{d\Phi}{dt}dtdΦ es la tasa de cambio del flujo magnético Φ\PhiΦ debido a la velocidad del conductor en el campo.[58] Este voltaje es directamente proporcional a la velocidad del movimiento del diafragma, que se correlaciona con la amplitud y frecuencia de la presión del sonido.[57]
La variación de la capacitancia electrostática forma la base de los transductores de condensador, donde el diafragma y una placa posterior fija forman las placas de un capacitor de placas paralelas. El desplazamiento del diafragma inducido por el sonido altera el espaciado ddd entre placas, cambiando la capacitancia CCC según
con ε\varepsilonε como la permitividad del medio y AAA como el área de la placa.[59] Para una carga constante QQQ en el capacitor, este cambio de capacitancia modula el voltaje V=Q/CV = Q / CV=Q/C, que luego es amortiguado por un convertidor de impedancia para producir la señal de salida.[57]
El efecto piezoeléctrico en los transductores relevantes surge de la generación directa de carga eléctrica en ciertos materiales cristalinos bajo tensión mecánica del diafragma.[60] El voltaje resultante VVV a través del material se expresa como
donde ggg es la constante de voltaje piezoeléctrico, ttt es el espesor del material y σ\sigmaσ es la tensión aplicada.[60] Este voltaje refleja directamente la magnitud de la tensión, lo que permite la conversión de la presión acústica en una salida eléctrica sin requerir un campo magnético externo o capacitancia variable.[60]
La variación resistiva ocurre en transductores a base de carbono, donde la presión del sonido comprime un lecho de gránulos de carbono entre placas conductoras, alterando la resistencia efectiva de la masa de gránulos. La resistencia RRR sigue la relación
con ρ\rhoρ como resistividad, lll como longitud efectiva y AAA como área de la sección transversal; la compresión reduce AAA o lll mientras cambia potencialmente ρ\rhoρ, produciendo un ΔR\Delta RΔR que modula la corriente en un circuito polarizado. Este cambio de resistencia produce una señal eléctrica variable proporcional a las variaciones de presión de la onda sonora.[61]
Componentes
Cápsula y diafragma
La cápsula funciona como la carcasa central del transductor en un micrófono, encierra el diafragma junto con una placa posterior en diseños de condensador y puertos acústicos que permiten que las ondas sonoras interactúen con los componentes internos mientras manejan los diferenciales de presión. Esta estructura sellada o semisellada protege los delicados elementos del interior y da forma al comportamiento acústico general del micrófono al controlar cómo el sonido entra y se propaga en su interior.[54]
En el corazón de la cápsula se encuentra el diafragma, una membrana liviana diseñada para vibrar en respuesta a variaciones de presión acústica, generalmente construida con materiales como Mylar (una película de tereftalato de polietileno orientada biaxialmente), plástico recubierto de oro o papel de aluminio delgado para equilibrar la sensibilidad y la rigidez. Estos diafragmas son extraordinariamente delgados, con espesores que generalmente oscilan entre 2 y 10 micrómetros, lo que permite una alta sensibilidad a presiones sonoras sutiles y al mismo tiempo minimiza los efectos de inercia que podrían distorsionar las frecuencias más altas. Las formas del diafragma se seleccionan en función de las propiedades acústicas deseadas: las formas circulares predominan en las cápsulas omnidireccionales para una respuesta de presión uniforme en todas las direcciones, mientras que los micrófonos de cinta emplean tiras de aluminio alargadas y corrugadas, a menudo descritas como ranuradas o plisadas, para mejorar la flexibilidad y la direccionalidad. Tensar el diafragma es un paso de fabricación crítico, estirándolo para elevar su frecuencia de resonancia más allá del rango audible, asegurando así una respuesta de frecuencia plana y un rendimiento consistente.
El diseño acústico dentro de la cápsula optimiza la captura del sonido a través de elementos estratégicos como puertos para ecualización de presión, que evitan desequilibrios estáticos y actúan como filtros acústicos de paso bajo para atenuar el ruido infrasónico.[71] En algunas configuraciones, los puertos traseros o las cámaras laberínticas facilitan las diferencias de fase para el control direccional, mientras que los materiales de amortiguación, como mallas finas o espumas flexibles, se integran para suprimir resonancias no deseadas y lograr características de amplitud más suaves.[66][54]
La durabilidad de la cápsula y el diafragma depende de una cuidadosa selección de materiales y de ingeniería para resistir tensiones mecánicas y ambientales.[65] La tensión debe controlarse con precisión para evitar estiramientos o desgarros inducidos por la fatiga con el tiempo, particularmente en láminas más delgadas propensas a endurecerse por trabajo.[70] Los diafragmas de polímero como Mylar exhiben vulnerabilidad a la humedad, lo que puede causar hinchazón, alteración de la tensión y cambios de sensibilidad, lo que requiere un almacenamiento protector con desecantes en condiciones de humedad. Las opciones de aluminio ofrecen una mejor resistencia a la corrosión, pero requieren pasivación para mitigar la oxidación.[74] En general, estos factores garantizan una fiabilidad a largo plazo en aplicaciones profesionales.
Electrónica y Vivienda
La electrónica dentro de un micrófono consiste principalmente en preamplificadores y convertidores de impedancia que acondicionan la señal débil generada por el transductor para su transmisión a través de cables. En los micrófonos de condensador, un transistor de efecto de campo (FET) sirve como convertidor de impedancia, transformando la salida de alta impedancia de la cápsula del condensador (generalmente en el rango de megaohmios) en una señal de baja impedancia adecuada para combinar con las entradas del preamplificador, minimizando así la pérdida de señal y el ruido. Esta etapa FET proporciona una alta impedancia de entrada a la cápsula y al mismo tiempo una baja impedancia de salida, a menudo alrededor de 50 a 200 ohmios, lo que garantiza un flujo de corriente eficiente y compatibilidad con líneas de audio profesionales.[77]
Los circuitos de micrófono a menudo incorporan salidas balanceadas por transformador para facilitar largos recorridos de cables sin degradación por interferencias electromagnéticas, ya que el transformador aísla las líneas de señal y mantiene el equilibrio entre los conductores fríos y calientes. La electrónica activa, alimentada a través de esquemas fantasma, como el estándar AES de 48 V CC suministrado a través de líneas balanceadas, permite una amplificación de bajo ruido en modelos de condensador y electret, admitiendo niveles de salida de hasta -10 dBu o más para uso profesional. El conector XLR, según AES14-1992, estandariza el audio balanceado con el pin 1 como tierra/blindaje, el pin 2 como activo (señal positiva) y el pin 3 como frío (señal negativa), rechazando el ruido de modo común en longitudes de cable superiores a 100 metros.[80][81]
Los materiales de la carcasa se seleccionan para equilibrar la durabilidad, el peso y la protección electromagnética; Las carcasas metálicas, como las de zinc o latón fundido, proporcionan un blindaje RF eficaz al atenuar las señales de interferencia por encima de 1 MHz, algo esencial para mantener la integridad de la señal en entornos de radiodifusión.[82] Por el contrario, las carcasas de plástico livianas, a menudo reforzadas con revestimientos conductores, se prefieren para aplicaciones portátiles como micrófonos inalámbricos de mano o de solapa, ya que reducen el peso total a menos de 100 gramos y ofrecen suficiente protección mecánica sin comprometer la movilidad.[83]
Para mitigar el ruido de manipulación, los micrófonos emplean soportes antivibración y suspensiones que utilizan materiales viscoelásticos para el aislamiento, donde las bandas elásticas o las estructuras de lira absorben las vibraciones mecánicas mediante la disipación de energía en polímeros deformables, atenuando el ruido de baja frecuencia hasta entre 20 y 30 dB.[84] Estos sistemas desacoplan el cuerpo del micrófono de los soportes o soportes, evitando que el ruido transmitido por la estructura se transmita a la cápsula durante el funcionamiento o el transporte.[85]
Tipos por principio de transductor
Micrófonos dinámicos
Los micrófonos dinámicos funcionan según el principio de inducción electromagnética, donde las ondas sonoras hacen que un elemento mecánico se mueva dentro de un campo magnético, generando una señal eléctrica.[1]
El tipo más común es el micrófono dinámico de bobina móvil, que presenta un diafragma liviano unido a una bobina móvil suspendida en el espacio de un imán permanente. La presión del sonido hace que el diafragma vibre, moviendo la bobina a través del campo magnético e induciendo un voltaje proporcional a la velocidad del movimiento mediante la ley de Faraday. Este diseño, a menudo alojado en un cuerpo metálico resistente, convierte la energía acústica directamente en salida eléctrica sin requerir energía externa.[87]
Una variante del micrófono dinámico es el tipo de cinta, que utiliza una delgada tira de metal corrugado, típicamente de 2 a 5 micrómetros de espesor, suspendida libremente entre los polos de un imán potente.[88] La cinta actúa como diafragma y conductor, vibrando en respuesta a ondas sonoras para generar voltaje a través de su movimiento en el campo magnético, ofreciendo mayor sensibilidad que los diseños de bobina móvil pero con mayor fragilidad debido al delicado elemento de la cinta.
Los micrófonos dinámicos son apreciados por su durabilidad y capacidad para manejar altos niveles de presión sonora de hasta 150 dB sin distorsión, lo que los hace adecuados para entornos exigentes, aunque exhiben una sensibilidad más baja alrededor de -50 dB re 1 V/Pa en comparación con otros tipos. No requieren alimentación fantasma, lo que mejora la confiabilidad en escenarios en vivo y generalmente brindan una respuesta de frecuencia de 50 Hz a 15 kHz, adecuada para la mayoría de las aplicaciones vocales e instrumentales.
Estos micrófonos se utilizan ampliamente para capturar voces y baterías en presentaciones en vivo y grabaciones de estudio, donde su robustez resiste la microfonía cercana de fuentes ruidosas.[92]
Los micrófonos dinámicos varían en sus mecanismos de respuesta: los modelos tradicionales de bobina móvil a menudo funcionan como micrófonos de presión, sensibles a la presión sonora absoluta, mientras que las variantes de cinta y ciertos diseños de gradiente de presión responden a la diferencia de presión entre la parte delantera y trasera del diafragma, similar a los micrófonos de velocidad. Esta distinción influye en su idoneidad para diferentes escenarios acústicos, con tipos de velocidad como cintas que proporcionan una salida más direccional.
Micrófonos de condensador
Los micrófonos de condensador, también conocidos como micrófonos de condensador o electrostáticos, funcionan a través de una estructura en la que un diafragma liviano sirve como una placa de un capacitor, junto con una placa posterior rígida fija como la otra. El diafragma está cargado eléctricamente y las ondas sonoras incidentes lo hacen vibrar, alterando el espacio entre las placas y modulando así la capacitancia para producir una señal eléctrica de CA representativa de la presión acústica. Este proceso se basa en la física básica de los condensadores de placas paralelas, donde la capacitancia varía inversamente con la separación de las placas.
Los subtipos de micrófonos de condensador se diferencian principalmente en sus mecanismos de polarización para mantener el voltaje necesario en las placas del condensador. Los modelos con polarización CC o condensador verdadero dependen de un voltaje de polarización CC externo, comúnmente proporcionado a través de alimentación fantasma de 48 V, para cargar la cápsula externamente para lograr un control preciso y un alto rendimiento. Las variantes polarizadas por RF utilizan una señal portadora de radiofrecuencia de alta frecuencia superpuesta al audio, que demodula las variaciones de capacitancia para producir una salida de bajo ruido adecuada para aplicaciones especializadas de baja impedancia. Los condensadores electret incorporan una carga electrostática permanente incrustada en un material electret, generalmente una lámina delgada integrada en el diafragma o placa posterior, lo que permite la auto polarización sin energía externa para la cápsula misma.
Estos micrófonos destacan en aplicaciones de alta fidelidad debido a su sensibilidad típica de alrededor de -40 dB re 1 V/Pa, lo que permite capturar detalles finos en señales acústicas. Proporcionan un amplio ancho de banda de frecuencia, que generalmente abarca de 20 Hz a 20 kHz, lo que garantiza una reproducción precisa de todo el espectro audible. El bajo ruido propio inherente, a menudo de 10 a 20 dBA, mejora aún más su idoneidad para grabar fuentes silenciosas con un mínimo de silbido añadido.[98][99][100]
Los micrófonos de condensador de válvula o tubo integran amplificación de tubo de vacío directamente en el cuerpo del micrófono, y normalmente emplean un triodo como el 12AX7 para igualar la impedancia y aumentar la señal. El circuito de válvulas introduce una sutil distorsión armónica y saturación, lo que contribuye a una calidad tonal cálida y eufónica que suaviza los transitorios y enriquece la presencia de rango medio, una característica apreciada en los entornos de estudio antiguos de las décadas de 1940 a 1960.
Los micrófonos de condensador necesitan alimentación externa para polarizar la cápsula y accionar los componentes electrónicos, lo que los distingue de los diseños pasivos. Muestran sensibilidad a la humedad ambiental, donde niveles elevados de humedad pueden condensarse en el diafragma, alterando su tensión o provocando problemas eléctricos que degradan el rendimiento. El manejo del nivel máximo de presión sonora suele ser de 120 a 140 dB SPL, a menudo aumentado con almohadillas de atenuación integradas para evitar la distorsión en escenarios más ruidosos.[95][103][104]
Micrófonos de cinta
Los micrófonos de cinta representan una subcategoría distinta de micrófonos dinámicos, que utilizan una cinta corrugada liviana como elemento transductor principal en lugar de una bobina móvil unida a un diafragma. La cinta, comúnmente construida con una fina lámina de aluminio de aproximadamente 1,5 a 5 micrones de espesor, está suspendida tensa entre los polos de fuertes imanes permanentes, formando un espacio estrecho donde queda expuesta a un campo magnético uniforme.
Las ondas sonoras que golpean la cinta hacen que ésta oscile, generando voltaje a través de inducción electromagnética a medida que el material conductor se mueve perpendicular al flujo magnético; este mecanismo sensible a la velocidad produce una señal de salida directamente proporcional a la velocidad de las partículas del aire en lugar de a la presión, lo que contribuye a su característica respuesta bidireccional. Por naturaleza, esta configuración produce un patrón polar inherente en forma de 8, con igual sensibilidad a los sonidos que llegan desde el frente y desde atrás, rechazando los de los lados.[105]
La masa excepcionalmente baja de la cinta (generalmente de 1 a 2 miligramos) permite una respuesta transitoria superior en comparación con la dinámica de bobina móvil más pesada, lo que permite una captura precisa de cambios rápidos de presión sonora sin manchas inducidas por la inercia.
A finales de la década de 1990 y principios de la década de 2000, fabricantes como Royer Labs fueron pioneros en actualizaciones modernas para superar las limitaciones históricas, incorporando cintas de aluminio más delgadas (como elementos de 2,5 micrones) para una mayor durabilidad y extensión de frecuencia, junto con electrónica activa alimentada por voltaje fantasma para aumentar la salida sin comprometer el núcleo pasivo.[110][111] También se perfeccionaron las rejillas protectoras y los diseños compatibles con el parabrisas para mitigar los daños causados por las ráfagas de aire o la manipulación, ampliando su viabilidad en entornos profesionales.[112][113]
Estos micrófonos ofrecen un perfil sonoro "aterciopelado" característico a través de una suave atenuación de las altas frecuencias por encima de 10-15 kHz, enfatizando la calidez de los medios y el timbre natural que se adapta a la microfonía cercana de metales, cuerdas y amplificadores de guitarra, al tiempo que reduce la aspereza en los transitorios.[105][114] Sin embargo, su baja sensibilidad (a menudo alrededor de -60 dB re 1 V/Pa) exige una preamplificación limpia y de alta ganancia para evitar el ruido, y la fragilidad de la cinta las hace vulnerables al viento, explosivos y golpes mecánicos, lo que puede causar desgarros o cambios de impedancia si se manejan mal.[115][116][117]
Después de perder prominencia a mediados del siglo XX debido a preocupaciones sobre la durabilidad y el surgimiento de alternativas más robustas, los micrófonos de cinta experimentaron un resurgimiento significativo a partir de la década de 1990, impulsados por innovadores boutique como Royer Labs (fundado en 1998) y AEA Ribbons, quienes reintrodujeron modelos hechos a mano con confiabilidad mejorada para conjuntos orquestales, seguimiento vocal y captura de gabinetes de guitarra eléctrica en los estudios.
Micrófonos piezoeléctricos y de carbono
Los micrófonos de carbono funcionan según un principio resistivo en el que las ondas sonoras hacen que un diafragma comprima los gránulos de carbono empaquetados entre dos electrodos, variando la resistencia eléctrica en el circuito y modulando la corriente de una batería o fuente de energía. Este diseño simple los hizo económicos y robustos para los primeros dispositivos de comunicación. Fueron ampliamente utilizados en teléfonos durante la década de 1920, proporcionando niveles de señal suficientes sin amplificación antes de que la tecnología de los tubos de vacío se volviera común. Sin embargo, los micrófonos de carbono sufren un alto ruido eléctrico debido al movimiento de los gránulos y al contacto inconsistente, lo que limita su idoneidad para aplicaciones de alta fidelidad.
La respuesta de frecuencia de los micrófonos de carbono suele ser estrecha, oscilando entre aproximadamente 300 Hz y 3000 Hz, lo que se alinea con las necesidades de telefonía de voz pero excluye las frecuencias graves y agudas. A pesar de estos inconvenientes, sus ventajas incluyen el bajo costo, la ausencia de necesidad de alimentación externa más allá de una simple fuente de CC y la durabilidad mecánica, lo que los hace ideales para un uso resistente y portátil en la telefonía de principios del siglo XX. En los contextos modernos, los micrófonos de carbono se emplean principalmente en la restauración de equipos de audio antiguos, donde los entusiastas recrean su característico sonido ruidoso y de baja fidelidad para grabaciones históricas o efectos novedosos.
Los micrófonos piezoeléctricos, también conocidos como micrófonos de cristal, generan voltaje mediante la deformación de cristales piezoeléctricos, como la sal de Rochelle o el cuarzo, cuando la presión del sonido flexiona un diafragma adjunto. Esta conversión directa de tensión mecánica en carga eléctrica se produce sin bobinas móviles ni energía externa, dependiendo de las propiedades inherentes del material. Son particularmente adecuados para aplicaciones de contacto, donde el micrófono se conecta directamente a una superficie vibrante, como en pastillas de guitarra acústica que capturan resonancias de cuerdas y cuerpo para amplificación.
La carga de salida QQQ en un micrófono piezoeléctrico viene dada por la ecuación
donde ddd es la constante de carga piezoeléctrica (en culombios por newton) y FFF es la fuerza aplicada por la presión acústica. Las ventajas de los micrófonos piezoeléctricos incluyen su funcionamiento pasivo (no requieren baterías ni imanes), tamaño compacto y alta sensibilidad a las vibraciones, lo que los hace resistentes para el uso con instrumentos. Sin embargo, exhiben una respuesta de frecuencia deficiente con picos en resonancias mecánicas, alta impedancia de salida que exige una preamplificación especializada y distorsión a niveles de sonido más altos, lo que los hace inadecuados para grabaciones precisas en estudio.
Tipos de transductores exóticos
Los micrófonos de fibra óptica funcionan modulando la intensidad de la luz mediante la vibración de un diafragma que sirve como superficie reflectante. En estos dispositivos, las ondas sonoras hacen que el diafragma vibre, alterando el acoplamiento de la luz entre las fibras ópticas de entrada y salida, produciendo así una señal de intensidad modulada proporcional a la presión acústica.[119] Los primeros diseños de la década de 1990 utilizaban una membrana reflejada para desviar el haz e influir en el acoplamiento de la guía de ondas, logrando respuestas de frecuencia planas en todo el rango de audio con niveles de presión equivalentes al ruido de alrededor de 38 dB(A). Las aplicaciones contemporáneas aprovechan este principio en entornos inmunes a la interferencia electromagnética (EMI), como los escáneres de imágenes por resonancia magnética (MRI), donde un vibrómetro de fibra óptica detecta vibraciones diminutas (hasta un desplazamiento máximo de 8 pm en frecuencias audibles) midiendo cambios en la intensidad de la luz obstruida por el elemento vibratorio. La separación de la fibra óptica garantiza una inmunidad completa a las interferencias de radiofrecuencia (RFI), lo que hace que estos micrófonos sean ideales para entornos médicos de alto campo.[122]
Los micrófonos basados en láser, a menudo implementados como vibrómetros láser Doppler, permiten la medición sin contacto de las vibraciones del diafragma al detectar el desplazamiento Doppler en la luz láser reflejada. El cambio de frecuencia fdf_dfd se calcula como fd=2vf0cf_d = \frac{2v f_0}{c}fd=c2vf0, donde vvv es la velocidad de la superficie, f0f_0f0 es la frecuencia incidente del láser y ccc es la velocidad de la luz; este cambio surge de la interferencia entre los haces de referencia y el desplazado Doppler.[123] Dichos sistemas caracterizan el rendimiento del micrófono escaneando el diafragma para mapear amplitudes y frecuencias de velocidad, ofreciendo una menor incertidumbre en la calibración de la sensibilidad en comparación con los métodos tradicionales, con resultados repetibles de las regiones centrales del diafragma.[124] Este enfoque no intrusivo se adapta a pruebas acústicas delicadas o remotas y se extiende al análisis de banda ancha desde CC hasta más de 6 GHz con resolución de femtómetro.
Los micrófonos líquidos dependen del desplazamiento de fluidos para transducir la presión acústica en señales eléctricas, particularmente adecuados para entornos de alta presión como aplicaciones submarinas. En estos diseños, el movimiento inducido por el sonido de una varilla o membrana desplaza el líquido conductor, como agua acidulada o mercurio, alterando la resistencia eléctrica o la capacitancia para generar la salida.[125] Las variantes basadas en mercurio brindan una detección sólida para presiones extremas que exceden los 30 000 psi debido a la alta densidad del fluido y su resistencia a la compresibilidad, y encuentran uso en hidrófonos especializados para el monitoreo oceánico donde los diafragmas tradicionales fallarían.
Características direccionales
Fundamentos del patrón polar
La directividad del micrófono surge principalmente de diferencias de fase en las ondas sonoras que llegan a diferentes puntos sobre o dentro de la cápsula del micrófono, lo que genera interferencias constructivas o destructivas que varían con el ángulo de incidencia. En los micrófonos omnidireccionales, la cápsula es pequeña en relación con la longitud de onda del sonido, lo que da como resultado una presión casi uniforme a través del diafragma y ninguna variación de fase significativa, lo que produce la misma sensibilidad desde todas las direcciones. Los patrones direccionales surgen cuando se explotan estas diferencias de fase, ya sea a través del diseño inherente del micrófono o combinando respuestas de múltiples elementos sensores.[133]
Los gráficos polares ilustran la sensibilidad del micrófono en función del ángulo θ con respecto al eje principal, normalmente en decibelios (dB) en un gráfico circular que abarca 360 grados. Un patrón omnidireccional aparece como un círculo con una variación de 0 dB en todo θ, lo que indica una respuesta isotrópica. Por el contrario, los patrones direccionales muestran lóbulos y nulos; por ejemplo, un patrón en forma de ocho tiene una sensibilidad máxima en θ = 0° y 180° (delantera y trasera) con una sensibilidad nula en θ = 90° (laterales). Estos gráficos dependen de la frecuencia y a menudo se muestran en frecuencias medias, como 1 kHz, para estandarización.[133][134]
Los micrófonos de presión, como los típicos de condensador o dinámicos con un diafragma de un solo lado, responden a la presión sonora escalar P, que no tiene direccionalidad inherente y, por lo tanto, produce un patrón omnidireccional. Los micrófonos de gradiente de presión o velocidad, como los diseños de cinta, detectan la velocidad de las partículas o el gradiente espacial de presión (∂P/∂x), que para una onda plana es proporcional a P cos θ, introduciendo direccionalidad ya que el gradiente apunta a lo largo de la dirección de propagación. El patrón en forma de ocho de un micrófono con gradiente de presión puro refleja esta dependencia del coseno, con una sensibilidad que cae a cero en θ = 90°.[133]
Un patrón cardioide, común en muchos micrófonos prácticos, resulta de la combinación de respuestas omnidireccionales (presión) y bidireccionales (gradiente), a menudo con cancelación frontal-posterior para rechazar el sonido incidente desde atrás. La respuesta normalizada para un cardioide ideal de baja frecuencia viene dada por:
Esta ecuación produce una sensibilidad máxima (2) en θ = 0° y una nula (0) en θ = 180°, creando un gráfico polar en forma de corazón. La combinación logra esto agregando la señal omni a la señal de gradiente, donde el término cos θ del gradiente refuerza el frente mientras cancela la parte trasera.
Los factores clave que influyen en estos patrones incluyen la relación entre la longitud de onda del sonido λ y el espacio o tamaño de las cápsulas. Para un comportamiento omnidireccional, λ debe exceder con creces el espaciado (normalmente λ > 10 × espaciado), lo que garantiza diferencias de fase insignificantes en toda la cápsula; a frecuencias más altas donde λ se acerca al diámetro de la cápsula (por ejemplo, las cápsulas de >1 pulgada se distorsionan por encima de ~15 kHz), incluso los micrófonos de presión exhiben una mayor directividad debido al sombreado y la difracción. Esta dependencia de la longitud de onda limita la uniformidad del patrón en todo el espectro de audio, lo que requiere cápsulas pequeñas para la omnidireccionalidad de banda ancha.[133]
Patrones omnidireccionales
Los micrófonos omnidireccionales, también conocidos como micrófonos de presión, cuentan con un único diafragma expuesto en un lado a las ondas sonoras entrantes, mientras que la parte posterior está encerrada en una cámara sellada, lo que permite que el dispositivo responda igualmente a la presión del sonido desde todas las direcciones sin efectos de cancelación de fase.[135] Un pequeño respiradero en la carcasa asegura la ecualización de la presión entre la cámara interna y el ambiente externo, evitando desequilibrios de presión estática que podrían desplazar el diafragma y distorsionar las mediciones.[136] Este diseño contrasta con los patrones unidireccionales, que se basan en diferencias de fase entre las llegadas del sonido frontal y posterior para lograr direccionalidad.[86]
Estos micrófonos destacan por capturar el ambiente natural y proporcionan un amplio punto óptimo debido a su sensibilidad uniforme, lo que da como resultado respuestas de frecuencia fuera del eje más suaves y menos coloración de los reflejos de la sala en comparación con los tipos direccionales.[86] Sin embargo, su falta de direccionalidad los hace muy sensibles a la reverberación ambiental no deseada y a fuentes de ruido externas, lo que limita su uso en entornos reverberantes o ruidosos.[86]
Los ejemplos incluyen micrófonos de medición como el DPA 4006, que mantienen una respuesta de frecuencia plana de 10 Hz a 20 kHz, lo que los hace adecuados como estándares omnidireccionales operados por presión para calibración acústica.[137] Las limitaciones clave incluyen la ausencia del efecto de proximidad, que impide el refuerzo de graves de fuentes cercanas, y una mayor vulnerabilidad al ruido del viento; Los parabrisas son esenciales y ofrecen una atenuación de más de 20 dB a velocidades del viento de 10 m/s.[86][9][138]
En aplicaciones como estándares de calibración y grabación de campo ambiental, los micrófonos omnidireccionales brindan captura de sonido espacial integral sin polarización direccional, ideal para audio inmersivo o pruebas acústicas donde se requiere una detección de presión uniforme.[139][140]
Patrones unidireccionales
Los patrones de micrófono unidireccionales priorizan la sensibilidad a las fuentes de sonido desde el frente mientras rechazan las señales de los lados y la parte trasera, lo que los hace esenciales para aislar a intérpretes o instrumentos en entornos con ruido ambiental o riesgos de retroalimentación. El patrón cardioide, el tipo unidireccional más común, presenta un único lóbulo frontal con forma de corazón invertido, logrado a través de un puerto trasero que introduce un retraso de fase en el sonido que llega desde detrás del diafragma. Este retraso causa interferencia destructiva para las señales traseras, lo que resulta en una respuesta polar descrita por la fórmula 1+cosθ2\frac{1 + \cos \theta}{2}21+cosθ, donde θ\thetaθ es el ángulo de incidencia relativo al eje frontal del micrófono; en θ=0∘\theta = 0^\circθ=0∘, la sensibilidad es máxima (1), cayendo a 0,5 (6 dB hacia abajo) en θ=90∘\theta = 90^\circθ=90∘ y nula en θ=180∘\theta = 180^\circθ=180∘.[61]
Los patrones hipercardioide y supercardioide son variantes del cardioide, que ofrecen lóbulos frontales más estrechos para una mayor directividad al tiempo que introducen un pequeño lóbulo trasero que capta algo de sonido desde atrás. El hipercardioide tiene el ángulo de aceptación más estrecho, aproximadamente 105° para una caída de 3 dB, lo que proporciona nulos más profundos en los lados pero con una sensibilidad trasera que alcanza un máximo de alrededor de 110° fuera del eje, lo que exige una orientación precisa para evitar la retroalimentación.[141] Por el contrario, el supercardioide mantiene un ángulo de aceptación de aproximadamente 115°, con su rechazo más profundo a 125° fuera del eje y menos captación trasera que el hipercardioide, equilibrando el aislamiento y la facilidad de uso en entornos en vivo.[141] Estos patrones mejoran el rechazo fuera del eje en comparación con la línea de base omnidireccional, y generalmente atenuan las señales en 6 dB o más a 90°, aunque el rendimiento varía con la frecuencia debido a la ampliación del patrón en frecuencias más bajas.
El subcardioide, también conocido como cardioide ancho, ensancha el lóbulo frontal más allá del cardioide estándar para capturar más sonido ambiental manteniendo algo de rechazo trasero, ubicándolo entre patrones cardioide y omnidireccional para aplicaciones que necesitan un tono ambiental natural. Su ángulo de aceptación excede el del cardioide, acercándose a menudo a 130° o más para una caída de 3 dB, lo que lo hace adecuado para conjuntos acústicos donde no es necesario un aislamiento total.[143] Todos los patrones unidireccionales se realizan a través de laberintos acústicos: cámaras internas con puertos y deflectores que imponen cambios de fase en el sonido del incidente posterior, combinando respuestas de presión (omnidireccional) y gradiente de presión (figura de ocho) en proporciones variables.
Una ventaja clave de los patrones unidireccionales es su rechazo fuera del eje, lo que minimiza el sangrado de fuentes cercanas; por ejemplo, los micrófonos cardioides suelen presentar una atenuación de aproximadamente 6 dB a 90° fuera del eje, lo que mejora la ganancia antes de la retroalimentación en el uso en el escenario.[142] Sin embargo, introducen un efecto de proximidad, un refuerzo de baja frecuencia que se intensifica a medida que la fuente se acerca a 0,6 m (2 pies), lo que mejora la calidez de los graves para las voces con micrófono cercano, pero requiere control de la distancia para evitar la confusión.[87] En los micrófonos de múltiples patrones, como los condensadores de doble diafragma, los interruptores permiten la selección entre variantes unidireccionales como cardioide, supercardioide, hipercardioide y subcardioide, lo que permite ajustes sobre la marcha para diversas necesidades de aislamiento sin cambiar el equipo.[145]
Patrones bidireccionales y especializados
Los micrófonos bidireccionales, también conocidos como figura de 8 o patrones bidireccionales, exhiben la misma sensibilidad al sonido que llega desde el frente y desde atrás mientras anulan las señales de los lados a 90 grados. Este patrón surge de un principio de gradiente de velocidad, donde el micrófono responde a la diferencia en la velocidad de las partículas de aire entre dos puntos, generalmente implementado en diseños de cinta o condensador con puertos frontales y traseros.
En la grabación estéreo, el patrón en forma de 8 es esencial para técnicas como el estéreo Blumlein, que emplea dos micrófonos orientados a 90 grados para capturar un escenario sonoro natural e inmersivo con posiciones coincidentes. De manera similar, en el estéreo medio (MS), un micrófono en forma de 8 sirve como canal "lateral", orientado perpendicular a un micrófono "medio" orientado hacia adelante, lo que permite el ajuste de posproducción del ancho estéreo mientras se mantiene la compatibilidad mono al derivar la imagen central únicamente de la señal media. Estas aplicaciones aprovechan los lóbulos duales simétricos del patrón para lograr precisión espacial, aunque requieren una ubicación cuidadosa para evitar problemas de fase debido a reflexiones de la sala fuera del eje.[146][147]
Los micrófonos de superficie producen un patrón polar hemisférico cuando se montan sobre una superficie plana, duplicando efectivamente la presión del sonido a través del principio de imagen, donde los reflejos del límite refuerzan el sonido directo, produciendo una ganancia de sensibilidad de 6 dB. Este diseño minimiza los artefactos de filtrado de peine provenientes de los reflejos de la superficie, brindando una cobertura uniforme sobre una media esfera sobre el plano de montaje, ideal para capturar múltiples hablantes sin apuntar discretamente. En entornos de conferencias, los micrófonos de superficie ofrecen ventajas como una instalación de perfil bajo para una estética discreta y una amplia captación hemisférica para cubrir las discusiones en la mesa, aunque pueden capturar inadvertidamente ruidos de manipulación o vibraciones de la superficie y pueden quedar ocultos por los documentos.[148]
Los micrófonos de cañón extienden los patrones hipercardioides utilizando un tubo de interferencia (un cilindro ranurado delante de la cápsula) que retrasa las ondas sonoras fuera del eje, provocando interferencias destructivas y directividad lobulada para una captura enfocada en el eje. Esto da como resultado un rechazo sustancial fuera del eje, que a menudo excede los 20 dB en ángulos de alrededor de 125 grados, lo que mejora el aislamiento en la producción o transmisión de video y al mismo tiempo reduce el ángulo de aceptación en frecuencias más altas. La longitud del tubo influye en el ancho de banda de rechazo, y los diseños más largos proporcionan nulos más profundos pero una mayor susceptibilidad al ruido del viento.
Diseño y Construcción
Geometría y directividad de la cápsula
La geometría de una cápsula de micrófono influye significativamente en su directividad inherente al interactuar con las ondas sonoras entrantes a través de gradientes de difracción y presión, independientemente del procesamiento electrónico o modificaciones acústicas externas. Las cápsulas esféricas son particularmente efectivas para patrones omnidireccionales, ya que su forma simétrica minimiza los artefactos de difracción y mantiene una respuesta polar amplia en todas las frecuencias. En tales diseños, la carcasa esférica alrededor de un pequeño transductor de presión da como resultado una acumulación suave de presión en la superficie de la cápsula, comenzando por encima de aproximadamente 1 kHz, lo que mejora la respuesta de alta frecuencia sin introducir picos o caídas pronunciados que se ven comúnmente en formas menos simétricas. Esta geometría produce un suave aumento de hasta +6 dB en la respuesta de campo libre con una incidencia de 0° y admite un amplio ángulo de aceptación, lo que la hace ideal para capturar campos sonoros difusos con reverberación natural.[152]
Por el contrario, las geometrías de cápsulas cilíndricas se aproximan al comportamiento de la fuente de línea, promoviendo una mayor directividad a lo largo del eje perpendicular a la longitud del cilindro, lo cual es útil para aplicaciones que requieren captación enfocada de fuentes extendidas como cuerdas o líneas ambientales. La forma alargada crea una distribución de presión asimétrica, con una sensibilidad reducida en los lados debido a la interferencia de fase de la superficie curva, lo que mejora la directividad axial en frecuencias medias a altas en comparación con las formas esféricas. Sin embargo, esto puede introducir variaciones más pronunciadas dependientes de la frecuencia, como aumentos elevados de la respuesta de hasta 10 dB en ciertas direcciones, lo que requiere un diseño cuidadoso para equilibrar la uniformidad.
El tamaño del diafragma en relación con la longitud de onda del sonido juega un papel fundamental a la hora de determinar el rango de frecuencia en el que un patrón omnidireccional sigue siendo eficaz. Un diafragma más grande, como uno con un diámetro de 1 cm, mantiene la omnidireccionalidad en frecuencias más bajas (por ejemplo, por debajo de 500 Hz) porque la longitud de onda es mucho más larga que el tamaño del diafragma, lo que resulta en una presión uniforme en toda la superficie (ka << 1, donde k = 2π/λ). Sin embargo, a frecuencias más altas, el mismo tamaño conduce a una mayor directividad debido al sombreado acústico y la difracción de los bordes, donde las ondas fuera del eje interfieren destructivamente en los bordes. Los diafragmas más pequeños (por ejemplo, de menos de 0,5 cm) amplían el rango omnidireccional a frecuencias más altas manteniendo ka pequeño por más tiempo, reduciendo la aparición de direccionalidad y proporcionando una respuesta fuera del eje más plana hasta 10-15 kHz.[71]
La sombra acústica de los bordes de la cápsula contribuye aún más a la directividad de alta frecuencia a través de efectos de difracción, donde las ondas sonoras que se curvan alrededor del límite crean gradientes de presión. Este fenómeno se cuantifica mediante el índice de directividad DI ≈ 10 \log_{10} \left(1 + \frac{(ka)^2}{2}\right), donde k = 2\pi / \lambda es el número de onda, a es el radio efectivo y la aproximación es válida para valores ka moderados típicos de las cápsulas de micrófono. Para una cápsula de 1 cm de diámetro (a ≈ 0,5 cm), surge una directividad significativa (p. ej., ganancia de 3 a 6 dB en el eje) por encima de 5 a 10 kHz, ya que las ondas traseras y laterales quedan ensombrecidas, lo que mejora la sensibilidad hacia adelante y al mismo tiempo estrecha el patrón polar.
Los diseños de cápsulas múltiples que emplean una ubicación coincidente (donde los diafragmas están alineados en el mismo centro acústico) permiten patrones de directividad versátiles sin introducir problemas de fase espacial debido a la separación. Al combinar señales de dos o más cápsulas estrechamente espaciadas (por ejemplo, una omnidireccional y otra bidireccional), se pueden sintetizar patrones como el cardioide mediante una simple suma o resta, preservando la coherencia en todo el espectro. Este enfoque evita los artefactos de filtrado en peine de las matrices espaciadas y permite una conmutación perfecta entre lóbulos omnidireccionales, en forma de 8 e intermedios en una sola carcasa.[153]
La elección de los materiales y el espesor del diafragma afecta la preservación de la directividad al minimizar los efectos de carga de masa que podrían alterar la conformidad acústica. Los diafragmas delgados (1-10 μm), a menudo fabricados con materiales livianos como Mylar o polímeros pulverizados con oro, reducen la masa inercial, elevando la frecuencia de resonancia por encima del rango audible (generalmente >20 kHz) y asegurando una respuesta uniforme sin filtrado de paso bajo debido a la masa agregada. Esto preserva la directividad deseada en altas frecuencias al evitar distorsiones inducidas por resonancia que podrían ampliar o irregularizar el patrón polar.[154]
Tubos de fase e interferencia
Los tubos de interferencia, comúnmente empleados en micrófonos de cañón, consisten en una estructura cilíndrica ranurada colocada frente a una cápsula transductora direccional para lograr una mayor directividad a través de la interferencia de ondas acústicas. Las ondas sonoras en el eje se propagan sin obstáculos a lo largo del eje central del tubo para llegar a la cápsula, mientras que las ondas fuera del eje ingresan lateralmente a través de ranuras espaciadas con precisión, lo que incurre en un retraso en la longitud del camino que induce interferencia destructiva y atenúa su amplitud tras la recombinación en la cápsula. La longitud del tubo está diseñada para corresponder a la mitad de la longitud de onda (λ/2\lambda/2λ/2) de las frecuencias operativas previstas, optimizando la cancelación de esas bandas y formando así un patrón polar lobulado con sensibilidad directa mejorada.[156]
Los tapones de fase sirven como barreras porosas o perforadas integradas en los puertos posteriores de las cápsulas de micrófono cardioide, lo que facilita un retraso acústico deliberado para el sonido que ingresa desde la parte posterior. Este retraso genera un cambio de fase dependiente de la frecuencia, expresado como Δϕ=2πfΔt\Delta \phi = 2\pi f \Delta tΔϕ=2πfΔt, donde fff denota frecuencia y Δt\Delta tΔt el retraso de tiempo, lo que permite una interferencia destructiva que suprime el sonido trasero y preserva la respuesta frontal. El material y la porosidad del tapón están calibrados para garantizar que la inversión de fase se aproxime a 180 grados en todo el ancho de banda deseado, lo que contribuye al característico patrón polar en forma de corazón.[159]
Las rejillas y ranuras incorporadas en los tubos de interferencia y las estructuras de fase atenúan inherentemente las frecuencias más altas a través de mecanismos como el arrastre viscoso dentro de aberturas estrechas y la difracción en los bordes, que en conjunto dan forma a la respuesta de frecuencia general. Las configuraciones de múltiples ranuras, con diferentes anchos y espacios, extienden esta atenuación de banda ancha para mitigar el énfasis excesivo de las altas frecuencias, promoviendo una directividad más equilibrada en todo el espectro de audio.
A pesar de su eficacia, los tubos de fase e interferencia exhiben limitaciones arraigadas en sus principios acústicos, incluido el lóbulo dependiente de la frecuencia donde la sensibilidad en el eje exhibe picos en los armónicos de la frecuencia de diseño primaria debido al refuerzo constructivo. Además, la geometría alargada y ranurada hace que estos diseños sean vulnerables a la turbulencia del viento, lo que genera fluctuaciones erráticas de presión y amplifica el ruido en ambientes exteriores. Estas limitaciones a menudo requieren parabrisas suplementarios o una colocación cuidadosa para mantener la integridad del rendimiento.[163]
Configuraciones de límites y estéreo
Los micrófonos de superficie, también conocidos como micrófonos de zona de presión (PZM), utilizan un diseño en el que la cápsula se coloca extremadamente cerca de una superficie plana y reflectante, como una mesa o pared, creando una zona de presión que alinea en fase las ondas sonoras directas y reflejadas. Este efecto de límite duplica el nivel de presión sonora, proporcionando una ganancia de sensibilidad de 6 dB y produciendo un patrón de captación hemisférico con respuesta uniforme en el medio espacio superior.[164][165] La configuración minimiza la interferencia de fase y el filtrado de peine, lo que garantiza una cobertura uniforme en un área amplia, lo que hace que los micrófonos de superficie sean especialmente adecuados para salas de conferencias y reuniones donde la colocación discreta y de bajo perfil en superficies es esencial para capturar a varios participantes sin distracciones visuales.[166][167]
Las configuraciones de micrófonos estéreo emplean pares de micrófonos para replicar señales de audio espaciales, mejorando la inmersión al capturar la amplitud, la profundidad y el ambiente. La técnica XY utiliza dos micrófonos cardioides coincidentes en un ángulo de 90 grados (normalmente ±45 grados desde el centro), con cápsulas colocadas lo más cerca posible para evitar diferencias horarias y garantizar la compatibilidad mono. Esta configuración ofrece una imagen estéreo estable y enfocada con buena resolución frontal y problemas de fase reducidos.[168] La técnica ORTF, desarrollada por la organización de radiodifusión francesa, coloca dos micrófonos cardioides a 17 cm de distancia en un ángulo de 110 grados, simulando el tiempo interaural humano y las diferencias de nivel para una difusión estéreo amplia y natural que equilibra el sonido directo y la reverberación.[168] Los pares omnidireccionales espaciados, a menudo separados por 20 a 60 cm o más dependiendo de la distancia de la fuente, enfatizan el ambiente y la respuesta de baja frecuencia a través de retrasos de tiempo intencionales, creando un sonido espacioso y envolvente ideal para grabaciones orquestales o ambientales, aunque pueden introducir un "agujero" central en la imagen si el espacio es excesivo.[169]
El par Blumlein, una técnica coincidente que utiliza dos micrófonos en forma de ocho cruzados a 90 grados, captura la sensibilidad bidireccional para producir un escenario sonoro horizontal realista con excelente localización y captación del ambiente trasero. Esta configuración es matemáticamente equivalente a una matriz de lado medio (M/S) donde el "medio" se deriva de los lóbulos delanteros y el "lado" de las diferentes respuestas laterales; la decodificación produce los canales izquierdo (L) y derecho (R) mediante las fórmulas:
donde M es la señal media y S es la señal lateral, lo que a menudo requiere un ajuste de 3 dB hacia el lado para igualar el nivel.[170][171] Estos métodos estéreo proporcionan audio inmersivo al preservar las relaciones espaciales, con aplicaciones en la producción y transmisión de música para una reproducción realista.[140]
Alimentación e Interfaces
Métodos de suministro de energía
Los micrófonos, particularmente los de condensador y electreto, requieren energía externa para operar sus componentes activos, como polarizar el diafragma o alimentar amplificadores internos. Esta alimentación se suministra a través de varios métodos según el diseño y la aplicación del micrófono, lo que garantiza la compatibilidad con sistemas de audio profesionales y minimiza la interferencia con la señal de audio.
El método más común es la alimentación fantasma, estandarizada según IEC 61938, que entrega +48 V CC a través de un cable XLR balanceado en los pines 2 y 3 con respecto a tierra (pin 1), con una corriente máxima de 10 mA por micrófono para soportar cápsulas de condensador. Este voltaje se aplica por igual a ambas líneas de audio a través de resistencias adaptadas, generalmente de 6,81 kΩ, lo que permite que la potencia sea "invisible" para las señales de audio balanceadas y, al mismo tiempo, proporciona un funcionamiento estable para los micrófonos de condensador profesionales.[175]
Una alternativa más antigua, T-power (también conocida como alimentación A-B o Tonaderspeisung), suministra 12 V CC directamente entre las líneas de audio (pines 2 y 3) sin una referencia a tierra, y se originó como un estándar europeo según DIN 45595 para la alimentación remota de micrófonos de condensador en entornos de transmisión. Aunque en gran medida está obsoleto debido a la incompatibilidad con los sistemas de alimentación fantasma, persiste en algunos equipos de grabación de películas y locaciones donde se necesita compatibilidad heredada.[177]
Para los micrófonos de condensador electret, que utilizan un material cargado permanentemente, la potencia de polarización proporciona un voltaje más bajo de 1,5 a 10 V CC, a menudo mediante alimentación enchufable en conectores de 3,5 mm, con valores comunes como 2,5 V en aplicaciones de cámaras o grabadoras portátiles para energizar el amplificador JFET.[178] Este método es adecuado para dispositivos compactos de bajo consumo en los que la potencia fantasma total sería excesiva.
Los micrófonos inalámbricos y autoamplificados suelen depender de baterías internas, como pilas AA o de iones de litio recargables, para accionar transmisores y cápsulas independientemente de los suministros por cable, lo que ofrece movilidad en transmisiones y sonido en vivo. Algunos micrófonos USB digitales consumen 5 V de la alimentación del bus USB del dispositivo host, integrando amplificación y conversión en un formato plug-and-play para grabación por computadora.[179] Los diseños emergentes incorporan inducción de RF para la carga inalámbrica, ampliando el tiempo de funcionamiento sin cambios frecuentes de batería.[180]
Las características de seguridad, incluidas las resistencias limitadoras de corriente en las fuentes de alimentación (por ejemplo, 6,81 kΩ en sistemas fantasma), evitan daños por cortocircuitos o conexiones inadecuadas al restringir el flujo de corriente a niveles seguros, protegiendo tanto los micrófonos como los equipos conectados.
Consideraciones analógicas y de impedancia
Los micrófonos suelen diseñarse con una impedancia de salida baja, conocida como Z baja, que oscila entre 150 y 600 ohmios, lo que facilita largos recorridos de cable y reduce la susceptibilidad a las interferencias electromagnéticas.[181] Por el contrario, los micrófonos de alta Z, con impedancias superiores a 10 kΩ, se utilizan a menudo para conexiones directas de instrumentos, como guitarras, pero son más propensos a captar ruido a distancia.[181] Para minimizar la pérdida de señal en estas configuraciones, se emplea una configuración de puente donde la impedancia de entrada del preamplificador o mezclador es al menos 10 veces mayor que la impedancia de salida del micrófono, lo que garantiza que se transfiera más del 90% del voltaje.[182]
Las conexiones analógicas balanceadas son estándar para que los micrófonos profesionales rechacen el ruido de modo común, como el zumbido de las líneas eléctricas, a través de señalización diferencial. En este método, la señal de audio se envía por dos conductores con polaridad opuesta, y el dispositivo receptor resta uno del otro, cancelando el ruido que afecta a ambas líneas por igual preservando la señal deseada.[183] Los conectores XLR se utilizan predominantemente para líneas balanceadas de micrófono debido a su diseño de tres pines (caliente, frío y tierra) y su construcción robusta, mientras que los conectores TRS (punta-anillo-manga) de 1/4 de pulgada sirven propósitos similares para tramos más cortos o entradas de instrumentos.
Los efectos de carga ocurren cuando la impedancia de entrada del dispositivo receptor interactúa con la impedancia de salida del micrófono, lo que puede causar una caída de voltaje según el principio del divisor de voltaje:
donde VoutV_{\text{out}}Vout es el voltaje de salida, VmicV_{\text{mic}}Vmic es el voltaje de circuito abierto del micrófono, ZinZ_{\text{in}}Zin es la impedancia de entrada y ZmicZ_{\text{mic}}Zmic es la impedancia de salida del micrófono.[184] Esta caída se vuelve significativa si no se mantiene la relación de puenteo, lo que reduce el nivel de la señal y altera potencialmente la respuesta de frecuencia.
La capacitancia del cable introduce una caída de alta frecuencia en las señales de micrófonos analógicos, actuando como un filtro de paso bajo con una frecuencia de corte dada por:
fc=12πRCf_c = \frac{1}{2\pi R C}fc=2πRC1
donde RRR es la impedancia efectiva de la fuente (normalmente la impedancia de salida del micrófono o del transformador) y CCC es la capacitancia del cable por unidad de longitud, a menudo alrededor de 100 pF/m para cables de micrófono estándar.[185] Los cables más largos exacerban este efecto, atenuando la respuesta de los agudos, particularmente con fuentes de alta impedancia.
Estándares de conectividad digital
Los estándares de conectividad digital para micrófonos permiten la transmisión directa de datos de audio en formatos digitales, minimizando las pérdidas de conversión de analógico a digital y facilitando la integración con redes y sistemas integrados modernos. Estos estándares admiten funcionamiento de bajo consumo, inmunidad al ruido y escalabilidad para aplicaciones que van desde dispositivos de consumo hasta configuraciones de audio profesionales. A diferencia de las interfaces analógicas heredadas, que dependen de señales de voltaje propensas a sufrir interferencias, los estándares digitales utilizan flujos de bits o datos en paquetes para lograr un rendimiento sólido.[187]
La modulación de densidad de pulso (PDM) es una interfaz serial de 1 bit ampliamente adoptada y utilizada principalmente en micrófonos de sistemas microelectromecánicos (MEMS), donde el audio se codifica como un flujo de pulsos de alta frecuencia que representa la densidad de la señal. Este formato permite un consumo de energía ultrabajo, a menudo inferior a 1 mW, lo que lo hace ideal para dispositivos que funcionan con baterías, como teléfonos inteligentes y dispositivos portátiles. Las salidas PDM normalmente se convierten a formatos multibit, como I²S, para su posterior procesamiento, lo que proporciona un rechazo de ruido inherente debido a la naturaleza digital de la cadena de señal.[188]
La multiplexación por división de tiempo (TDM) permite configuraciones eficientes de múltiples micrófonos al asignar intervalos de tiempo para datos de múltiples dispositivos a través de un bus compartido, lo que admite la conexión en cadena en conjuntos de micrófonos sin cableado complejo. La especificación MIPI SoundWire ejemplifica este enfoque, utilizando una interfaz de dos cables para transportar datos PCM y PDM a través de hasta 11 dispositivos esclavos, con un bajo número de puertas y una eficiencia energética adecuada para aplicaciones móviles y de IoT. A partir de 2025, SoundWire versión 1.3 mejora la integración de la topología y la optimización del reloj para mejorar el manejo de audio multicanal en sistemas integrados.
La conectividad USB para micrófonos digitales aprovecha la especificación USB Audio Class 2.0 (UAC 2.0), que garantiza un funcionamiento compatible con su clase en todos los dispositivos y admite frecuencias de muestreo de hasta 192 kHz a una profundidad de 24 bits a través de enlaces USB 2.0 de alta velocidad. Esto permite la integración plug-and-play con computadoras y tabletas, entregando audio de alta resolución sin controladores personalizados. Para entornos de red, Dante (Audio sobre IP) proporciona un protocolo AoIP escalable para micrófonos, que permite la transmisión de baja latencia de múltiples canales a través de Ethernet, con interoperabilidad a través de AES67 y soporte para flujos de hasta 512x512 en instalaciones profesionales.[190][191]
El estándar AES42 define una interfaz digital profesional para micrófonos, incorporando Digital Phantom Power (DPP) a +10 V junto con una señal de reloj superpuesta en cableado AES3 balanceado, lo que permite alimentación remota y sincronización sin líneas adicionales. Esto facilita la transmisión de alta fidelidad en entornos de estudio y transmisión, con distribución de reloj integrada que garantiza la coherencia de fase entre dispositivos. Las revisiones de AES42-2020 enfatizan la interoperabilidad con los ecosistemas AES3.[192]
Métricas de rendimiento
Sensibilidad y respuesta de frecuencia
La sensibilidad se refiere a la salida eléctrica de un micrófono en respuesta a una entrada acústica determinada, generalmente medida como el voltaje de circuito abierto producido por un nivel de presión sonora (SPL) de 1 pascal (Pa), que corresponde a 94 dB SPL.[194] Esta especificación se expresa en milivoltios por pascal (mV/Pa) o en decibeles en relación con 1 voltio por pascal (dBV/Pa), donde valores de sensibilidad más altos en mV/Pa o valores menos negativos en dBV/Pa indican una mayor salida para la misma entrada.[195] Por ejemplo, los micrófonos dinámicos suelen exhibir una sensibilidad más baja, alrededor de -55 dBV/Pa (aproximadamente 1,8 mV/Pa), lo que los hace adecuados para fuentes de alto SPL sin requerir una ganancia excesiva, mientras que los micrófonos de condensador ofrecen una sensibilidad más alta, a menudo -35 a -30 dBV/Pa (18 a 32 mV/Pa), lo que permite la captura de sonidos más silenciosos.[196][197]
La respuesta de frecuencia describe el rango de frecuencias que un micrófono puede capturar y la variación en su sensibilidad de salida en ese rango, generalmente representada como una curva que muestra la desviación en decibelios con respecto a un nivel de referencia.[198] El ancho de banda se especifica comúnmente como el rango de frecuencia en el que la respuesta permanece dentro de ±3 dB del nivel nominal, y a menudo abarca de 20 Hz a 20 kHz para que los micrófonos profesionales cubran el espectro audible.[199] Las desviaciones en la curva, como las atenuaciones en bajas frecuencias debido a la resonancia del diafragma o la atenuación de altas frecuencias debido a la amortiguación acústica, influyen en el equilibrio tonal del micrófono y en su idoneidad para aplicaciones específicas.[137]
El ruido propio, también conocido como ruido de entrada equivalente (EIN), cuantifica el ruido de fondo inherente de un micrófono cuando no hay sonido externo presente, expresado en decibelios ponderados A (dBA) como el SPL equivalente que produciría la misma salida.[200] Para los micrófonos de condensador de estudio, el ruido propio suele ser inferior a 15 dBA, y los modelos de gama alta alcanzan de 4 a 10 dBA para garantizar grabaciones limpias en entornos silenciosos.[201][202]
El SPL máximo indica el nivel de presión sonora más alto que un micrófono puede soportar antes de una distorsión significativa, definida como la entrada donde la distorsión armónica total (THD) alcanza el 0,5% a 1 kHz.[203] Los valores típicos oscilan entre 130 y 150 dB SPL, a menudo aumentados de 10 a 20 dB utilizando pads incorporados para acomodar fuentes ruidosas como baterías o amplificadores.[204][205]
Las métricas de rendimiento del micrófono, como la sensibilidad y la respuesta de frecuencia, se miden en condiciones estandarizadas, como la calibración de campo libre para incidencia de sonido anecoico directo o la calibración de campo difuso para entornos reverberantes con sonido que llega desde múltiples direcciones por igual.[206][207] Estos métodos garantizan una evaluación consistente, con configuraciones de campo libre que minimizan los reflejos para una respuesta precisa en el eje y un campo difuso que tiene en cuenta la incidencia aleatoria en las habitaciones.[208]
Ruido, distorsión y rango dinámico
Los micrófonos, como todos los transductores, son susceptibles a diversas fuentes de ruido que degradan la fidelidad de la señal, principalmente ruido térmico y de disparo en los tipos de condensador. El ruido térmico, también conocido como ruido de Johnson-Nyquist, surge de la agitación térmica aleatoria de los portadores de carga en componentes resistivos, con el voltaje cuadrático medio dado por e=4kTRΔfe = \sqrt{4kTR \Delta f}e=4kTRΔf, donde kkk es la constante de Boltzmann, TTT es la temperatura, RRR es la resistencia y Δf\Delta fΔf es el ancho de banda. Este ruido blanco es inherente a todos los elementos electrónicos y contribuye al ruido propio general, que normalmente se mide en condiciones estables para aislar sus efectos.[209] En los micrófonos de condensador, el ruido de disparo surge de fluctuaciones discretas del portador de carga a través de uniones pn en amplificadores asociados o circuitos de polarización, manifestándose como ruido blanco con densidad espectral de potencia proporcional a la corriente de unión e independiente de la temperatura; domina por encima de la frecuencia de esquina del ruido 1/f.[209] El ruido de entrada equivalente total (EIN), que cuantifica el ruido inherente del micrófono referido a la entrada como un nivel de presión acústica (a menudo en dBA), combina estas fuentes junto con contribuciones mecánicas y acústicas; por ejemplo, los micrófonos MEMS comerciales exhiben niveles EIN de 27 a 33 dBA, mientras que los modelos electret pueden alcanzar alrededor de 14 a 17 dBA dependiendo del voltaje de polarización.[210][209]
La distorsión en los micrófonos se debe a no linealidades en el proceso de transducción, particularmente al comportamiento del diafragma bajo diferentes presiones. La distorsión armónica total (THD) resulta de estas no linealidades, como el endurecimiento del diafragma en amplitudes más altas, lo que genera armónicos de la frecuencia fundamental; En los diseños de condensadores de silicio, la THD se mantiene por debajo del 2% hasta 147 dB SPL para variantes piezoeléctricas optimizadas.[12][211] La distorsión de intermodulación (IMD) ocurre en escenarios multitono, donde los elementos no lineales producen frecuencias de suma y diferencia, comprometiendo la pureza de la señal; Las pruebas con tonos duales revelan niveles de IMD influenciados por la distensibilidad del diafragma y la tensión del material, que a menudo exceden el THD en señales complejas.[212] Los diseños MEMS avanzados los mitigan mediante ajustes de perforación y rigidez, pero la distorsión residual limita el rendimiento de alto SPL.[210]
El rango dinámico representa el intervalo desde el nivel de ruido propio del micrófono hasta su nivel máximo de presión sonora sin distorsión (Max SPL), normalmente alrededor de 120 dB para los modelos profesionales, lo que permite capturar desde susurros suaves hasta transitorios fuertes sin saturación ni ruido excesivo.[213] El ruido propio, a menudo de 15 a 30 dB SPL con ponderación A, se resta del SPL máximo (p. ej., 130 a 140 dB con 1 % THD) para definir este rango, con una relación señal-ruido (SNR) estandarizada en una entrada de 94 dB SPL, lo que produce valores como 65 a 74 dB para dispositivos MEMS. En micrófonos electretos y de condensador, EIN informa directamente a la SNR a través de EIN = 94 dB SPL - SNR, lo que garantiza un funcionamiento con poco ruido en entornos silenciosos.[214]
Calibración y prueba
La calibración del micrófono verifica la precisión de la sensibilidad y la respuesta de frecuencia utilizando fuentes acústicas estandarizadas para garantizar la trazabilidad con respecto a los estándares primarios. El método pistonphone emplea un pistón mecánico en un acoplador cerrado para generar un nivel de presión sonora estable de 124 dB re. 20 μPa a 250 Hz, lo que proporciona una calibración del campo de presión adecuada para uso en campo y laboratorio con incertidumbres típicamente inferiores a 0,3 dB.[216] Estas calibraciones se pueden rastrear hasta institutos de metrología nacionales como el Instituto Nacional de Estándares y Tecnología (NIST) en los Estados Unidos o el Physikalisch-Technische Bundesanstalt (PTB) en Alemania, que mantienen estándares acústicos primarios mediante técnicas de reciprocidad. Tenga en cuenta que las normas relacionadas para sonómetros, como IEC 61672 (que reemplaza al antiguo IEC 651), incorporan requisitos de rendimiento del micrófono.
La calibración de campo libre simula condiciones de onda plana usando reciprocidad, donde dos micrófonos de condensador idénticos se alternan como fuente de sonido y receptor para calcular la sensibilidad absoluta del circuito abierto sin medir la presión del sonido directamente. Este método, definido en IEC 61094-2, logra incertidumbres de 0,03 a 0,05 dB y es esencial para determinar respuestas direccionales en entornos sin obstáculos.[216][219]
Los entornos de prueba distinguen entre cámaras anecoicas, que minimizan los reflejos para medir la llegada directa del sonido para patrones de directividad, y salas reverberantes, que crean campos difusos para la evaluación de respuestas de incidencia aleatoria. Las mediciones de respuesta al impulso facilitan la evaluación de la directividad mediante la aplicación de ventanas en el dominio del tiempo para aislar la porción temprana de la señal libre de reflejos, lo que permite una caracterización precisa de los patrones polares.[216]
Los estándares internacionales guían estos procedimientos: IEC 60268-4 describe métodos para medir patrones de respuesta direccional, sensibilidad y rango dinámico en micrófonos para sistemas de sonido, mientras que IEC 61094 (anteriormente IEC 1094, relacionado con aspectos del IEC 651 reemplazado para micrófonos sonómetros) especifica requisitos de rendimiento para micrófonos de medición estándar de laboratorio y de trabajo, incluidas calibraciones de campo libre y de campo de presión.[220]
Las herramientas de software respaldan el análisis, con procesamiento rápido de transformada de Fourier (FFT) de excitaciones de ruido senoidal o pseudoaleatorio para derivar curvas de respuesta de frecuencia, a menudo corrigiendo factores ambientales como la temperatura. El método de reciprocidad integra modelos computacionales para producir valores de sensibilidad absolutos en todas las frecuencias.[221][216]
Los micrófonos profesionales requieren recalibración a intervalos de un año para mantener la precisión, lo que tiene en cuenta mecanismos de envejecimiento como la caída de la carga de electretos en cápsulas prepolarizadas, que pueden reducir gradualmente la sensibilidad a pesar de la estabilidad general a largo plazo del orden de cientos de años a temperatura ambiente, con cambios típicamente inferiores a 1 dB durante décadas.[216] Esta práctica garantiza que las métricas de rendimiento, como el nivel de presión sonora (SPL), sigan siendo confiables para aplicaciones críticas, incluidas las actualizaciones en diseños MEMS de bajo ruido a partir de 2025.[216]
Aplicaciones y variantes
Usos en estudio y transmisión
En la producción de audio profesional, los micrófonos de condensador de diafragma grande como el Neumann U 87 Ai son ampliamente considerados como el estándar para capturar voces debido a su reproducción de sonido clara y detallada y sus múltiples patrones polares que permiten la adaptación a diversos escenarios de grabación. El diseño de doble diafragma de este micrófono permite patrones cardioide, omnidireccional y en forma de 8, lo que brinda versatilidad para aislar las voces principales y al mismo tiempo minimizar el ruido ambiental en entornos de estudio.[222] Para la grabación de instrumentos, se prefieren los micrófonos dinámicos como el Shure SM58 por su construcción robusta y su capacidad para manejar altos niveles de presión sonora de fuentes como amplificadores de guitarra o percusión, ofreciendo una claridad de rango medio enfocada sin retroalimentación excesiva.[223]
En entornos de transmisión, los micrófonos de solapa de condensador electret son esenciales para aplicaciones de televisión, donde su tamaño compacto y captación omnidireccional permiten una fijación discreta a la ropa para un diálogo que suene natural durante entrevistas o segmentos de noticias.[224] Para la producción cinematográfica, los micrófonos de cañón montados en postes capturan el diálogo direccional con un alto rechazo del ruido fuera del eje, lo que permite a los operadores colocar el micrófono justo fuera del cuadro mientras siguen los movimientos de los actores.[225] Técnicas como la microfonía cercana mejoran el aislamiento tanto en contextos de estudio como de transmisión al colocar el micrófono a centímetros de la fuente, lo que reduce el sangrado de los sonidos ambientales y permite un control preciso sobre el audio capturado.
Los micrófonos multipatrón respaldan aún más la versatilidad en estos usos profesionales, ya que los ingenieros pueden cambiar patrones (como cardioide para un aislamiento enfocado u omnidireccional para una cobertura más amplia) para adaptarse a estilos vocales específicos o grabaciones de conjunto. El procesamiento posterior a la captura, como el de-essing, soluciona los problemas de sibilancia comunes en las pistas vocales, comprimiendo sonidos fuertes de "s" y "sh" típicamente en el rango de 5 a 10 kHz para lograr una reproducción más fluida. Los desafíos incluyen el manejo de explosivos de consonantes explosivas, que los filtros pop mitigan al difundir ráfagas de aire antes de que lleguen al diafragma, lo que garantiza grabaciones más limpias y sin distorsión. Los sistemas inalámbricos que operan en la banda de 2,4 GHz, popular para la movilidad en las transmisiones, a menudo enfrentan interferencias de radiofrecuencia (RFI) provenientes de Wi-Fi y otros dispositivos, lo que requiere escaneo de frecuencia y receptores diversos para una transmisión confiable.[228]
A partir de 2025, las tendencias en micrófonos de estudio y transmisión enfatizan los diseños híbridos analógico-digitales, como los modelos USB/XLR como el Shure MV7, que facilitan una integración perfecta con plataformas de colaboración remota para equipos de producción distribuidos. Estos híbridos combinan la calidez de la preamplificación analógica con conectividad digital para transmisión de baja latencia, admitiendo sesiones virtuales donde los artistas graban localmente y comparten audio de alta fidelidad en tiempo real.[229] Los patrones polares desempeñan un papel clave en la ubicación del micrófono, guiando las decisiones sobre direccionalidad para optimizar la captura en entornos dinámicos.[223]
Aplicaciones científicas y de medición
Los micrófonos de medición son dispositivos diseñados con precisión y optimizados para una cuantificación precisa del nivel de presión sonora en entornos controlados, con condensadores omnidireccionales de 1/2 pulgada que sirven como estándar para aplicaciones de laboratorio y de campo. Estos micrófonos, como los producidos por Brüel & Kjær, presentan una respuesta de frecuencia plana dentro de ±2 dB en el rango de 6,3 Hz a 20 kHz, lo que permite una captura confiable de señales acústicas de banda ancha sin distorsión o atenuación significativa.[230] Su patrón omnidireccional garantiza una sensibilidad uniforme desde todos los ángulos en condiciones de campo libre, lo que los hace ideales para calibrar fuentes de sonido y validar modelos acústicos en entornos de investigación.
En contextos científicos, los micrófonos especializados amplían las capacidades de medición a entornos extremos. Los hidrófonos, que normalmente emplean transductores piezoeléctricos, están diseñados para análisis acústicos submarinos, convirtiendo ondas de presión en líquidos en señales eléctricas con alta sensibilidad a frecuencias relevantes para la biología marina y la oceanografía.[231] Para el monitoreo atmosférico, los micrófonos infrasónicos, como el Brüel & Kjær Tipo 4193 de 1/2 pulgada, detectan infrasonidos de baja frecuencia por debajo de 20 Hz, como variaciones de presión debido a fenómenos climáticos como tormentas o eventos sísmicos, proporcionando datos para estudios meteorológicos y geofísicos.[232]
Los conjuntos de micrófonos desempeñan un papel crucial en la investigación acústica al facilitar técnicas de formación de haces, en las que se organizan espacialmente múltiples sensores para localizar y caracterizar fuentes de sonido mediante algoritmos de procesamiento de señales que mejoran la direccionalidad y suprimen el ruido.[233] Los métodos de calibración de reciprocidad, que implican el uso mutuo de un micrófono como transmisor y receptor en un acoplador acústico controlado, establecen niveles de sensibilidad absolutos trazables según estándares internacionales, asegurando la trazabilidad de mediciones cuantitativas en escenarios de campo libre o de campo de presión.[219]
El cumplimiento de estándares como la corrección de campo libre tiene en cuenta la influencia del micrófono en el campo sonoro, con el espaciado de los elementos de la matriz generalmente mantenido en un cuarto de longitud de onda (λ/4) en la frecuencia operativa más alta para minimizar los errores de fase y los lóbulos de rejilla durante la formación del haz. Estos principios sustentan las aplicaciones en mapeo de ruido, donde las redes de micrófonos distribuidos generan mapas acústicos espaciales para la planificación urbana y el cumplimiento ambiental, y en el análisis de vibraciones, donde los micrófonos complementan los acelerómetros para evaluar la transmisión del sonido transmitido por estructuras en diagnósticos de ingeniería.[234]
Diseños de consumo y especializados
Los micrófonos de consumo son parte integral de los dispositivos cotidianos, particularmente los teléfonos inteligentes, donde los micrófonos de sistemas microelectromecánicos (MEMS) comúnmente se integran en conjuntos de tres o cuatro unidades para habilitar funciones como la cancelación activa de ruido (ANC) y la formación de haces para una captura de voz más clara durante las llamadas. Estos conjuntos utilizan múltiples sensores MEMS para separar el habla del ruido ambiental, mejorando la relación señal-ruido en entornos ruidosos mediante el procesamiento direccional.[236] En los auriculares diseñados para llamadas de voz, los micrófonos dinámicos como el Shure WH20 ofrecen opciones resistentes y livianas con un ajuste seguro y una captación de voz de alta calidad, aprovechando su capacidad para manejar conversaciones cercanas sin retroalimentación.[237]
Para instrumentos musicales, los micrófonos de condensador con clip ofrecen una captura de sonido natural y compacta para instrumentos de cuerda como violines y guitarras, con modelos de DPA Microphones que presentan alta sensibilidad y bajo ruido propio para una reproducción detallada durante las actuaciones.[238] Los micrófonos dinámicos diseñados para bombos, como el Shure Beta 52A, destacan en escenarios de alto nivel de presión sonora (SPL), a menudo combinados con ecualización (EQ) para enfatizar el golpe de baja frecuencia y al mismo tiempo atenuar resonancias no deseadas.
Los diseños especializados abordan aplicaciones únicas, incluidos micrófonos de contacto que utilizan elementos piezoeléctricos para capturar vibraciones directamente de superficies como vidrio o madera, produciendo tonos distintivos ricos en bajas frecuencias, ideales para música experimental sin interferencias de ruido aéreo.[240] Los micrófonos de solapa, como los de la serie en miniatura de DPA, se enganchan a la ropa para representaciones teatrales, lo que proporciona opciones de sensibilidad flexibles y un funcionamiento discreto con manos libres en entornos escénicos dinámicos.[241] En contextos médicos como la logopedia, los micrófonos de garganta funcionan como sensores de contacto colocados contra la laringe para detectar vibraciones de las cuerdas vocales, lo que ayuda a los pacientes con problemas de articulación al convertir los movimientos sutiles de la garganta en señales audibles.[242]
Los sistemas inalámbricos mejoran la movilidad en usos de consumo y especializados, con configuraciones de frecuencia ultra alta (UHF) como la serie Shure SLX que emplean compresión para ampliar el rango dinámico y minimizar el ruido en la transmisión analógica para un rendimiento confiable en entornos en vivo.[243] Para 2025, el audio Bluetooth Low Energy (LE) se habrá convertido en un estándar en los auriculares inalámbricos, lo que permitirá una integración eficiente del micrófono para audio multitransmisión y una calidad de llamada mejorada con un menor consumo de energía.[244]
Accesorios y mejoras
Parabrisas y protección del medio ambiente
Los protectores contra el viento son accesorios esenciales diseñados para minimizar el ruido de turbulencia inducido por el viento que puede abrumar las señales del micrófono, particularmente en ambientes al aire libre. Los parabrisas de espuma, normalmente hechos de poliuretano de celda abierta, brindan una protección moderada al absorber el movimiento del aire y romper los vórtices turbulentos a través de su estructura porosa, lo que reduce el ruido en aproximadamente 10 a 15 dB en vientos de hasta 5 m/s.[247] Los parabrisas a base de piel, a menudo llamados "deadcats" y construidos con piel sintética sobre espuma, ofrecen un rendimiento mejorado para uso en exteriores, atenuando el ruido de turbulencia entre 20 y 30 dB a velocidades del viento de alrededor de 5 m/s al dispersar aún más el flujo de aire y minimizar la fricción cerca de la cápsula. Estos diseños crean una cámara de aire quieto alrededor del micrófono, evitando que las fluctuaciones de presión lleguen directamente al diafragma.[247]
Los filtros pop, que consisten en pantallas de malla fina colocadas a 5-10 cm de la boca del hablante, abordan principalmente sonidos explosivos como las consonantes "p" y "b", que generan ráfagas de aire transitorias que superan los 100 Pa y pueden causar una distorsión grave.[250] Al desviar y difundir estas ráfagas, los filtros pop mitigan eficazmente los pops sin alterar significativamente la respuesta de frecuencia general, lo que los convierte en estándar para grabaciones vocales en estudios o transmisiones.
Para condiciones más extremas en transmisiones al aire libre, dirigibles o zepelines (cestas montadas en suspensión, a menudo revestidas con espuma y cubiertas de piel) brindan un aislamiento superior, logrando hasta -40 dB de reducción del ruido del viento al encerrar el micrófono en una carcasa aerodinámica más grande que bloquea y disipa los vientos de alta velocidad. Estos sistemas suspenden el micrófono para reducir también las vibraciones de manejo, lo que garantiza una captura de audio limpia durante las tomas móviles.[252]
Las cubiertas para la lluvia, que utilizan revestimientos hidrofóbicos o materiales de silicona flexibles, protegen los micrófonos del ingreso de humedad en condiciones húmedas, canalizando el agua y manteniendo la transparencia acústica.[253] Estas capas protectoras, como guata o chaquetas de silicona, previenen los cortocircuitos y la corrosión sin absorber agua, aunque la exposición prolongada puede requerir secado para evitar la acumulación de resonancia.[248][254]
Si bien son efectivos, estos accesorios introducen compensaciones menores, incluida una ligera atenuación de alta frecuencia de 2 a 5 dB por encima de 5 kHz debido a la absorción del material, que puede atenuar sutilmente el brillo, pero a menudo se puede quitar para aplicaciones en interiores para restaurar la respuesta completa.[248][249] Los micrófonos direccionales exhiben una sensibilidad particular al ruido del viento debido a su diseño acústico, lo que subraya el valor de estas protecciones en el uso en campo de dichos micrófonos.[255]
Matrices y sistemas multimicrófonos
Los conjuntos de micrófonos constan de múltiples micrófonos dispuestos en geometrías específicas para lograr una directividad mejorada, reducción de ruido y captura de audio espacial a través de técnicas de procesamiento de señales. Estos sistemas aprovechan las diferencias de fase de las ondas sonoras entrantes a través de los elementos del conjunto para formar haces que se centran en las fuentes de sonido deseadas y al mismo tiempo suprimen la interferencia de otras direcciones. Al combinar configuraciones de hardware con procesamiento de señales digitales (DSP), los sistemas de múltiples micrófonos permiten aplicaciones que van desde teleconferencias hasta reproducción de audio inmersiva, superando las capacidades de los micrófonos individuales.
Los conjuntos de micrófonos lineales, a menudo dispuestos en línea recta, se utilizan comúnmente para la formación de haces para mejorar la relación señal-ruido y la directividad. En la formación de haces con retardo y suma, las señales de cada micrófono se desplazan en el tiempo mediante retardos τ antes de la suma para alinear las fases desde la dirección objetivo, mejorando la señal deseada y creando nulos en otras direcciones. El retraso para el enésimo micrófono en una matriz lineal uniforme viene dado por τ_n = (n d sen θ) / c, donde d es el espacio entre micrófonos, θ es el ángulo de la fuente de sonido con respecto al eje de la matriz, c es la velocidad del sonido (aproximadamente 343 m/s a 20 °C) y n indexa la posición del micrófono. Esta técnica dirige el haz ajustando los retardos, lo que permite que los nulos se dirijan hacia fuentes de ruido para su supresión.[256]
Los conjuntos de micrófonos circulares y esféricos amplían la formación de haces a una cobertura completa de 360 grados o 3D, especialmente para aplicaciones de audio espacial. En Ambisonics, estos conjuntos capturan campos de sonido utilizando múltiples cápsulas para codificar señales de formato B, que representan componentes omnidireccionales (W) y direccionales (X, Y, Z) del campo de sonido. Las señales de formato B permiten decodificar diseños arbitrarios de altavoces o renderizado de auriculares, lo que permite una reproducción de audio 3D inmersiva. Los conjuntos esféricos, como los que tienen 24 o más micrófonos, admiten Ambisonics de orden superior para una resolución espacial más precisa.
Los sistemas de múltiples micrófonos encuentran un uso generalizado en entornos de conferencias y parlantes inteligentes, donde los conjuntos facilitan una captación clara de la voz en ambientes ruidosos. Las cadenas de micrófonos para conferencias, como las que tienen 8 unidades de micrófono, emplean formación de haces y conexión en cadena para cubrir salas grandes y admiten hasta 18 asistentes con captación de voz de 360 grados. En los parlantes inteligentes, los conjuntos de micrófonos integran cancelación de eco acústico (AEC) para suprimir la salida del altavoz desde las entradas de micrófono, lo que garantiza una comunicación full-duplex para los asistentes de voz. Estos sistemas utilizan DSP para cancelar ecos de forma adaptativa, manteniendo el flujo natural de la conversación.[257]
Encuentra más de "micrófonos", en los siguientes países:
Más allá de la ingeniería de audio, los micrófonos desempeñan funciones fundamentales en las mediciones científicas, como la aeroacústica y el monitoreo del ruido, donde diseños especializados como variantes piezoeléctricas o MEMS (sistemas microelectromecánicos) detectan cambios sutiles de presión con alta precisión.[12] En contextos profesionales y de consumo, los micrófonos inalámbricos, comercializados por primera vez por Shure en 1953, han revolucionado la movilidad en actuaciones y presentaciones al transmitir señales a través de frecuencias de radio.[13] Las innovaciones en curso, incluidas las membranas ultrasensibles basadas en grafeno, continúan mejorando la sensibilidad y reduciendo el tamaño para aplicaciones en audífonos, teléfonos inteligentes y sistemas de vigilancia avanzados.[14]
Historia
Desarrollos tempranos
El fonautógrafo, inventado por el tipógrafo e inventor francés Édouard-Léon Scott de Martinville en 1857, representó el primer dispositivo conocido para capturar sonido, aunque funcionaba mecánicamente en lugar de eléctricamente al visualizar ondas acústicas como rastros gráficos en papel cubierto de hollín usando un diafragma vibratorio y un lápiz óptico. Esta herramienta de grabación no reproducible sentó las bases para la transducción del sonido, pero no permitió la reproducción ni la transmisión eléctrica.[17]
En 1876, Alexander Graham Bell desarrolló un transmisor líquido para sus primeros experimentos telefónicos, donde vibraciones sonoras movían agua acidificada en un recipiente para variar la resistencia eléctrica entre electrodos, lo que marcó un paso inicial hacia la señalización sonora eléctrica. El año siguiente, 1877, se produjo la invención independiente del micrófono de carbono por parte del inventor británico-estadounidense David Edward Hughes, quien demostró un dispositivo que utilizaba contactos de carbono sueltos para modular la corriente eléctrica basándose en las vibraciones del diafragma, mejorando significativamente la sensibilidad del teléfono. Al mismo tiempo, el inventor alemán-estadounidense Emile Berliner patentó un transmisor de carbono de contacto suelto en 1877, empleando una varilla de carbono que variaba la resistencia bajo la presión del diafragma para convertir el sonido en señales eléctricas, lo que se convirtió en parte integral de los primeros sistemas de telefonía.
En 1878, el inventor estadounidense Thomas Edison refinó el micrófono de carbono para uso práctico en teléfonos, incorporando una cámara de gránulos de carbono que comprimía y alteraba la resistencia eléctrica en respuesta a las vibraciones del diafragma, permitiendo una transmisión de voz más clara a distancia. Ese mismo año, Francis Blake presentó el micrófono de botón de carbono, que presentaba un disco de carbono denso presionado contra una punta de platino por el diafragma para lograr una variación de resistencia estable, que Bell Telephone Company adoptó por su confiabilidad en líneas comerciales.
Estos primeros micrófonos basados en carbono, si bien fueron revolucionarios para la telefonía, padecían limitaciones inherentes, incluido un alto ruido inherente debido a la fricción de los gránulos que producía un silbido persistente, baja fidelidad debido a una respuesta de frecuencia restringida que distorsionaba los tonos de audio más altos y susceptibilidad a la humedad que provocaba que las partículas de carbono se agruparan y degradaran el rendimiento.
Innovaciones del siglo XX
El siglo XX marcó una era crucial en la tecnología de los micrófonos, con la transición de diseños rudimentarios basados en carbono a transductores sofisticados de alta fidelidad que permitieron una captura acústica precisa para transmisiones de radio y grabaciones de sonido. A principios de siglo, la invención del micrófono de condensador por Edward C. Wente en los Laboratorios Bell en 1916 revolucionó la transducción de audio mediante el principio de capacitancia variable, donde las ondas sonoras hacen vibrar un diafragma delgado en relación con una placa posterior fija, alterando la capacitancia para generar una señal eléctrica. Este diseño ofrecía una sensibilidad y respuesta de frecuencia superiores en comparación con los micrófonos de carbono, que habían servido como precursores en aplicaciones telefónicas y de grabación temprana.
Basado en principios electromagnéticos, el micrófono dinámico de bobina móvil experimentó un refinamiento práctico en la década de 1920, y su patente fundacional se originó en Ernst Werner von Siemens en 1877, aunque su adopción generalizada siguió a los avances en imanes permanentes y amplificadores. El concepto de Siemens implicaba una bobina unida a un diafragma que se movía dentro de un campo magnético para inducir voltaje, proporcionando durabilidad para uso en vivo y retransmisiones. En la década de 1930, Shure Brothers comercializó modelos robustos como el Modelo 33N, haciendo accesibles micrófonos dinámicos de alta calidad para aplicaciones profesionales.[33][34]
Un salto significativo se produjo con el micrófono de cinta, introducido por Harry F. Olson en RCA en 1931, que presentaba una delgada cinta de aluminio corrugado suspendida en un campo magnético que vibraba para producir una salida sensible a la velocidad con calidez natural y bajo ruido. El RCA PB-31, el primer prototipo de Olson, estableció estándares para patrones bidireccionales y fue fundamental para capturar matices orquestales y vocales. Estas innovaciones impulsaron la adopción de micrófonos en la radiodifusión en la década de 1920, donde los modelos dinámicos y de condensador reemplazaron las bocinas acústicas, permitiendo una transmisión clara del habla y la música desde estudios como los de Westinghouse y NBC.
Los avances posteriores a la Segunda Guerra Mundial mejoraron aún más la versatilidad y el rendimiento. El Neumann U 47, lanzado en 1947, fue el primer micrófono de condensador de patrón conmutable comercialmente exitoso, que permitía seleccionar entre modos cardioide y omnidireccional a través de una cápsula de doble diafragma y amplificación de válvulas, que se convirtió en un elemento básico en los estudios por su respuesta tonal equilibrada. En 1962, James E. West y Gerhard M. Sessler de Bell Laboratories inventaron el micrófono de condensador electret, incorporando un material electret cargado permanentemente en el diafragma para eliminar la necesidad de voltaje de polarización externo, simplificando así el diseño y reduciendo los costos de aplicaciones portátiles y de consumo. La aparición de técnicas de grabación estéreo en la década de 1950, como la configuración Decca Tree que utiliza tres micrófonos omnidireccionales para obtener imágenes espaciosas, integró estos micrófonos de alta fidelidad para capturar paisajes sonoros inmersivos.
Estos desarrollos influyeron profundamente en la grabación de música, particularmente en los géneros de jazz y rock. En el jazz, la microfonía cercana con micrófonos de cinta y de condensador, como se inició en las sesiones de Rudy Van Gelder durante las décadas de 1950 y 1960, permitió una captura íntima de la dinámica de improvisación y las texturas del conjunto, enfatizando matices sutiles en artistas como John Coltrane. Para el rock, los micrófonos dinámicos facilitaron la microfonía agresiva de instrumentos amplificados, permitiendo la energía cruda de los gabinetes de guitarra y la batería en grabaciones multipista desde la década de 1950 en adelante, como lo ejemplifica el papel del Shure SM57 en la captura de fuentes de alto SPL sin distorsión. En general, las innovaciones en micrófonos del siglo XX cambiaron el enfoque hacia la fidelidad con calidad de estudio, transformando la transmisión en un medio de masas y la grabación en una forma artística de precisión sonora.
Avances modernos
La llegada de los micrófonos con sistemas microelectromecánicos (MEMS) marcó un cambio fundamental en la tecnología de los micrófonos a partir de principios de la década de 2000, lo que permitió una miniaturización y una rentabilidad sin precedentes para la electrónica de consumo. Knowles introdujo los primeros micrófonos MEMS comercializados en 2002, con diafragmas basados en silicio que reemplazaron los materiales electretos tradicionales, lo que permitió factores de forma más pequeños y la integración en conjuntos de múltiples micrófonos. Esta innovación facilitó la incorporación de conjuntos de micrófonos diminutos y de bajo costo en teléfonos inteligentes, donde varias unidades podían capturar audio espacial manteniendo una alta sensibilidad y relaciones señal-ruido (SNR) por encima de 60 dB. Al aprovechar los procesos de fabricación de semiconductores, los diseños MEMS redujeron los costos de fabricación hasta en un 50 % en comparación con los micrófonos convencionales, lo que impulsó su adopción generalizada en dispositivos portátiles.[43]
Paralelamente, en la década de 2000 surgió el desarrollo de micrófonos digitales con convertidores analógico-digital (ADC) integrados, que simplificaban el procesamiento de audio mediante la salida de señales digitales directas. Knowles fue pionero en la interfaz de modulación de densidad de pulso (PDM) durante este período, que combinaba el sensor MEMS con un ADC sigma-delta en chip para producir un flujo digital de un solo bit, minimizando las necesidades de circuitos externos y el consumo de energía a menos de 1 mW. Esta integración resultó esencial para aplicaciones con batería limitada, permitiendo una conectividad perfecta en dispositivos como auriculares inalámbricos y relojes inteligentes. En la década de 2010, los micrófonos MEMS proliferaron en los ecosistemas de Internet de las cosas (IoT), con envíos que superaban los 4 mil millones de unidades anuales a mediados de la década, compatibles con sensores habilitados por voz en hogares inteligentes y dispositivos portátiles.[43]
Los avances en los conjuntos de micrófonos avanzaron aún más con técnicas de formación de haces para la captura de voz de campo lejano, particularmente en los asistentes inteligentes lanzados después de 2014. El dispositivo Echo de Amazon utilizó una matriz circular de siete micrófonos que empleaba formación de haces acústicos para centrarse en las voces de los usuarios a una distancia de hasta 3 metros, suprimiendo el ruido y la reverberación a través del procesamiento de señales alineado en fase para mejorar la direccionalidad y ganancias SNR de 10 a 15 dB. Las innovaciones recientes de la década de 2020 han abordado los desafíos de sostenibilidad y autonomía. La investigación sobre micrófonos autoamplificados mediante la recolección de energía acústica, utilizando nanogeneradores piezoeléctricos para convertir ondas sonoras en electricidad, ha dado como resultado prototipos que generan hasta 10 μW/cm², eliminando las baterías para los nodos de IoT de baja potencia.[45] La cancelación de ruido mejorada por IA, como en el modelo MV7+ de Shure con eliminador de ruido DSP en tiempo real, reduce la interferencia ambiental al filtrar de forma adaptativa las señales que no son de voz, logrando una reducción de ruido de hasta 20 dB sin cambios de hardware.[46] Los esfuerzos de fabricación sostenible incluyen membranas libres de PFAS, reemplazando sustancias perfluoroalquiladas y polifluoroalquiladas con alternativas biodegradables para minimizar el impacto ambiental durante la producción.[47]
Principios de funcionamiento
Transducción acústica a eléctrica
Los micrófonos convierten ondas sonoras, que son variaciones de la presión del aire que se propagan a través de un medio, en señales eléctricas mediante un proceso conocido como transducción acústica a eléctrica.[51] Estas ondas de presión, que suelen tener una amplitud de 20 μPa a más de 100 Pa para sonidos audibles, inciden en un diafragma delgado y flexible dentro de la cápsula del micrófono, lo que hace que vibre en sintonía con la energía acústica incidente. El desplazamiento del diafragma es proporcional a la presión del sonido, y la sensibilidad está determinada por las propiedades y el diseño del material, lo que permite capturar frecuencias de aproximadamente 20 Hz a 20 kHz relevantes para la audición humana.[52]
El mecanismo de transducción central se basa en el movimiento mecánico del diafragma para generar una salida eléctrica mediante varios principios físicos, como la inducción electromagnética, la variación de la capacitancia electrostática o los efectos piezoeléctricos. En general, el proceso se desarrolla en etapas secuenciales: la entrada acústica en forma de ondas de presión induce el desplazamiento mecánico del diafragma; este movimiento modula luego un elemento generador asociado para producir una señal eléctrica proporcional; finalmente, la salida de bajo nivel a menudo se amplifica a nivel de línea para uso práctico en sistemas de grabación o transmisión.[51] El nivel de presión sonora (SPL), una medida logarítmica de la intensidad acústica, cuantifica esta entrada mediante la fórmula
donde PPP es la presión sonora cuadrática media en pascales y P0=20 μPaP_0 = 20 \ \mu\text{Pa}P0=20 μPa es la presión de referencia estándar correspondiente al umbral de la audición humana a 1 kHz.[53]
La fidelidad en la transducción, o la precisión de la señal eléctrica al representar el sonido original, está influenciada por las características del diafragma, incluidas su masa y rigidez, que determinan la frecuencia de resonancia del sistema.[54] La frecuencia de resonancia natural fff del diafragma, modelada como un oscilador armónico simple, viene dada por
donde mmm es la masa efectiva del diafragma y kkk es su rigidez.[55] Una masa más baja reduce la inercia para una respuesta más rápida a las altas frecuencias, pero puede aumentar la susceptibilidad al ruido, mientras que la rigidez óptima sintoniza la resonancia por encima del rango audible (normalmente 5 a 10 kHz para diseños de condensadores) para minimizar la coloración y garantizar una respuesta de frecuencia plana. Estos factores en conjunto garantizan altas relaciones señal-ruido y baja distorsión, fundamentales para aplicaciones que van desde la grabación de estudio hasta la medición científica.[51]
Mecanismos físicos clave
Los mecanismos físicos clave que subyacen a la transducción del micrófono convierten las variaciones de presión acústica en señales eléctricas a través de distintos principios, principalmente efectos electromagnéticos, electrostáticos, piezoeléctricos y resistivos. Estos mecanismos explotan el movimiento o la deformación de un diafragma en respuesta a las ondas sonoras, generando cambios eléctricos mensurables que representan la señal de audio.[57]
En la inducción electromagnética, aplicada a ciertos transductores dinámicos, el movimiento del diafragma impulsa una bobina o conductor a través de un campo magnético, induciendo un voltaje de acuerdo con la ley de inducción electromagnética de Faraday. La fuerza electromotriz inducida VVV está dada por
donde NNN es el número de vueltas de la bobina y dΦdt\frac{d\Phi}{dt}dtdΦ es la tasa de cambio del flujo magnético Φ\PhiΦ debido a la velocidad del conductor en el campo.[58] Este voltaje es directamente proporcional a la velocidad del movimiento del diafragma, que se correlaciona con la amplitud y frecuencia de la presión del sonido.[57]
La variación de la capacitancia electrostática forma la base de los transductores de condensador, donde el diafragma y una placa posterior fija forman las placas de un capacitor de placas paralelas. El desplazamiento del diafragma inducido por el sonido altera el espaciado ddd entre placas, cambiando la capacitancia CCC según
con ε\varepsilonε como la permitividad del medio y AAA como el área de la placa.[59] Para una carga constante QQQ en el capacitor, este cambio de capacitancia modula el voltaje V=Q/CV = Q / CV=Q/C, que luego es amortiguado por un convertidor de impedancia para producir la señal de salida.[57]
El efecto piezoeléctrico en los transductores relevantes surge de la generación directa de carga eléctrica en ciertos materiales cristalinos bajo tensión mecánica del diafragma.[60] El voltaje resultante VVV a través del material se expresa como
donde ggg es la constante de voltaje piezoeléctrico, ttt es el espesor del material y σ\sigmaσ es la tensión aplicada.[60] Este voltaje refleja directamente la magnitud de la tensión, lo que permite la conversión de la presión acústica en una salida eléctrica sin requerir un campo magnético externo o capacitancia variable.[60]
La variación resistiva ocurre en transductores a base de carbono, donde la presión del sonido comprime un lecho de gránulos de carbono entre placas conductoras, alterando la resistencia efectiva de la masa de gránulos. La resistencia RRR sigue la relación
con ρ\rhoρ como resistividad, lll como longitud efectiva y AAA como área de la sección transversal; la compresión reduce AAA o lll mientras cambia potencialmente ρ\rhoρ, produciendo un ΔR\Delta RΔR que modula la corriente en un circuito polarizado. Este cambio de resistencia produce una señal eléctrica variable proporcional a las variaciones de presión de la onda sonora.[61]
Componentes
Cápsula y diafragma
La cápsula funciona como la carcasa central del transductor en un micrófono, encierra el diafragma junto con una placa posterior en diseños de condensador y puertos acústicos que permiten que las ondas sonoras interactúen con los componentes internos mientras manejan los diferenciales de presión. Esta estructura sellada o semisellada protege los delicados elementos del interior y da forma al comportamiento acústico general del micrófono al controlar cómo el sonido entra y se propaga en su interior.[54]
En el corazón de la cápsula se encuentra el diafragma, una membrana liviana diseñada para vibrar en respuesta a variaciones de presión acústica, generalmente construida con materiales como Mylar (una película de tereftalato de polietileno orientada biaxialmente), plástico recubierto de oro o papel de aluminio delgado para equilibrar la sensibilidad y la rigidez. Estos diafragmas son extraordinariamente delgados, con espesores que generalmente oscilan entre 2 y 10 micrómetros, lo que permite una alta sensibilidad a presiones sonoras sutiles y al mismo tiempo minimiza los efectos de inercia que podrían distorsionar las frecuencias más altas. Las formas del diafragma se seleccionan en función de las propiedades acústicas deseadas: las formas circulares predominan en las cápsulas omnidireccionales para una respuesta de presión uniforme en todas las direcciones, mientras que los micrófonos de cinta emplean tiras de aluminio alargadas y corrugadas, a menudo descritas como ranuradas o plisadas, para mejorar la flexibilidad y la direccionalidad. Tensar el diafragma es un paso de fabricación crítico, estirándolo para elevar su frecuencia de resonancia más allá del rango audible, asegurando así una respuesta de frecuencia plana y un rendimiento consistente.
El diseño acústico dentro de la cápsula optimiza la captura del sonido a través de elementos estratégicos como puertos para ecualización de presión, que evitan desequilibrios estáticos y actúan como filtros acústicos de paso bajo para atenuar el ruido infrasónico.[71] En algunas configuraciones, los puertos traseros o las cámaras laberínticas facilitan las diferencias de fase para el control direccional, mientras que los materiales de amortiguación, como mallas finas o espumas flexibles, se integran para suprimir resonancias no deseadas y lograr características de amplitud más suaves.[66][54]
La durabilidad de la cápsula y el diafragma depende de una cuidadosa selección de materiales y de ingeniería para resistir tensiones mecánicas y ambientales.[65] La tensión debe controlarse con precisión para evitar estiramientos o desgarros inducidos por la fatiga con el tiempo, particularmente en láminas más delgadas propensas a endurecerse por trabajo.[70] Los diafragmas de polímero como Mylar exhiben vulnerabilidad a la humedad, lo que puede causar hinchazón, alteración de la tensión y cambios de sensibilidad, lo que requiere un almacenamiento protector con desecantes en condiciones de humedad. Las opciones de aluminio ofrecen una mejor resistencia a la corrosión, pero requieren pasivación para mitigar la oxidación.[74] En general, estos factores garantizan una fiabilidad a largo plazo en aplicaciones profesionales.
Electrónica y Vivienda
La electrónica dentro de un micrófono consiste principalmente en preamplificadores y convertidores de impedancia que acondicionan la señal débil generada por el transductor para su transmisión a través de cables. En los micrófonos de condensador, un transistor de efecto de campo (FET) sirve como convertidor de impedancia, transformando la salida de alta impedancia de la cápsula del condensador (generalmente en el rango de megaohmios) en una señal de baja impedancia adecuada para combinar con las entradas del preamplificador, minimizando así la pérdida de señal y el ruido. Esta etapa FET proporciona una alta impedancia de entrada a la cápsula y al mismo tiempo una baja impedancia de salida, a menudo alrededor de 50 a 200 ohmios, lo que garantiza un flujo de corriente eficiente y compatibilidad con líneas de audio profesionales.[77]
Los circuitos de micrófono a menudo incorporan salidas balanceadas por transformador para facilitar largos recorridos de cables sin degradación por interferencias electromagnéticas, ya que el transformador aísla las líneas de señal y mantiene el equilibrio entre los conductores fríos y calientes. La electrónica activa, alimentada a través de esquemas fantasma, como el estándar AES de 48 V CC suministrado a través de líneas balanceadas, permite una amplificación de bajo ruido en modelos de condensador y electret, admitiendo niveles de salida de hasta -10 dBu o más para uso profesional. El conector XLR, según AES14-1992, estandariza el audio balanceado con el pin 1 como tierra/blindaje, el pin 2 como activo (señal positiva) y el pin 3 como frío (señal negativa), rechazando el ruido de modo común en longitudes de cable superiores a 100 metros.[80][81]
Los materiales de la carcasa se seleccionan para equilibrar la durabilidad, el peso y la protección electromagnética; Las carcasas metálicas, como las de zinc o latón fundido, proporcionan un blindaje RF eficaz al atenuar las señales de interferencia por encima de 1 MHz, algo esencial para mantener la integridad de la señal en entornos de radiodifusión.[82] Por el contrario, las carcasas de plástico livianas, a menudo reforzadas con revestimientos conductores, se prefieren para aplicaciones portátiles como micrófonos inalámbricos de mano o de solapa, ya que reducen el peso total a menos de 100 gramos y ofrecen suficiente protección mecánica sin comprometer la movilidad.[83]
Para mitigar el ruido de manipulación, los micrófonos emplean soportes antivibración y suspensiones que utilizan materiales viscoelásticos para el aislamiento, donde las bandas elásticas o las estructuras de lira absorben las vibraciones mecánicas mediante la disipación de energía en polímeros deformables, atenuando el ruido de baja frecuencia hasta entre 20 y 30 dB.[84] Estos sistemas desacoplan el cuerpo del micrófono de los soportes o soportes, evitando que el ruido transmitido por la estructura se transmita a la cápsula durante el funcionamiento o el transporte.[85]
Tipos por principio de transductor
Micrófonos dinámicos
Los micrófonos dinámicos funcionan según el principio de inducción electromagnética, donde las ondas sonoras hacen que un elemento mecánico se mueva dentro de un campo magnético, generando una señal eléctrica.[1]
El tipo más común es el micrófono dinámico de bobina móvil, que presenta un diafragma liviano unido a una bobina móvil suspendida en el espacio de un imán permanente. La presión del sonido hace que el diafragma vibre, moviendo la bobina a través del campo magnético e induciendo un voltaje proporcional a la velocidad del movimiento mediante la ley de Faraday. Este diseño, a menudo alojado en un cuerpo metálico resistente, convierte la energía acústica directamente en salida eléctrica sin requerir energía externa.[87]
Una variante del micrófono dinámico es el tipo de cinta, que utiliza una delgada tira de metal corrugado, típicamente de 2 a 5 micrómetros de espesor, suspendida libremente entre los polos de un imán potente.[88] La cinta actúa como diafragma y conductor, vibrando en respuesta a ondas sonoras para generar voltaje a través de su movimiento en el campo magnético, ofreciendo mayor sensibilidad que los diseños de bobina móvil pero con mayor fragilidad debido al delicado elemento de la cinta.
Los micrófonos dinámicos son apreciados por su durabilidad y capacidad para manejar altos niveles de presión sonora de hasta 150 dB sin distorsión, lo que los hace adecuados para entornos exigentes, aunque exhiben una sensibilidad más baja alrededor de -50 dB re 1 V/Pa en comparación con otros tipos. No requieren alimentación fantasma, lo que mejora la confiabilidad en escenarios en vivo y generalmente brindan una respuesta de frecuencia de 50 Hz a 15 kHz, adecuada para la mayoría de las aplicaciones vocales e instrumentales.
Estos micrófonos se utilizan ampliamente para capturar voces y baterías en presentaciones en vivo y grabaciones de estudio, donde su robustez resiste la microfonía cercana de fuentes ruidosas.[92]
Los micrófonos dinámicos varían en sus mecanismos de respuesta: los modelos tradicionales de bobina móvil a menudo funcionan como micrófonos de presión, sensibles a la presión sonora absoluta, mientras que las variantes de cinta y ciertos diseños de gradiente de presión responden a la diferencia de presión entre la parte delantera y trasera del diafragma, similar a los micrófonos de velocidad. Esta distinción influye en su idoneidad para diferentes escenarios acústicos, con tipos de velocidad como cintas que proporcionan una salida más direccional.
Micrófonos de condensador
Los micrófonos de condensador, también conocidos como micrófonos de condensador o electrostáticos, funcionan a través de una estructura en la que un diafragma liviano sirve como una placa de un capacitor, junto con una placa posterior rígida fija como la otra. El diafragma está cargado eléctricamente y las ondas sonoras incidentes lo hacen vibrar, alterando el espacio entre las placas y modulando así la capacitancia para producir una señal eléctrica de CA representativa de la presión acústica. Este proceso se basa en la física básica de los condensadores de placas paralelas, donde la capacitancia varía inversamente con la separación de las placas.
Los subtipos de micrófonos de condensador se diferencian principalmente en sus mecanismos de polarización para mantener el voltaje necesario en las placas del condensador. Los modelos con polarización CC o condensador verdadero dependen de un voltaje de polarización CC externo, comúnmente proporcionado a través de alimentación fantasma de 48 V, para cargar la cápsula externamente para lograr un control preciso y un alto rendimiento. Las variantes polarizadas por RF utilizan una señal portadora de radiofrecuencia de alta frecuencia superpuesta al audio, que demodula las variaciones de capacitancia para producir una salida de bajo ruido adecuada para aplicaciones especializadas de baja impedancia. Los condensadores electret incorporan una carga electrostática permanente incrustada en un material electret, generalmente una lámina delgada integrada en el diafragma o placa posterior, lo que permite la auto polarización sin energía externa para la cápsula misma.
Estos micrófonos destacan en aplicaciones de alta fidelidad debido a su sensibilidad típica de alrededor de -40 dB re 1 V/Pa, lo que permite capturar detalles finos en señales acústicas. Proporcionan un amplio ancho de banda de frecuencia, que generalmente abarca de 20 Hz a 20 kHz, lo que garantiza una reproducción precisa de todo el espectro audible. El bajo ruido propio inherente, a menudo de 10 a 20 dBA, mejora aún más su idoneidad para grabar fuentes silenciosas con un mínimo de silbido añadido.[98][99][100]
Los micrófonos de condensador de válvula o tubo integran amplificación de tubo de vacío directamente en el cuerpo del micrófono, y normalmente emplean un triodo como el 12AX7 para igualar la impedancia y aumentar la señal. El circuito de válvulas introduce una sutil distorsión armónica y saturación, lo que contribuye a una calidad tonal cálida y eufónica que suaviza los transitorios y enriquece la presencia de rango medio, una característica apreciada en los entornos de estudio antiguos de las décadas de 1940 a 1960.
Los micrófonos de condensador necesitan alimentación externa para polarizar la cápsula y accionar los componentes electrónicos, lo que los distingue de los diseños pasivos. Muestran sensibilidad a la humedad ambiental, donde niveles elevados de humedad pueden condensarse en el diafragma, alterando su tensión o provocando problemas eléctricos que degradan el rendimiento. El manejo del nivel máximo de presión sonora suele ser de 120 a 140 dB SPL, a menudo aumentado con almohadillas de atenuación integradas para evitar la distorsión en escenarios más ruidosos.[95][103][104]
Micrófonos de cinta
Los micrófonos de cinta representan una subcategoría distinta de micrófonos dinámicos, que utilizan una cinta corrugada liviana como elemento transductor principal en lugar de una bobina móvil unida a un diafragma. La cinta, comúnmente construida con una fina lámina de aluminio de aproximadamente 1,5 a 5 micrones de espesor, está suspendida tensa entre los polos de fuertes imanes permanentes, formando un espacio estrecho donde queda expuesta a un campo magnético uniforme.
Las ondas sonoras que golpean la cinta hacen que ésta oscile, generando voltaje a través de inducción electromagnética a medida que el material conductor se mueve perpendicular al flujo magnético; este mecanismo sensible a la velocidad produce una señal de salida directamente proporcional a la velocidad de las partículas del aire en lugar de a la presión, lo que contribuye a su característica respuesta bidireccional. Por naturaleza, esta configuración produce un patrón polar inherente en forma de 8, con igual sensibilidad a los sonidos que llegan desde el frente y desde atrás, rechazando los de los lados.[105]
La masa excepcionalmente baja de la cinta (generalmente de 1 a 2 miligramos) permite una respuesta transitoria superior en comparación con la dinámica de bobina móvil más pesada, lo que permite una captura precisa de cambios rápidos de presión sonora sin manchas inducidas por la inercia.
A finales de la década de 1990 y principios de la década de 2000, fabricantes como Royer Labs fueron pioneros en actualizaciones modernas para superar las limitaciones históricas, incorporando cintas de aluminio más delgadas (como elementos de 2,5 micrones) para una mayor durabilidad y extensión de frecuencia, junto con electrónica activa alimentada por voltaje fantasma para aumentar la salida sin comprometer el núcleo pasivo.[110][111] También se perfeccionaron las rejillas protectoras y los diseños compatibles con el parabrisas para mitigar los daños causados por las ráfagas de aire o la manipulación, ampliando su viabilidad en entornos profesionales.[112][113]
Estos micrófonos ofrecen un perfil sonoro "aterciopelado" característico a través de una suave atenuación de las altas frecuencias por encima de 10-15 kHz, enfatizando la calidez de los medios y el timbre natural que se adapta a la microfonía cercana de metales, cuerdas y amplificadores de guitarra, al tiempo que reduce la aspereza en los transitorios.[105][114] Sin embargo, su baja sensibilidad (a menudo alrededor de -60 dB re 1 V/Pa) exige una preamplificación limpia y de alta ganancia para evitar el ruido, y la fragilidad de la cinta las hace vulnerables al viento, explosivos y golpes mecánicos, lo que puede causar desgarros o cambios de impedancia si se manejan mal.[115][116][117]
Después de perder prominencia a mediados del siglo XX debido a preocupaciones sobre la durabilidad y el surgimiento de alternativas más robustas, los micrófonos de cinta experimentaron un resurgimiento significativo a partir de la década de 1990, impulsados por innovadores boutique como Royer Labs (fundado en 1998) y AEA Ribbons, quienes reintrodujeron modelos hechos a mano con confiabilidad mejorada para conjuntos orquestales, seguimiento vocal y captura de gabinetes de guitarra eléctrica en los estudios.
Micrófonos piezoeléctricos y de carbono
Los micrófonos de carbono funcionan según un principio resistivo en el que las ondas sonoras hacen que un diafragma comprima los gránulos de carbono empaquetados entre dos electrodos, variando la resistencia eléctrica en el circuito y modulando la corriente de una batería o fuente de energía. Este diseño simple los hizo económicos y robustos para los primeros dispositivos de comunicación. Fueron ampliamente utilizados en teléfonos durante la década de 1920, proporcionando niveles de señal suficientes sin amplificación antes de que la tecnología de los tubos de vacío se volviera común. Sin embargo, los micrófonos de carbono sufren un alto ruido eléctrico debido al movimiento de los gránulos y al contacto inconsistente, lo que limita su idoneidad para aplicaciones de alta fidelidad.
La respuesta de frecuencia de los micrófonos de carbono suele ser estrecha, oscilando entre aproximadamente 300 Hz y 3000 Hz, lo que se alinea con las necesidades de telefonía de voz pero excluye las frecuencias graves y agudas. A pesar de estos inconvenientes, sus ventajas incluyen el bajo costo, la ausencia de necesidad de alimentación externa más allá de una simple fuente de CC y la durabilidad mecánica, lo que los hace ideales para un uso resistente y portátil en la telefonía de principios del siglo XX. En los contextos modernos, los micrófonos de carbono se emplean principalmente en la restauración de equipos de audio antiguos, donde los entusiastas recrean su característico sonido ruidoso y de baja fidelidad para grabaciones históricas o efectos novedosos.
Los micrófonos piezoeléctricos, también conocidos como micrófonos de cristal, generan voltaje mediante la deformación de cristales piezoeléctricos, como la sal de Rochelle o el cuarzo, cuando la presión del sonido flexiona un diafragma adjunto. Esta conversión directa de tensión mecánica en carga eléctrica se produce sin bobinas móviles ni energía externa, dependiendo de las propiedades inherentes del material. Son particularmente adecuados para aplicaciones de contacto, donde el micrófono se conecta directamente a una superficie vibrante, como en pastillas de guitarra acústica que capturan resonancias de cuerdas y cuerpo para amplificación.
La carga de salida QQQ en un micrófono piezoeléctrico viene dada por la ecuación
donde ddd es la constante de carga piezoeléctrica (en culombios por newton) y FFF es la fuerza aplicada por la presión acústica. Las ventajas de los micrófonos piezoeléctricos incluyen su funcionamiento pasivo (no requieren baterías ni imanes), tamaño compacto y alta sensibilidad a las vibraciones, lo que los hace resistentes para el uso con instrumentos. Sin embargo, exhiben una respuesta de frecuencia deficiente con picos en resonancias mecánicas, alta impedancia de salida que exige una preamplificación especializada y distorsión a niveles de sonido más altos, lo que los hace inadecuados para grabaciones precisas en estudio.
Tipos de transductores exóticos
Los micrófonos de fibra óptica funcionan modulando la intensidad de la luz mediante la vibración de un diafragma que sirve como superficie reflectante. En estos dispositivos, las ondas sonoras hacen que el diafragma vibre, alterando el acoplamiento de la luz entre las fibras ópticas de entrada y salida, produciendo así una señal de intensidad modulada proporcional a la presión acústica.[119] Los primeros diseños de la década de 1990 utilizaban una membrana reflejada para desviar el haz e influir en el acoplamiento de la guía de ondas, logrando respuestas de frecuencia planas en todo el rango de audio con niveles de presión equivalentes al ruido de alrededor de 38 dB(A). Las aplicaciones contemporáneas aprovechan este principio en entornos inmunes a la interferencia electromagnética (EMI), como los escáneres de imágenes por resonancia magnética (MRI), donde un vibrómetro de fibra óptica detecta vibraciones diminutas (hasta un desplazamiento máximo de 8 pm en frecuencias audibles) midiendo cambios en la intensidad de la luz obstruida por el elemento vibratorio. La separación de la fibra óptica garantiza una inmunidad completa a las interferencias de radiofrecuencia (RFI), lo que hace que estos micrófonos sean ideales para entornos médicos de alto campo.[122]
Los micrófonos basados en láser, a menudo implementados como vibrómetros láser Doppler, permiten la medición sin contacto de las vibraciones del diafragma al detectar el desplazamiento Doppler en la luz láser reflejada. El cambio de frecuencia fdf_dfd se calcula como fd=2vf0cf_d = \frac{2v f_0}{c}fd=c2vf0, donde vvv es la velocidad de la superficie, f0f_0f0 es la frecuencia incidente del láser y ccc es la velocidad de la luz; este cambio surge de la interferencia entre los haces de referencia y el desplazado Doppler.[123] Dichos sistemas caracterizan el rendimiento del micrófono escaneando el diafragma para mapear amplitudes y frecuencias de velocidad, ofreciendo una menor incertidumbre en la calibración de la sensibilidad en comparación con los métodos tradicionales, con resultados repetibles de las regiones centrales del diafragma.[124] Este enfoque no intrusivo se adapta a pruebas acústicas delicadas o remotas y se extiende al análisis de banda ancha desde CC hasta más de 6 GHz con resolución de femtómetro.
Los micrófonos líquidos dependen del desplazamiento de fluidos para transducir la presión acústica en señales eléctricas, particularmente adecuados para entornos de alta presión como aplicaciones submarinas. En estos diseños, el movimiento inducido por el sonido de una varilla o membrana desplaza el líquido conductor, como agua acidulada o mercurio, alterando la resistencia eléctrica o la capacitancia para generar la salida.[125] Las variantes basadas en mercurio brindan una detección sólida para presiones extremas que exceden los 30 000 psi debido a la alta densidad del fluido y su resistencia a la compresibilidad, y encuentran uso en hidrófonos especializados para el monitoreo oceánico donde los diafragmas tradicionales fallarían.
Características direccionales
Fundamentos del patrón polar
La directividad del micrófono surge principalmente de diferencias de fase en las ondas sonoras que llegan a diferentes puntos sobre o dentro de la cápsula del micrófono, lo que genera interferencias constructivas o destructivas que varían con el ángulo de incidencia. En los micrófonos omnidireccionales, la cápsula es pequeña en relación con la longitud de onda del sonido, lo que da como resultado una presión casi uniforme a través del diafragma y ninguna variación de fase significativa, lo que produce la misma sensibilidad desde todas las direcciones. Los patrones direccionales surgen cuando se explotan estas diferencias de fase, ya sea a través del diseño inherente del micrófono o combinando respuestas de múltiples elementos sensores.[133]
Los gráficos polares ilustran la sensibilidad del micrófono en función del ángulo θ con respecto al eje principal, normalmente en decibelios (dB) en un gráfico circular que abarca 360 grados. Un patrón omnidireccional aparece como un círculo con una variación de 0 dB en todo θ, lo que indica una respuesta isotrópica. Por el contrario, los patrones direccionales muestran lóbulos y nulos; por ejemplo, un patrón en forma de ocho tiene una sensibilidad máxima en θ = 0° y 180° (delantera y trasera) con una sensibilidad nula en θ = 90° (laterales). Estos gráficos dependen de la frecuencia y a menudo se muestran en frecuencias medias, como 1 kHz, para estandarización.[133][134]
Los micrófonos de presión, como los típicos de condensador o dinámicos con un diafragma de un solo lado, responden a la presión sonora escalar P, que no tiene direccionalidad inherente y, por lo tanto, produce un patrón omnidireccional. Los micrófonos de gradiente de presión o velocidad, como los diseños de cinta, detectan la velocidad de las partículas o el gradiente espacial de presión (∂P/∂x), que para una onda plana es proporcional a P cos θ, introduciendo direccionalidad ya que el gradiente apunta a lo largo de la dirección de propagación. El patrón en forma de ocho de un micrófono con gradiente de presión puro refleja esta dependencia del coseno, con una sensibilidad que cae a cero en θ = 90°.[133]
Un patrón cardioide, común en muchos micrófonos prácticos, resulta de la combinación de respuestas omnidireccionales (presión) y bidireccionales (gradiente), a menudo con cancelación frontal-posterior para rechazar el sonido incidente desde atrás. La respuesta normalizada para un cardioide ideal de baja frecuencia viene dada por:
Esta ecuación produce una sensibilidad máxima (2) en θ = 0° y una nula (0) en θ = 180°, creando un gráfico polar en forma de corazón. La combinación logra esto agregando la señal omni a la señal de gradiente, donde el término cos θ del gradiente refuerza el frente mientras cancela la parte trasera.
Los factores clave que influyen en estos patrones incluyen la relación entre la longitud de onda del sonido λ y el espacio o tamaño de las cápsulas. Para un comportamiento omnidireccional, λ debe exceder con creces el espaciado (normalmente λ > 10 × espaciado), lo que garantiza diferencias de fase insignificantes en toda la cápsula; a frecuencias más altas donde λ se acerca al diámetro de la cápsula (por ejemplo, las cápsulas de >1 pulgada se distorsionan por encima de ~15 kHz), incluso los micrófonos de presión exhiben una mayor directividad debido al sombreado y la difracción. Esta dependencia de la longitud de onda limita la uniformidad del patrón en todo el espectro de audio, lo que requiere cápsulas pequeñas para la omnidireccionalidad de banda ancha.[133]
Patrones omnidireccionales
Los micrófonos omnidireccionales, también conocidos como micrófonos de presión, cuentan con un único diafragma expuesto en un lado a las ondas sonoras entrantes, mientras que la parte posterior está encerrada en una cámara sellada, lo que permite que el dispositivo responda igualmente a la presión del sonido desde todas las direcciones sin efectos de cancelación de fase.[135] Un pequeño respiradero en la carcasa asegura la ecualización de la presión entre la cámara interna y el ambiente externo, evitando desequilibrios de presión estática que podrían desplazar el diafragma y distorsionar las mediciones.[136] Este diseño contrasta con los patrones unidireccionales, que se basan en diferencias de fase entre las llegadas del sonido frontal y posterior para lograr direccionalidad.[86]
Estos micrófonos destacan por capturar el ambiente natural y proporcionan un amplio punto óptimo debido a su sensibilidad uniforme, lo que da como resultado respuestas de frecuencia fuera del eje más suaves y menos coloración de los reflejos de la sala en comparación con los tipos direccionales.[86] Sin embargo, su falta de direccionalidad los hace muy sensibles a la reverberación ambiental no deseada y a fuentes de ruido externas, lo que limita su uso en entornos reverberantes o ruidosos.[86]
Los ejemplos incluyen micrófonos de medición como el DPA 4006, que mantienen una respuesta de frecuencia plana de 10 Hz a 20 kHz, lo que los hace adecuados como estándares omnidireccionales operados por presión para calibración acústica.[137] Las limitaciones clave incluyen la ausencia del efecto de proximidad, que impide el refuerzo de graves de fuentes cercanas, y una mayor vulnerabilidad al ruido del viento; Los parabrisas son esenciales y ofrecen una atenuación de más de 20 dB a velocidades del viento de 10 m/s.[86][9][138]
En aplicaciones como estándares de calibración y grabación de campo ambiental, los micrófonos omnidireccionales brindan captura de sonido espacial integral sin polarización direccional, ideal para audio inmersivo o pruebas acústicas donde se requiere una detección de presión uniforme.[139][140]
Patrones unidireccionales
Los patrones de micrófono unidireccionales priorizan la sensibilidad a las fuentes de sonido desde el frente mientras rechazan las señales de los lados y la parte trasera, lo que los hace esenciales para aislar a intérpretes o instrumentos en entornos con ruido ambiental o riesgos de retroalimentación. El patrón cardioide, el tipo unidireccional más común, presenta un único lóbulo frontal con forma de corazón invertido, logrado a través de un puerto trasero que introduce un retraso de fase en el sonido que llega desde detrás del diafragma. Este retraso causa interferencia destructiva para las señales traseras, lo que resulta en una respuesta polar descrita por la fórmula 1+cosθ2\frac{1 + \cos \theta}{2}21+cosθ, donde θ\thetaθ es el ángulo de incidencia relativo al eje frontal del micrófono; en θ=0∘\theta = 0^\circθ=0∘, la sensibilidad es máxima (1), cayendo a 0,5 (6 dB hacia abajo) en θ=90∘\theta = 90^\circθ=90∘ y nula en θ=180∘\theta = 180^\circθ=180∘.[61]
Los patrones hipercardioide y supercardioide son variantes del cardioide, que ofrecen lóbulos frontales más estrechos para una mayor directividad al tiempo que introducen un pequeño lóbulo trasero que capta algo de sonido desde atrás. El hipercardioide tiene el ángulo de aceptación más estrecho, aproximadamente 105° para una caída de 3 dB, lo que proporciona nulos más profundos en los lados pero con una sensibilidad trasera que alcanza un máximo de alrededor de 110° fuera del eje, lo que exige una orientación precisa para evitar la retroalimentación.[141] Por el contrario, el supercardioide mantiene un ángulo de aceptación de aproximadamente 115°, con su rechazo más profundo a 125° fuera del eje y menos captación trasera que el hipercardioide, equilibrando el aislamiento y la facilidad de uso en entornos en vivo.[141] Estos patrones mejoran el rechazo fuera del eje en comparación con la línea de base omnidireccional, y generalmente atenuan las señales en 6 dB o más a 90°, aunque el rendimiento varía con la frecuencia debido a la ampliación del patrón en frecuencias más bajas.
El subcardioide, también conocido como cardioide ancho, ensancha el lóbulo frontal más allá del cardioide estándar para capturar más sonido ambiental manteniendo algo de rechazo trasero, ubicándolo entre patrones cardioide y omnidireccional para aplicaciones que necesitan un tono ambiental natural. Su ángulo de aceptación excede el del cardioide, acercándose a menudo a 130° o más para una caída de 3 dB, lo que lo hace adecuado para conjuntos acústicos donde no es necesario un aislamiento total.[143] Todos los patrones unidireccionales se realizan a través de laberintos acústicos: cámaras internas con puertos y deflectores que imponen cambios de fase en el sonido del incidente posterior, combinando respuestas de presión (omnidireccional) y gradiente de presión (figura de ocho) en proporciones variables.
Una ventaja clave de los patrones unidireccionales es su rechazo fuera del eje, lo que minimiza el sangrado de fuentes cercanas; por ejemplo, los micrófonos cardioides suelen presentar una atenuación de aproximadamente 6 dB a 90° fuera del eje, lo que mejora la ganancia antes de la retroalimentación en el uso en el escenario.[142] Sin embargo, introducen un efecto de proximidad, un refuerzo de baja frecuencia que se intensifica a medida que la fuente se acerca a 0,6 m (2 pies), lo que mejora la calidez de los graves para las voces con micrófono cercano, pero requiere control de la distancia para evitar la confusión.[87] En los micrófonos de múltiples patrones, como los condensadores de doble diafragma, los interruptores permiten la selección entre variantes unidireccionales como cardioide, supercardioide, hipercardioide y subcardioide, lo que permite ajustes sobre la marcha para diversas necesidades de aislamiento sin cambiar el equipo.[145]
Patrones bidireccionales y especializados
Los micrófonos bidireccionales, también conocidos como figura de 8 o patrones bidireccionales, exhiben la misma sensibilidad al sonido que llega desde el frente y desde atrás mientras anulan las señales de los lados a 90 grados. Este patrón surge de un principio de gradiente de velocidad, donde el micrófono responde a la diferencia en la velocidad de las partículas de aire entre dos puntos, generalmente implementado en diseños de cinta o condensador con puertos frontales y traseros.
En la grabación estéreo, el patrón en forma de 8 es esencial para técnicas como el estéreo Blumlein, que emplea dos micrófonos orientados a 90 grados para capturar un escenario sonoro natural e inmersivo con posiciones coincidentes. De manera similar, en el estéreo medio (MS), un micrófono en forma de 8 sirve como canal "lateral", orientado perpendicular a un micrófono "medio" orientado hacia adelante, lo que permite el ajuste de posproducción del ancho estéreo mientras se mantiene la compatibilidad mono al derivar la imagen central únicamente de la señal media. Estas aplicaciones aprovechan los lóbulos duales simétricos del patrón para lograr precisión espacial, aunque requieren una ubicación cuidadosa para evitar problemas de fase debido a reflexiones de la sala fuera del eje.[146][147]
Los micrófonos de superficie producen un patrón polar hemisférico cuando se montan sobre una superficie plana, duplicando efectivamente la presión del sonido a través del principio de imagen, donde los reflejos del límite refuerzan el sonido directo, produciendo una ganancia de sensibilidad de 6 dB. Este diseño minimiza los artefactos de filtrado de peine provenientes de los reflejos de la superficie, brindando una cobertura uniforme sobre una media esfera sobre el plano de montaje, ideal para capturar múltiples hablantes sin apuntar discretamente. En entornos de conferencias, los micrófonos de superficie ofrecen ventajas como una instalación de perfil bajo para una estética discreta y una amplia captación hemisférica para cubrir las discusiones en la mesa, aunque pueden capturar inadvertidamente ruidos de manipulación o vibraciones de la superficie y pueden quedar ocultos por los documentos.[148]
Los micrófonos de cañón extienden los patrones hipercardioides utilizando un tubo de interferencia (un cilindro ranurado delante de la cápsula) que retrasa las ondas sonoras fuera del eje, provocando interferencias destructivas y directividad lobulada para una captura enfocada en el eje. Esto da como resultado un rechazo sustancial fuera del eje, que a menudo excede los 20 dB en ángulos de alrededor de 125 grados, lo que mejora el aislamiento en la producción o transmisión de video y al mismo tiempo reduce el ángulo de aceptación en frecuencias más altas. La longitud del tubo influye en el ancho de banda de rechazo, y los diseños más largos proporcionan nulos más profundos pero una mayor susceptibilidad al ruido del viento.
Diseño y Construcción
Geometría y directividad de la cápsula
La geometría de una cápsula de micrófono influye significativamente en su directividad inherente al interactuar con las ondas sonoras entrantes a través de gradientes de difracción y presión, independientemente del procesamiento electrónico o modificaciones acústicas externas. Las cápsulas esféricas son particularmente efectivas para patrones omnidireccionales, ya que su forma simétrica minimiza los artefactos de difracción y mantiene una respuesta polar amplia en todas las frecuencias. En tales diseños, la carcasa esférica alrededor de un pequeño transductor de presión da como resultado una acumulación suave de presión en la superficie de la cápsula, comenzando por encima de aproximadamente 1 kHz, lo que mejora la respuesta de alta frecuencia sin introducir picos o caídas pronunciados que se ven comúnmente en formas menos simétricas. Esta geometría produce un suave aumento de hasta +6 dB en la respuesta de campo libre con una incidencia de 0° y admite un amplio ángulo de aceptación, lo que la hace ideal para capturar campos sonoros difusos con reverberación natural.[152]
Por el contrario, las geometrías de cápsulas cilíndricas se aproximan al comportamiento de la fuente de línea, promoviendo una mayor directividad a lo largo del eje perpendicular a la longitud del cilindro, lo cual es útil para aplicaciones que requieren captación enfocada de fuentes extendidas como cuerdas o líneas ambientales. La forma alargada crea una distribución de presión asimétrica, con una sensibilidad reducida en los lados debido a la interferencia de fase de la superficie curva, lo que mejora la directividad axial en frecuencias medias a altas en comparación con las formas esféricas. Sin embargo, esto puede introducir variaciones más pronunciadas dependientes de la frecuencia, como aumentos elevados de la respuesta de hasta 10 dB en ciertas direcciones, lo que requiere un diseño cuidadoso para equilibrar la uniformidad.
El tamaño del diafragma en relación con la longitud de onda del sonido juega un papel fundamental a la hora de determinar el rango de frecuencia en el que un patrón omnidireccional sigue siendo eficaz. Un diafragma más grande, como uno con un diámetro de 1 cm, mantiene la omnidireccionalidad en frecuencias más bajas (por ejemplo, por debajo de 500 Hz) porque la longitud de onda es mucho más larga que el tamaño del diafragma, lo que resulta en una presión uniforme en toda la superficie (ka << 1, donde k = 2π/λ). Sin embargo, a frecuencias más altas, el mismo tamaño conduce a una mayor directividad debido al sombreado acústico y la difracción de los bordes, donde las ondas fuera del eje interfieren destructivamente en los bordes. Los diafragmas más pequeños (por ejemplo, de menos de 0,5 cm) amplían el rango omnidireccional a frecuencias más altas manteniendo ka pequeño por más tiempo, reduciendo la aparición de direccionalidad y proporcionando una respuesta fuera del eje más plana hasta 10-15 kHz.[71]
La sombra acústica de los bordes de la cápsula contribuye aún más a la directividad de alta frecuencia a través de efectos de difracción, donde las ondas sonoras que se curvan alrededor del límite crean gradientes de presión. Este fenómeno se cuantifica mediante el índice de directividad DI ≈ 10 \log_{10} \left(1 + \frac{(ka)^2}{2}\right), donde k = 2\pi / \lambda es el número de onda, a es el radio efectivo y la aproximación es válida para valores ka moderados típicos de las cápsulas de micrófono. Para una cápsula de 1 cm de diámetro (a ≈ 0,5 cm), surge una directividad significativa (p. ej., ganancia de 3 a 6 dB en el eje) por encima de 5 a 10 kHz, ya que las ondas traseras y laterales quedan ensombrecidas, lo que mejora la sensibilidad hacia adelante y al mismo tiempo estrecha el patrón polar.
Los diseños de cápsulas múltiples que emplean una ubicación coincidente (donde los diafragmas están alineados en el mismo centro acústico) permiten patrones de directividad versátiles sin introducir problemas de fase espacial debido a la separación. Al combinar señales de dos o más cápsulas estrechamente espaciadas (por ejemplo, una omnidireccional y otra bidireccional), se pueden sintetizar patrones como el cardioide mediante una simple suma o resta, preservando la coherencia en todo el espectro. Este enfoque evita los artefactos de filtrado en peine de las matrices espaciadas y permite una conmutación perfecta entre lóbulos omnidireccionales, en forma de 8 e intermedios en una sola carcasa.[153]
La elección de los materiales y el espesor del diafragma afecta la preservación de la directividad al minimizar los efectos de carga de masa que podrían alterar la conformidad acústica. Los diafragmas delgados (1-10 μm), a menudo fabricados con materiales livianos como Mylar o polímeros pulverizados con oro, reducen la masa inercial, elevando la frecuencia de resonancia por encima del rango audible (generalmente >20 kHz) y asegurando una respuesta uniforme sin filtrado de paso bajo debido a la masa agregada. Esto preserva la directividad deseada en altas frecuencias al evitar distorsiones inducidas por resonancia que podrían ampliar o irregularizar el patrón polar.[154]
Tubos de fase e interferencia
Los tubos de interferencia, comúnmente empleados en micrófonos de cañón, consisten en una estructura cilíndrica ranurada colocada frente a una cápsula transductora direccional para lograr una mayor directividad a través de la interferencia de ondas acústicas. Las ondas sonoras en el eje se propagan sin obstáculos a lo largo del eje central del tubo para llegar a la cápsula, mientras que las ondas fuera del eje ingresan lateralmente a través de ranuras espaciadas con precisión, lo que incurre en un retraso en la longitud del camino que induce interferencia destructiva y atenúa su amplitud tras la recombinación en la cápsula. La longitud del tubo está diseñada para corresponder a la mitad de la longitud de onda (λ/2\lambda/2λ/2) de las frecuencias operativas previstas, optimizando la cancelación de esas bandas y formando así un patrón polar lobulado con sensibilidad directa mejorada.[156]
Los tapones de fase sirven como barreras porosas o perforadas integradas en los puertos posteriores de las cápsulas de micrófono cardioide, lo que facilita un retraso acústico deliberado para el sonido que ingresa desde la parte posterior. Este retraso genera un cambio de fase dependiente de la frecuencia, expresado como Δϕ=2πfΔt\Delta \phi = 2\pi f \Delta tΔϕ=2πfΔt, donde fff denota frecuencia y Δt\Delta tΔt el retraso de tiempo, lo que permite una interferencia destructiva que suprime el sonido trasero y preserva la respuesta frontal. El material y la porosidad del tapón están calibrados para garantizar que la inversión de fase se aproxime a 180 grados en todo el ancho de banda deseado, lo que contribuye al característico patrón polar en forma de corazón.[159]
Las rejillas y ranuras incorporadas en los tubos de interferencia y las estructuras de fase atenúan inherentemente las frecuencias más altas a través de mecanismos como el arrastre viscoso dentro de aberturas estrechas y la difracción en los bordes, que en conjunto dan forma a la respuesta de frecuencia general. Las configuraciones de múltiples ranuras, con diferentes anchos y espacios, extienden esta atenuación de banda ancha para mitigar el énfasis excesivo de las altas frecuencias, promoviendo una directividad más equilibrada en todo el espectro de audio.
A pesar de su eficacia, los tubos de fase e interferencia exhiben limitaciones arraigadas en sus principios acústicos, incluido el lóbulo dependiente de la frecuencia donde la sensibilidad en el eje exhibe picos en los armónicos de la frecuencia de diseño primaria debido al refuerzo constructivo. Además, la geometría alargada y ranurada hace que estos diseños sean vulnerables a la turbulencia del viento, lo que genera fluctuaciones erráticas de presión y amplifica el ruido en ambientes exteriores. Estas limitaciones a menudo requieren parabrisas suplementarios o una colocación cuidadosa para mantener la integridad del rendimiento.[163]
Configuraciones de límites y estéreo
Los micrófonos de superficie, también conocidos como micrófonos de zona de presión (PZM), utilizan un diseño en el que la cápsula se coloca extremadamente cerca de una superficie plana y reflectante, como una mesa o pared, creando una zona de presión que alinea en fase las ondas sonoras directas y reflejadas. Este efecto de límite duplica el nivel de presión sonora, proporcionando una ganancia de sensibilidad de 6 dB y produciendo un patrón de captación hemisférico con respuesta uniforme en el medio espacio superior.[164][165] La configuración minimiza la interferencia de fase y el filtrado de peine, lo que garantiza una cobertura uniforme en un área amplia, lo que hace que los micrófonos de superficie sean especialmente adecuados para salas de conferencias y reuniones donde la colocación discreta y de bajo perfil en superficies es esencial para capturar a varios participantes sin distracciones visuales.[166][167]
Las configuraciones de micrófonos estéreo emplean pares de micrófonos para replicar señales de audio espaciales, mejorando la inmersión al capturar la amplitud, la profundidad y el ambiente. La técnica XY utiliza dos micrófonos cardioides coincidentes en un ángulo de 90 grados (normalmente ±45 grados desde el centro), con cápsulas colocadas lo más cerca posible para evitar diferencias horarias y garantizar la compatibilidad mono. Esta configuración ofrece una imagen estéreo estable y enfocada con buena resolución frontal y problemas de fase reducidos.[168] La técnica ORTF, desarrollada por la organización de radiodifusión francesa, coloca dos micrófonos cardioides a 17 cm de distancia en un ángulo de 110 grados, simulando el tiempo interaural humano y las diferencias de nivel para una difusión estéreo amplia y natural que equilibra el sonido directo y la reverberación.[168] Los pares omnidireccionales espaciados, a menudo separados por 20 a 60 cm o más dependiendo de la distancia de la fuente, enfatizan el ambiente y la respuesta de baja frecuencia a través de retrasos de tiempo intencionales, creando un sonido espacioso y envolvente ideal para grabaciones orquestales o ambientales, aunque pueden introducir un "agujero" central en la imagen si el espacio es excesivo.[169]
El par Blumlein, una técnica coincidente que utiliza dos micrófonos en forma de ocho cruzados a 90 grados, captura la sensibilidad bidireccional para producir un escenario sonoro horizontal realista con excelente localización y captación del ambiente trasero. Esta configuración es matemáticamente equivalente a una matriz de lado medio (M/S) donde el "medio" se deriva de los lóbulos delanteros y el "lado" de las diferentes respuestas laterales; la decodificación produce los canales izquierdo (L) y derecho (R) mediante las fórmulas:
donde M es la señal media y S es la señal lateral, lo que a menudo requiere un ajuste de 3 dB hacia el lado para igualar el nivel.[170][171] Estos métodos estéreo proporcionan audio inmersivo al preservar las relaciones espaciales, con aplicaciones en la producción y transmisión de música para una reproducción realista.[140]
Alimentación e Interfaces
Métodos de suministro de energía
Los micrófonos, particularmente los de condensador y electreto, requieren energía externa para operar sus componentes activos, como polarizar el diafragma o alimentar amplificadores internos. Esta alimentación se suministra a través de varios métodos según el diseño y la aplicación del micrófono, lo que garantiza la compatibilidad con sistemas de audio profesionales y minimiza la interferencia con la señal de audio.
El método más común es la alimentación fantasma, estandarizada según IEC 61938, que entrega +48 V CC a través de un cable XLR balanceado en los pines 2 y 3 con respecto a tierra (pin 1), con una corriente máxima de 10 mA por micrófono para soportar cápsulas de condensador. Este voltaje se aplica por igual a ambas líneas de audio a través de resistencias adaptadas, generalmente de 6,81 kΩ, lo que permite que la potencia sea "invisible" para las señales de audio balanceadas y, al mismo tiempo, proporciona un funcionamiento estable para los micrófonos de condensador profesionales.[175]
Una alternativa más antigua, T-power (también conocida como alimentación A-B o Tonaderspeisung), suministra 12 V CC directamente entre las líneas de audio (pines 2 y 3) sin una referencia a tierra, y se originó como un estándar europeo según DIN 45595 para la alimentación remota de micrófonos de condensador en entornos de transmisión. Aunque en gran medida está obsoleto debido a la incompatibilidad con los sistemas de alimentación fantasma, persiste en algunos equipos de grabación de películas y locaciones donde se necesita compatibilidad heredada.[177]
Para los micrófonos de condensador electret, que utilizan un material cargado permanentemente, la potencia de polarización proporciona un voltaje más bajo de 1,5 a 10 V CC, a menudo mediante alimentación enchufable en conectores de 3,5 mm, con valores comunes como 2,5 V en aplicaciones de cámaras o grabadoras portátiles para energizar el amplificador JFET.[178] Este método es adecuado para dispositivos compactos de bajo consumo en los que la potencia fantasma total sería excesiva.
Los micrófonos inalámbricos y autoamplificados suelen depender de baterías internas, como pilas AA o de iones de litio recargables, para accionar transmisores y cápsulas independientemente de los suministros por cable, lo que ofrece movilidad en transmisiones y sonido en vivo. Algunos micrófonos USB digitales consumen 5 V de la alimentación del bus USB del dispositivo host, integrando amplificación y conversión en un formato plug-and-play para grabación por computadora.[179] Los diseños emergentes incorporan inducción de RF para la carga inalámbrica, ampliando el tiempo de funcionamiento sin cambios frecuentes de batería.[180]
Las características de seguridad, incluidas las resistencias limitadoras de corriente en las fuentes de alimentación (por ejemplo, 6,81 kΩ en sistemas fantasma), evitan daños por cortocircuitos o conexiones inadecuadas al restringir el flujo de corriente a niveles seguros, protegiendo tanto los micrófonos como los equipos conectados.
Consideraciones analógicas y de impedancia
Los micrófonos suelen diseñarse con una impedancia de salida baja, conocida como Z baja, que oscila entre 150 y 600 ohmios, lo que facilita largos recorridos de cable y reduce la susceptibilidad a las interferencias electromagnéticas.[181] Por el contrario, los micrófonos de alta Z, con impedancias superiores a 10 kΩ, se utilizan a menudo para conexiones directas de instrumentos, como guitarras, pero son más propensos a captar ruido a distancia.[181] Para minimizar la pérdida de señal en estas configuraciones, se emplea una configuración de puente donde la impedancia de entrada del preamplificador o mezclador es al menos 10 veces mayor que la impedancia de salida del micrófono, lo que garantiza que se transfiera más del 90% del voltaje.[182]
Las conexiones analógicas balanceadas son estándar para que los micrófonos profesionales rechacen el ruido de modo común, como el zumbido de las líneas eléctricas, a través de señalización diferencial. En este método, la señal de audio se envía por dos conductores con polaridad opuesta, y el dispositivo receptor resta uno del otro, cancelando el ruido que afecta a ambas líneas por igual preservando la señal deseada.[183] Los conectores XLR se utilizan predominantemente para líneas balanceadas de micrófono debido a su diseño de tres pines (caliente, frío y tierra) y su construcción robusta, mientras que los conectores TRS (punta-anillo-manga) de 1/4 de pulgada sirven propósitos similares para tramos más cortos o entradas de instrumentos.
Los efectos de carga ocurren cuando la impedancia de entrada del dispositivo receptor interactúa con la impedancia de salida del micrófono, lo que puede causar una caída de voltaje según el principio del divisor de voltaje:
donde VoutV_{\text{out}}Vout es el voltaje de salida, VmicV_{\text{mic}}Vmic es el voltaje de circuito abierto del micrófono, ZinZ_{\text{in}}Zin es la impedancia de entrada y ZmicZ_{\text{mic}}Zmic es la impedancia de salida del micrófono.[184] Esta caída se vuelve significativa si no se mantiene la relación de puenteo, lo que reduce el nivel de la señal y altera potencialmente la respuesta de frecuencia.
La capacitancia del cable introduce una caída de alta frecuencia en las señales de micrófonos analógicos, actuando como un filtro de paso bajo con una frecuencia de corte dada por:
fc=12πRCf_c = \frac{1}{2\pi R C}fc=2πRC1
donde RRR es la impedancia efectiva de la fuente (normalmente la impedancia de salida del micrófono o del transformador) y CCC es la capacitancia del cable por unidad de longitud, a menudo alrededor de 100 pF/m para cables de micrófono estándar.[185] Los cables más largos exacerban este efecto, atenuando la respuesta de los agudos, particularmente con fuentes de alta impedancia.
Estándares de conectividad digital
Los estándares de conectividad digital para micrófonos permiten la transmisión directa de datos de audio en formatos digitales, minimizando las pérdidas de conversión de analógico a digital y facilitando la integración con redes y sistemas integrados modernos. Estos estándares admiten funcionamiento de bajo consumo, inmunidad al ruido y escalabilidad para aplicaciones que van desde dispositivos de consumo hasta configuraciones de audio profesionales. A diferencia de las interfaces analógicas heredadas, que dependen de señales de voltaje propensas a sufrir interferencias, los estándares digitales utilizan flujos de bits o datos en paquetes para lograr un rendimiento sólido.[187]
La modulación de densidad de pulso (PDM) es una interfaz serial de 1 bit ampliamente adoptada y utilizada principalmente en micrófonos de sistemas microelectromecánicos (MEMS), donde el audio se codifica como un flujo de pulsos de alta frecuencia que representa la densidad de la señal. Este formato permite un consumo de energía ultrabajo, a menudo inferior a 1 mW, lo que lo hace ideal para dispositivos que funcionan con baterías, como teléfonos inteligentes y dispositivos portátiles. Las salidas PDM normalmente se convierten a formatos multibit, como I²S, para su posterior procesamiento, lo que proporciona un rechazo de ruido inherente debido a la naturaleza digital de la cadena de señal.[188]
La multiplexación por división de tiempo (TDM) permite configuraciones eficientes de múltiples micrófonos al asignar intervalos de tiempo para datos de múltiples dispositivos a través de un bus compartido, lo que admite la conexión en cadena en conjuntos de micrófonos sin cableado complejo. La especificación MIPI SoundWire ejemplifica este enfoque, utilizando una interfaz de dos cables para transportar datos PCM y PDM a través de hasta 11 dispositivos esclavos, con un bajo número de puertas y una eficiencia energética adecuada para aplicaciones móviles y de IoT. A partir de 2025, SoundWire versión 1.3 mejora la integración de la topología y la optimización del reloj para mejorar el manejo de audio multicanal en sistemas integrados.
La conectividad USB para micrófonos digitales aprovecha la especificación USB Audio Class 2.0 (UAC 2.0), que garantiza un funcionamiento compatible con su clase en todos los dispositivos y admite frecuencias de muestreo de hasta 192 kHz a una profundidad de 24 bits a través de enlaces USB 2.0 de alta velocidad. Esto permite la integración plug-and-play con computadoras y tabletas, entregando audio de alta resolución sin controladores personalizados. Para entornos de red, Dante (Audio sobre IP) proporciona un protocolo AoIP escalable para micrófonos, que permite la transmisión de baja latencia de múltiples canales a través de Ethernet, con interoperabilidad a través de AES67 y soporte para flujos de hasta 512x512 en instalaciones profesionales.[190][191]
El estándar AES42 define una interfaz digital profesional para micrófonos, incorporando Digital Phantom Power (DPP) a +10 V junto con una señal de reloj superpuesta en cableado AES3 balanceado, lo que permite alimentación remota y sincronización sin líneas adicionales. Esto facilita la transmisión de alta fidelidad en entornos de estudio y transmisión, con distribución de reloj integrada que garantiza la coherencia de fase entre dispositivos. Las revisiones de AES42-2020 enfatizan la interoperabilidad con los ecosistemas AES3.[192]
Métricas de rendimiento
Sensibilidad y respuesta de frecuencia
La sensibilidad se refiere a la salida eléctrica de un micrófono en respuesta a una entrada acústica determinada, generalmente medida como el voltaje de circuito abierto producido por un nivel de presión sonora (SPL) de 1 pascal (Pa), que corresponde a 94 dB SPL.[194] Esta especificación se expresa en milivoltios por pascal (mV/Pa) o en decibeles en relación con 1 voltio por pascal (dBV/Pa), donde valores de sensibilidad más altos en mV/Pa o valores menos negativos en dBV/Pa indican una mayor salida para la misma entrada.[195] Por ejemplo, los micrófonos dinámicos suelen exhibir una sensibilidad más baja, alrededor de -55 dBV/Pa (aproximadamente 1,8 mV/Pa), lo que los hace adecuados para fuentes de alto SPL sin requerir una ganancia excesiva, mientras que los micrófonos de condensador ofrecen una sensibilidad más alta, a menudo -35 a -30 dBV/Pa (18 a 32 mV/Pa), lo que permite la captura de sonidos más silenciosos.[196][197]
La respuesta de frecuencia describe el rango de frecuencias que un micrófono puede capturar y la variación en su sensibilidad de salida en ese rango, generalmente representada como una curva que muestra la desviación en decibelios con respecto a un nivel de referencia.[198] El ancho de banda se especifica comúnmente como el rango de frecuencia en el que la respuesta permanece dentro de ±3 dB del nivel nominal, y a menudo abarca de 20 Hz a 20 kHz para que los micrófonos profesionales cubran el espectro audible.[199] Las desviaciones en la curva, como las atenuaciones en bajas frecuencias debido a la resonancia del diafragma o la atenuación de altas frecuencias debido a la amortiguación acústica, influyen en el equilibrio tonal del micrófono y en su idoneidad para aplicaciones específicas.[137]
El ruido propio, también conocido como ruido de entrada equivalente (EIN), cuantifica el ruido de fondo inherente de un micrófono cuando no hay sonido externo presente, expresado en decibelios ponderados A (dBA) como el SPL equivalente que produciría la misma salida.[200] Para los micrófonos de condensador de estudio, el ruido propio suele ser inferior a 15 dBA, y los modelos de gama alta alcanzan de 4 a 10 dBA para garantizar grabaciones limpias en entornos silenciosos.[201][202]
El SPL máximo indica el nivel de presión sonora más alto que un micrófono puede soportar antes de una distorsión significativa, definida como la entrada donde la distorsión armónica total (THD) alcanza el 0,5% a 1 kHz.[203] Los valores típicos oscilan entre 130 y 150 dB SPL, a menudo aumentados de 10 a 20 dB utilizando pads incorporados para acomodar fuentes ruidosas como baterías o amplificadores.[204][205]
Las métricas de rendimiento del micrófono, como la sensibilidad y la respuesta de frecuencia, se miden en condiciones estandarizadas, como la calibración de campo libre para incidencia de sonido anecoico directo o la calibración de campo difuso para entornos reverberantes con sonido que llega desde múltiples direcciones por igual.[206][207] Estos métodos garantizan una evaluación consistente, con configuraciones de campo libre que minimizan los reflejos para una respuesta precisa en el eje y un campo difuso que tiene en cuenta la incidencia aleatoria en las habitaciones.[208]
Ruido, distorsión y rango dinámico
Los micrófonos, como todos los transductores, son susceptibles a diversas fuentes de ruido que degradan la fidelidad de la señal, principalmente ruido térmico y de disparo en los tipos de condensador. El ruido térmico, también conocido como ruido de Johnson-Nyquist, surge de la agitación térmica aleatoria de los portadores de carga en componentes resistivos, con el voltaje cuadrático medio dado por e=4kTRΔfe = \sqrt{4kTR \Delta f}e=4kTRΔf, donde kkk es la constante de Boltzmann, TTT es la temperatura, RRR es la resistencia y Δf\Delta fΔf es el ancho de banda. Este ruido blanco es inherente a todos los elementos electrónicos y contribuye al ruido propio general, que normalmente se mide en condiciones estables para aislar sus efectos.[209] En los micrófonos de condensador, el ruido de disparo surge de fluctuaciones discretas del portador de carga a través de uniones pn en amplificadores asociados o circuitos de polarización, manifestándose como ruido blanco con densidad espectral de potencia proporcional a la corriente de unión e independiente de la temperatura; domina por encima de la frecuencia de esquina del ruido 1/f.[209] El ruido de entrada equivalente total (EIN), que cuantifica el ruido inherente del micrófono referido a la entrada como un nivel de presión acústica (a menudo en dBA), combina estas fuentes junto con contribuciones mecánicas y acústicas; por ejemplo, los micrófonos MEMS comerciales exhiben niveles EIN de 27 a 33 dBA, mientras que los modelos electret pueden alcanzar alrededor de 14 a 17 dBA dependiendo del voltaje de polarización.[210][209]
La distorsión en los micrófonos se debe a no linealidades en el proceso de transducción, particularmente al comportamiento del diafragma bajo diferentes presiones. La distorsión armónica total (THD) resulta de estas no linealidades, como el endurecimiento del diafragma en amplitudes más altas, lo que genera armónicos de la frecuencia fundamental; En los diseños de condensadores de silicio, la THD se mantiene por debajo del 2% hasta 147 dB SPL para variantes piezoeléctricas optimizadas.[12][211] La distorsión de intermodulación (IMD) ocurre en escenarios multitono, donde los elementos no lineales producen frecuencias de suma y diferencia, comprometiendo la pureza de la señal; Las pruebas con tonos duales revelan niveles de IMD influenciados por la distensibilidad del diafragma y la tensión del material, que a menudo exceden el THD en señales complejas.[212] Los diseños MEMS avanzados los mitigan mediante ajustes de perforación y rigidez, pero la distorsión residual limita el rendimiento de alto SPL.[210]
El rango dinámico representa el intervalo desde el nivel de ruido propio del micrófono hasta su nivel máximo de presión sonora sin distorsión (Max SPL), normalmente alrededor de 120 dB para los modelos profesionales, lo que permite capturar desde susurros suaves hasta transitorios fuertes sin saturación ni ruido excesivo.[213] El ruido propio, a menudo de 15 a 30 dB SPL con ponderación A, se resta del SPL máximo (p. ej., 130 a 140 dB con 1 % THD) para definir este rango, con una relación señal-ruido (SNR) estandarizada en una entrada de 94 dB SPL, lo que produce valores como 65 a 74 dB para dispositivos MEMS. En micrófonos electretos y de condensador, EIN informa directamente a la SNR a través de EIN = 94 dB SPL - SNR, lo que garantiza un funcionamiento con poco ruido en entornos silenciosos.[214]
Calibración y prueba
La calibración del micrófono verifica la precisión de la sensibilidad y la respuesta de frecuencia utilizando fuentes acústicas estandarizadas para garantizar la trazabilidad con respecto a los estándares primarios. El método pistonphone emplea un pistón mecánico en un acoplador cerrado para generar un nivel de presión sonora estable de 124 dB re. 20 μPa a 250 Hz, lo que proporciona una calibración del campo de presión adecuada para uso en campo y laboratorio con incertidumbres típicamente inferiores a 0,3 dB.[216] Estas calibraciones se pueden rastrear hasta institutos de metrología nacionales como el Instituto Nacional de Estándares y Tecnología (NIST) en los Estados Unidos o el Physikalisch-Technische Bundesanstalt (PTB) en Alemania, que mantienen estándares acústicos primarios mediante técnicas de reciprocidad. Tenga en cuenta que las normas relacionadas para sonómetros, como IEC 61672 (que reemplaza al antiguo IEC 651), incorporan requisitos de rendimiento del micrófono.
La calibración de campo libre simula condiciones de onda plana usando reciprocidad, donde dos micrófonos de condensador idénticos se alternan como fuente de sonido y receptor para calcular la sensibilidad absoluta del circuito abierto sin medir la presión del sonido directamente. Este método, definido en IEC 61094-2, logra incertidumbres de 0,03 a 0,05 dB y es esencial para determinar respuestas direccionales en entornos sin obstáculos.[216][219]
Los entornos de prueba distinguen entre cámaras anecoicas, que minimizan los reflejos para medir la llegada directa del sonido para patrones de directividad, y salas reverberantes, que crean campos difusos para la evaluación de respuestas de incidencia aleatoria. Las mediciones de respuesta al impulso facilitan la evaluación de la directividad mediante la aplicación de ventanas en el dominio del tiempo para aislar la porción temprana de la señal libre de reflejos, lo que permite una caracterización precisa de los patrones polares.[216]
Los estándares internacionales guían estos procedimientos: IEC 60268-4 describe métodos para medir patrones de respuesta direccional, sensibilidad y rango dinámico en micrófonos para sistemas de sonido, mientras que IEC 61094 (anteriormente IEC 1094, relacionado con aspectos del IEC 651 reemplazado para micrófonos sonómetros) especifica requisitos de rendimiento para micrófonos de medición estándar de laboratorio y de trabajo, incluidas calibraciones de campo libre y de campo de presión.[220]
Las herramientas de software respaldan el análisis, con procesamiento rápido de transformada de Fourier (FFT) de excitaciones de ruido senoidal o pseudoaleatorio para derivar curvas de respuesta de frecuencia, a menudo corrigiendo factores ambientales como la temperatura. El método de reciprocidad integra modelos computacionales para producir valores de sensibilidad absolutos en todas las frecuencias.[221][216]
Los micrófonos profesionales requieren recalibración a intervalos de un año para mantener la precisión, lo que tiene en cuenta mecanismos de envejecimiento como la caída de la carga de electretos en cápsulas prepolarizadas, que pueden reducir gradualmente la sensibilidad a pesar de la estabilidad general a largo plazo del orden de cientos de años a temperatura ambiente, con cambios típicamente inferiores a 1 dB durante décadas.[216] Esta práctica garantiza que las métricas de rendimiento, como el nivel de presión sonora (SPL), sigan siendo confiables para aplicaciones críticas, incluidas las actualizaciones en diseños MEMS de bajo ruido a partir de 2025.[216]
Aplicaciones y variantes
Usos en estudio y transmisión
En la producción de audio profesional, los micrófonos de condensador de diafragma grande como el Neumann U 87 Ai son ampliamente considerados como el estándar para capturar voces debido a su reproducción de sonido clara y detallada y sus múltiples patrones polares que permiten la adaptación a diversos escenarios de grabación. El diseño de doble diafragma de este micrófono permite patrones cardioide, omnidireccional y en forma de 8, lo que brinda versatilidad para aislar las voces principales y al mismo tiempo minimizar el ruido ambiental en entornos de estudio.[222] Para la grabación de instrumentos, se prefieren los micrófonos dinámicos como el Shure SM58 por su construcción robusta y su capacidad para manejar altos niveles de presión sonora de fuentes como amplificadores de guitarra o percusión, ofreciendo una claridad de rango medio enfocada sin retroalimentación excesiva.[223]
En entornos de transmisión, los micrófonos de solapa de condensador electret son esenciales para aplicaciones de televisión, donde su tamaño compacto y captación omnidireccional permiten una fijación discreta a la ropa para un diálogo que suene natural durante entrevistas o segmentos de noticias.[224] Para la producción cinematográfica, los micrófonos de cañón montados en postes capturan el diálogo direccional con un alto rechazo del ruido fuera del eje, lo que permite a los operadores colocar el micrófono justo fuera del cuadro mientras siguen los movimientos de los actores.[225] Técnicas como la microfonía cercana mejoran el aislamiento tanto en contextos de estudio como de transmisión al colocar el micrófono a centímetros de la fuente, lo que reduce el sangrado de los sonidos ambientales y permite un control preciso sobre el audio capturado.
Los micrófonos multipatrón respaldan aún más la versatilidad en estos usos profesionales, ya que los ingenieros pueden cambiar patrones (como cardioide para un aislamiento enfocado u omnidireccional para una cobertura más amplia) para adaptarse a estilos vocales específicos o grabaciones de conjunto. El procesamiento posterior a la captura, como el de-essing, soluciona los problemas de sibilancia comunes en las pistas vocales, comprimiendo sonidos fuertes de "s" y "sh" típicamente en el rango de 5 a 10 kHz para lograr una reproducción más fluida. Los desafíos incluyen el manejo de explosivos de consonantes explosivas, que los filtros pop mitigan al difundir ráfagas de aire antes de que lleguen al diafragma, lo que garantiza grabaciones más limpias y sin distorsión. Los sistemas inalámbricos que operan en la banda de 2,4 GHz, popular para la movilidad en las transmisiones, a menudo enfrentan interferencias de radiofrecuencia (RFI) provenientes de Wi-Fi y otros dispositivos, lo que requiere escaneo de frecuencia y receptores diversos para una transmisión confiable.[228]
A partir de 2025, las tendencias en micrófonos de estudio y transmisión enfatizan los diseños híbridos analógico-digitales, como los modelos USB/XLR como el Shure MV7, que facilitan una integración perfecta con plataformas de colaboración remota para equipos de producción distribuidos. Estos híbridos combinan la calidez de la preamplificación analógica con conectividad digital para transmisión de baja latencia, admitiendo sesiones virtuales donde los artistas graban localmente y comparten audio de alta fidelidad en tiempo real.[229] Los patrones polares desempeñan un papel clave en la ubicación del micrófono, guiando las decisiones sobre direccionalidad para optimizar la captura en entornos dinámicos.[223]
Aplicaciones científicas y de medición
Los micrófonos de medición son dispositivos diseñados con precisión y optimizados para una cuantificación precisa del nivel de presión sonora en entornos controlados, con condensadores omnidireccionales de 1/2 pulgada que sirven como estándar para aplicaciones de laboratorio y de campo. Estos micrófonos, como los producidos por Brüel & Kjær, presentan una respuesta de frecuencia plana dentro de ±2 dB en el rango de 6,3 Hz a 20 kHz, lo que permite una captura confiable de señales acústicas de banda ancha sin distorsión o atenuación significativa.[230] Su patrón omnidireccional garantiza una sensibilidad uniforme desde todos los ángulos en condiciones de campo libre, lo que los hace ideales para calibrar fuentes de sonido y validar modelos acústicos en entornos de investigación.
En contextos científicos, los micrófonos especializados amplían las capacidades de medición a entornos extremos. Los hidrófonos, que normalmente emplean transductores piezoeléctricos, están diseñados para análisis acústicos submarinos, convirtiendo ondas de presión en líquidos en señales eléctricas con alta sensibilidad a frecuencias relevantes para la biología marina y la oceanografía.[231] Para el monitoreo atmosférico, los micrófonos infrasónicos, como el Brüel & Kjær Tipo 4193 de 1/2 pulgada, detectan infrasonidos de baja frecuencia por debajo de 20 Hz, como variaciones de presión debido a fenómenos climáticos como tormentas o eventos sísmicos, proporcionando datos para estudios meteorológicos y geofísicos.[232]
Los conjuntos de micrófonos desempeñan un papel crucial en la investigación acústica al facilitar técnicas de formación de haces, en las que se organizan espacialmente múltiples sensores para localizar y caracterizar fuentes de sonido mediante algoritmos de procesamiento de señales que mejoran la direccionalidad y suprimen el ruido.[233] Los métodos de calibración de reciprocidad, que implican el uso mutuo de un micrófono como transmisor y receptor en un acoplador acústico controlado, establecen niveles de sensibilidad absolutos trazables según estándares internacionales, asegurando la trazabilidad de mediciones cuantitativas en escenarios de campo libre o de campo de presión.[219]
El cumplimiento de estándares como la corrección de campo libre tiene en cuenta la influencia del micrófono en el campo sonoro, con el espaciado de los elementos de la matriz generalmente mantenido en un cuarto de longitud de onda (λ/4) en la frecuencia operativa más alta para minimizar los errores de fase y los lóbulos de rejilla durante la formación del haz. Estos principios sustentan las aplicaciones en mapeo de ruido, donde las redes de micrófonos distribuidos generan mapas acústicos espaciales para la planificación urbana y el cumplimiento ambiental, y en el análisis de vibraciones, donde los micrófonos complementan los acelerómetros para evaluar la transmisión del sonido transmitido por estructuras en diagnósticos de ingeniería.[234]
Diseños de consumo y especializados
Los micrófonos de consumo son parte integral de los dispositivos cotidianos, particularmente los teléfonos inteligentes, donde los micrófonos de sistemas microelectromecánicos (MEMS) comúnmente se integran en conjuntos de tres o cuatro unidades para habilitar funciones como la cancelación activa de ruido (ANC) y la formación de haces para una captura de voz más clara durante las llamadas. Estos conjuntos utilizan múltiples sensores MEMS para separar el habla del ruido ambiental, mejorando la relación señal-ruido en entornos ruidosos mediante el procesamiento direccional.[236] En los auriculares diseñados para llamadas de voz, los micrófonos dinámicos como el Shure WH20 ofrecen opciones resistentes y livianas con un ajuste seguro y una captación de voz de alta calidad, aprovechando su capacidad para manejar conversaciones cercanas sin retroalimentación.[237]
Para instrumentos musicales, los micrófonos de condensador con clip ofrecen una captura de sonido natural y compacta para instrumentos de cuerda como violines y guitarras, con modelos de DPA Microphones que presentan alta sensibilidad y bajo ruido propio para una reproducción detallada durante las actuaciones.[238] Los micrófonos dinámicos diseñados para bombos, como el Shure Beta 52A, destacan en escenarios de alto nivel de presión sonora (SPL), a menudo combinados con ecualización (EQ) para enfatizar el golpe de baja frecuencia y al mismo tiempo atenuar resonancias no deseadas.
Los diseños especializados abordan aplicaciones únicas, incluidos micrófonos de contacto que utilizan elementos piezoeléctricos para capturar vibraciones directamente de superficies como vidrio o madera, produciendo tonos distintivos ricos en bajas frecuencias, ideales para música experimental sin interferencias de ruido aéreo.[240] Los micrófonos de solapa, como los de la serie en miniatura de DPA, se enganchan a la ropa para representaciones teatrales, lo que proporciona opciones de sensibilidad flexibles y un funcionamiento discreto con manos libres en entornos escénicos dinámicos.[241] En contextos médicos como la logopedia, los micrófonos de garganta funcionan como sensores de contacto colocados contra la laringe para detectar vibraciones de las cuerdas vocales, lo que ayuda a los pacientes con problemas de articulación al convertir los movimientos sutiles de la garganta en señales audibles.[242]
Los sistemas inalámbricos mejoran la movilidad en usos de consumo y especializados, con configuraciones de frecuencia ultra alta (UHF) como la serie Shure SLX que emplean compresión para ampliar el rango dinámico y minimizar el ruido en la transmisión analógica para un rendimiento confiable en entornos en vivo.[243] Para 2025, el audio Bluetooth Low Energy (LE) se habrá convertido en un estándar en los auriculares inalámbricos, lo que permitirá una integración eficiente del micrófono para audio multitransmisión y una calidad de llamada mejorada con un menor consumo de energía.[244]
Accesorios y mejoras
Parabrisas y protección del medio ambiente
Los protectores contra el viento son accesorios esenciales diseñados para minimizar el ruido de turbulencia inducido por el viento que puede abrumar las señales del micrófono, particularmente en ambientes al aire libre. Los parabrisas de espuma, normalmente hechos de poliuretano de celda abierta, brindan una protección moderada al absorber el movimiento del aire y romper los vórtices turbulentos a través de su estructura porosa, lo que reduce el ruido en aproximadamente 10 a 15 dB en vientos de hasta 5 m/s.[247] Los parabrisas a base de piel, a menudo llamados "deadcats" y construidos con piel sintética sobre espuma, ofrecen un rendimiento mejorado para uso en exteriores, atenuando el ruido de turbulencia entre 20 y 30 dB a velocidades del viento de alrededor de 5 m/s al dispersar aún más el flujo de aire y minimizar la fricción cerca de la cápsula. Estos diseños crean una cámara de aire quieto alrededor del micrófono, evitando que las fluctuaciones de presión lleguen directamente al diafragma.[247]
Los filtros pop, que consisten en pantallas de malla fina colocadas a 5-10 cm de la boca del hablante, abordan principalmente sonidos explosivos como las consonantes "p" y "b", que generan ráfagas de aire transitorias que superan los 100 Pa y pueden causar una distorsión grave.[250] Al desviar y difundir estas ráfagas, los filtros pop mitigan eficazmente los pops sin alterar significativamente la respuesta de frecuencia general, lo que los convierte en estándar para grabaciones vocales en estudios o transmisiones.
Para condiciones más extremas en transmisiones al aire libre, dirigibles o zepelines (cestas montadas en suspensión, a menudo revestidas con espuma y cubiertas de piel) brindan un aislamiento superior, logrando hasta -40 dB de reducción del ruido del viento al encerrar el micrófono en una carcasa aerodinámica más grande que bloquea y disipa los vientos de alta velocidad. Estos sistemas suspenden el micrófono para reducir también las vibraciones de manejo, lo que garantiza una captura de audio limpia durante las tomas móviles.[252]
Las cubiertas para la lluvia, que utilizan revestimientos hidrofóbicos o materiales de silicona flexibles, protegen los micrófonos del ingreso de humedad en condiciones húmedas, canalizando el agua y manteniendo la transparencia acústica.[253] Estas capas protectoras, como guata o chaquetas de silicona, previenen los cortocircuitos y la corrosión sin absorber agua, aunque la exposición prolongada puede requerir secado para evitar la acumulación de resonancia.[248][254]
Si bien son efectivos, estos accesorios introducen compensaciones menores, incluida una ligera atenuación de alta frecuencia de 2 a 5 dB por encima de 5 kHz debido a la absorción del material, que puede atenuar sutilmente el brillo, pero a menudo se puede quitar para aplicaciones en interiores para restaurar la respuesta completa.[248][249] Los micrófonos direccionales exhiben una sensibilidad particular al ruido del viento debido a su diseño acústico, lo que subraya el valor de estas protecciones en el uso en campo de dichos micrófonos.[255]
Matrices y sistemas multimicrófonos
Los conjuntos de micrófonos constan de múltiples micrófonos dispuestos en geometrías específicas para lograr una directividad mejorada, reducción de ruido y captura de audio espacial a través de técnicas de procesamiento de señales. Estos sistemas aprovechan las diferencias de fase de las ondas sonoras entrantes a través de los elementos del conjunto para formar haces que se centran en las fuentes de sonido deseadas y al mismo tiempo suprimen la interferencia de otras direcciones. Al combinar configuraciones de hardware con procesamiento de señales digitales (DSP), los sistemas de múltiples micrófonos permiten aplicaciones que van desde teleconferencias hasta reproducción de audio inmersiva, superando las capacidades de los micrófonos individuales.
Los conjuntos de micrófonos lineales, a menudo dispuestos en línea recta, se utilizan comúnmente para la formación de haces para mejorar la relación señal-ruido y la directividad. En la formación de haces con retardo y suma, las señales de cada micrófono se desplazan en el tiempo mediante retardos τ antes de la suma para alinear las fases desde la dirección objetivo, mejorando la señal deseada y creando nulos en otras direcciones. El retraso para el enésimo micrófono en una matriz lineal uniforme viene dado por τ_n = (n d sen θ) / c, donde d es el espacio entre micrófonos, θ es el ángulo de la fuente de sonido con respecto al eje de la matriz, c es la velocidad del sonido (aproximadamente 343 m/s a 20 °C) y n indexa la posición del micrófono. Esta técnica dirige el haz ajustando los retardos, lo que permite que los nulos se dirijan hacia fuentes de ruido para su supresión.[256]
Los conjuntos de micrófonos circulares y esféricos amplían la formación de haces a una cobertura completa de 360 grados o 3D, especialmente para aplicaciones de audio espacial. En Ambisonics, estos conjuntos capturan campos de sonido utilizando múltiples cápsulas para codificar señales de formato B, que representan componentes omnidireccionales (W) y direccionales (X, Y, Z) del campo de sonido. Las señales de formato B permiten decodificar diseños arbitrarios de altavoces o renderizado de auriculares, lo que permite una reproducción de audio 3D inmersiva. Los conjuntos esféricos, como los que tienen 24 o más micrófonos, admiten Ambisonics de orden superior para una resolución espacial más precisa.
Los sistemas de múltiples micrófonos encuentran un uso generalizado en entornos de conferencias y parlantes inteligentes, donde los conjuntos facilitan una captación clara de la voz en ambientes ruidosos. Las cadenas de micrófonos para conferencias, como las que tienen 8 unidades de micrófono, emplean formación de haces y conexión en cadena para cubrir salas grandes y admiten hasta 18 asistentes con captación de voz de 360 grados. En los parlantes inteligentes, los conjuntos de micrófonos integran cancelación de eco acústico (AEC) para suprimir la salida del altavoz desde las entradas de micrófono, lo que garantiza una comunicación full-duplex para los asistentes de voz. Estos sistemas utilizan DSP para cancelar ecos de forma adaptativa, manteniendo el flujo natural de la conversación.[257]
Encuentra más de "micrófonos", en los siguientes países:
Los desafíos clave en estos avances incluyen extender la vida útil de la batería en los sistemas inalámbricos y salvaguardar la privacidad en matrices siempre encendidas. Los micrófonos inalámbricos a menudo enfrentan un agotamiento rápido, y los transmisores consumen entre 50 y 100 mA durante el funcionamiento, lo que genera soluciones como protocolos de bajo consumo que extienden el tiempo de funcionamiento a 8 a 12 horas mediante una modulación eficiente.[48] Las preocupaciones sobre la privacidad surgen de la escucha continua en conjuntos de micrófonos, donde la captura involuntaria de datos corre el riesgo de una transmisión no autorizada; Las estrategias de mitigación implican procesamiento local y silenciamiento configurable por el usuario para limitar las cargas en la nube.[49] Para 2025, los sistemas inalámbricos de solapa emergentes se alinearán con estándares de baja latencia para mejorar la conectividad y admitir aplicaciones en entornos de audio inmersivos.[50]
En todos estos mecanismos, las compensaciones fundamentales influyen en las decisiones de diseño, como equilibrar la sensibilidad (a menudo mejorada por diafragmas más delgados o áreas más grandes) con la robustez, ya que las estructuras más delgadas son más propensas a sufrir daños por impactos mecánicos. La respuesta de frecuencia está igualmente limitada por la resonancia mecánica, donde la frecuencia natural del diafragma limita el ancho de banda utilizable a aproximadamente un tercio de la frecuencia de resonancia para evitar la distorsión, con materiales más rígidos que aumentan la resonancia pero potencialmente reducen la sensibilidad. En las implementaciones modernas de sistemas microelectromecánicos (MEMS), el escalado reduce el tamaño y al mismo tiempo preserva estos principios, aunque amplifica las compensaciones en el control del ruido y la resonancia.
Las aplicaciones contemporáneas de los micrófonos piezoeléctricos enfatizan su naturaleza duradera y de bajo costo, como en micrófonos de solapa de contacto económicos para grabación de campo o como transductores en hidrófonos para captura de sonido bajo el agua, donde su capacidad para soportar variaciones de presión es beneficiosa.
Los micrófonos de sistemas microelectromecánicos (MEMS) cuentan con diafragmas de silicio grabados mediante procesos de fotolitografía, formando una estructura capacitiva que convierte la presión del sonido en señales eléctricas. El diafragma, normalmente de 1 a 2 μm de espesor, vibra en relación con una placa posterior fija, con circuitos integrados para aplicaciones específicas (ASIC) que proporcionan amplificación y acondicionamiento de señal en un solo chip para un empaque compacto.[127] Para 2025, la tecnología MEMS dominará el audio de consumo, logrando una penetración de más del 90 % en los teléfonos inteligentes de gama media y alta debido a su pequeño tamaño, confiabilidad y rendimiento comparables a los de los condensadores electret.[128] Las tendencias emergentes incluyen capacidades de detección multieje en dispositivos portátiles, donde los conjuntos MEMS integrados admiten captación de voz, cancelación de ruido y audio con compensación de movimiento para aplicaciones como auriculares de conducción ósea y monitoreo de salud impulsado por IA.[129]
Los micrófonos de plasma utilizan aire ionizado como medio transductor, invirtiendo el principio de los tweeters de plasma al detectar variaciones inducidas acústicamente en la corriente del arco de plasma. Una descarga de alto voltaje crea el plasma y las ondas sonoras modulan la densidad del gas ionizado, provocando fluctuaciones en la corriente de descarga que corresponden a niveles de presión de hasta 145 dB SPL (355 Pa).[130] Los primeros experimentos en la década de 1960 exploraron tales arcos para la detección de altos niveles de presión sonora (SPL), aunque el ruido de la descarga limitó su adopción; Los usos especializados persisten en sirenas y entornos acústicos extremos donde el funcionamiento sin diafragma permite una tolerancia SPL ultra alta.[131] En general, los tipos exóticos como las variantes ópticas y MEMS ofrecen ventajas clave, incluida la inmunidad EMI para diseños de fibra óptica en entornos blindados y la miniaturización extrema para MEMS en dispositivos portátiles.[132]
Los patrones toroidales, que se asemejan a la forma de una rosquilla, emergen en los micrófonos de matriz en línea para conferencias, donde múltiples elementos dirigen la cobertura para priorizar el sonido horizontal a nivel de la mesa mientras atenúan el ruido vertical como el HVAC o los ecos. Ejemplificado por el Shure MXA310, este patrón en configuraciones de matriz sobresale en salas de reuniones al rechazar el audio de los no participantes, promoviendo una colaboración remota clara, pero exige procesamiento digital para la formación de haces y puede tener un rendimiento inferior en espacios altamente reverberantes sin tratamiento acústico.[151]
Los avances en audio espacial han extendido los principios estéreo a configuraciones de orden superior, como conjuntos de micrófonos ambisónicos para realidad virtual (VR). Estos conjuntos, que comprenden múltiples cápsulas dispuestas de forma esférica o irregular, codifican campos de sonido 3D completos en coeficientes ambisónicos, lo que permite un seguimiento de la cabeza con seis grados de libertad en entornos de realidad virtual; Una investigación reciente del IEEE ha mejorado la precisión de la codificación de diseños compactos y portátiles para mejorar la fidelidad de la reproducción binaural.[172][173]
Los micrófonos de cinta, conocidos por sus bajos niveles de salida, incorporan transformadores elevadores para aumentar el voltaje de la señal y hacer coincidir la impedancia con las líneas estándar de baja Z, a menudo usando relaciones de giro de alrededor de 1:37 a 1:40. Estos transformadores aíslan el elemento de cinta y proporcionan la ganancia necesaria sin electrónica activa. Se debe considerar la compatibilidad con la alimentación fantasma en configuraciones analógicas balanceadas, ya que suministra polarización de CC sin interferir con la ruta de la señal de audio.[186]
Los estándares inalámbricos emergentes como Bluetooth Low Energy (LE) Audio, introducido en Bluetooth 5.2 y ampliamente adoptado en 2025, ofrecen transmisión de baja latencia (menos de 20 ms) para aplicaciones de micrófono que utilizan el códec LC3, y admiten audio de transmisión múltiple y transmisión Auracast para dispositivos como micrófonos de solapa inalámbricos. Esto permite una conectividad inalámbrica sincronizada y de alta calidad con un consumo de energía reducido en comparación con el Bluetooth clásico.[193]
En general, estos estándares reducen la susceptibilidad a las interferencias electromagnéticas y permiten el procesamiento de señales digitales (DSP) integrado para funciones como la cancelación de ruido y la formación de haces directamente en el micrófono, mejorando la integridad de la señal desde la captura hasta la salida.[187]
La interferencia electromagnética introduce zumbidos y zumbidos en las frecuencias de las líneas eléctricas (50/60 Hz) y armónicos, acoplándose en líneas desequilibradas o mediante inducción magnética en bobinas dinámicas.[9] El blindaje con carcasas de mu-metal o conexiones XLR balanceadas mitiga esto de manera efectiva, reduciendo los voltajes inducidos al interceptar campos y corrientes de ruido de conexión a tierra. Los avances recientes en MEMS, como los diafragmas de grafeno, tienen como objetivo reducir el ruido propio hasta límites fundamentales, y hay investigaciones en curso a partir de 2024.[215][210]
Los avances posteriores a 2020 en el monitoreo bioacústico han integrado micrófonos especializados con clasificación impulsada por IA, lo que permite la detección e identificación autónoma de vocalizaciones de vida silvestre en ecosistemas remotos. Estos sistemas, que a menudo implementan condensadores omnidireccionales de baja potencia en recintos resistentes a la intemperie, utilizan modelos de aprendizaje automático para procesar espectrogramas para el reconocimiento de especies, apoyando los esfuerzos de conservación a través de estudios de biodiversidad escalables y no invasivos.[235]
Las adaptaciones del diseño garantizan la durabilidad en condiciones difíciles; por ejemplo, los micrófonos impermeables con clasificación IP67 de Cardo Systems protegen contra la inmersión en aplicaciones deportivas como motociclismo, manteniendo la integridad del audio en ambientes húmedos.[245] Los micrófonos de alto SPL, como los modelos de alta presión de GRAS, soportan niveles acústicos extremos de hasta 160 dB para pruebas automotrices, capturando el ruido y las vibraciones del motor sin distorsión.[246]
A pesar de sus ventajas, las matrices de varios micrófonos enfrentan desafíos que incluyen aliasing espacial y requisitos de DSP. El alias espacial ocurre cuando la frecuencia f excede el límite espacial de Nyquist c/(2d), causando ambigüedad en la estimación de la dirección ya que los frentes de onda desde diferentes ángulos producen patrones de fase idénticos en los micrófonos. Esto limita el rendimiento de alta frecuencia a menos que se reduzca el espacio d, lo que aumenta el tamaño o el costo del arreglo. Además, el DSP en tiempo real para la formación de haces exige importantes recursos computacionales, y a menudo requiere hardware dedicado para manejar los cálculos de retardo, el filtrado y la adaptación sin latencia.[258]
Los avances recientes (a partir de 2024) en el procesamiento neuromórfico, inspirados en redes neuronales con picos, permiten el procesamiento de audio de baja potencia (de menos de mW a unos pocos mW) para conjuntos de micrófonos en dispositivos portátiles, lo que respalda tareas como la localización de fuentes de sonido con computación basada en eventos, lo que reduce significativamente el uso de energía en comparación con el DSP tradicional. Por ejemplo, los marcos neuromórficos procesan salidas de micrófono binarias de modulación de densidad de pulso (PDM) para mejorar el habla en tiempo real con un consumo de energía ultrabajo, ideal para dispositivos con batería limitada, como audífonos o gafas AR. Estos sistemas reemplazan el DSP tradicional con neuronas bioinspiradas que se activan solo ante cambios de señal, lo que reduce la potencia en órdenes de magnitud en comparación con los métodos convencionales.[259]
Los desafíos clave en estos avances incluyen extender la vida útil de la batería en los sistemas inalámbricos y salvaguardar la privacidad en matrices siempre encendidas. Los micrófonos inalámbricos a menudo enfrentan un agotamiento rápido, y los transmisores consumen entre 50 y 100 mA durante el funcionamiento, lo que genera soluciones como protocolos de bajo consumo que extienden el tiempo de funcionamiento a 8 a 12 horas mediante una modulación eficiente.[48] Las preocupaciones sobre la privacidad surgen de la escucha continua en conjuntos de micrófonos, donde la captura involuntaria de datos corre el riesgo de una transmisión no autorizada; Las estrategias de mitigación implican procesamiento local y silenciamiento configurable por el usuario para limitar las cargas en la nube.[49] Para 2025, los sistemas inalámbricos de solapa emergentes se alinearán con estándares de baja latencia para mejorar la conectividad y admitir aplicaciones en entornos de audio inmersivos.[50]
En todos estos mecanismos, las compensaciones fundamentales influyen en las decisiones de diseño, como equilibrar la sensibilidad (a menudo mejorada por diafragmas más delgados o áreas más grandes) con la robustez, ya que las estructuras más delgadas son más propensas a sufrir daños por impactos mecánicos. La respuesta de frecuencia está igualmente limitada por la resonancia mecánica, donde la frecuencia natural del diafragma limita el ancho de banda utilizable a aproximadamente un tercio de la frecuencia de resonancia para evitar la distorsión, con materiales más rígidos que aumentan la resonancia pero potencialmente reducen la sensibilidad. En las implementaciones modernas de sistemas microelectromecánicos (MEMS), el escalado reduce el tamaño y al mismo tiempo preserva estos principios, aunque amplifica las compensaciones en el control del ruido y la resonancia.
Las aplicaciones contemporáneas de los micrófonos piezoeléctricos enfatizan su naturaleza duradera y de bajo costo, como en micrófonos de solapa de contacto económicos para grabación de campo o como transductores en hidrófonos para captura de sonido bajo el agua, donde su capacidad para soportar variaciones de presión es beneficiosa.
Los micrófonos de sistemas microelectromecánicos (MEMS) cuentan con diafragmas de silicio grabados mediante procesos de fotolitografía, formando una estructura capacitiva que convierte la presión del sonido en señales eléctricas. El diafragma, normalmente de 1 a 2 μm de espesor, vibra en relación con una placa posterior fija, con circuitos integrados para aplicaciones específicas (ASIC) que proporcionan amplificación y acondicionamiento de señal en un solo chip para un empaque compacto.[127] Para 2025, la tecnología MEMS dominará el audio de consumo, logrando una penetración de más del 90 % en los teléfonos inteligentes de gama media y alta debido a su pequeño tamaño, confiabilidad y rendimiento comparables a los de los condensadores electret.[128] Las tendencias emergentes incluyen capacidades de detección multieje en dispositivos portátiles, donde los conjuntos MEMS integrados admiten captación de voz, cancelación de ruido y audio con compensación de movimiento para aplicaciones como auriculares de conducción ósea y monitoreo de salud impulsado por IA.[129]
Los micrófonos de plasma utilizan aire ionizado como medio transductor, invirtiendo el principio de los tweeters de plasma al detectar variaciones inducidas acústicamente en la corriente del arco de plasma. Una descarga de alto voltaje crea el plasma y las ondas sonoras modulan la densidad del gas ionizado, provocando fluctuaciones en la corriente de descarga que corresponden a niveles de presión de hasta 145 dB SPL (355 Pa).[130] Los primeros experimentos en la década de 1960 exploraron tales arcos para la detección de altos niveles de presión sonora (SPL), aunque el ruido de la descarga limitó su adopción; Los usos especializados persisten en sirenas y entornos acústicos extremos donde el funcionamiento sin diafragma permite una tolerancia SPL ultra alta.[131] En general, los tipos exóticos como las variantes ópticas y MEMS ofrecen ventajas clave, incluida la inmunidad EMI para diseños de fibra óptica en entornos blindados y la miniaturización extrema para MEMS en dispositivos portátiles.[132]
Los patrones toroidales, que se asemejan a la forma de una rosquilla, emergen en los micrófonos de matriz en línea para conferencias, donde múltiples elementos dirigen la cobertura para priorizar el sonido horizontal a nivel de la mesa mientras atenúan el ruido vertical como el HVAC o los ecos. Ejemplificado por el Shure MXA310, este patrón en configuraciones de matriz sobresale en salas de reuniones al rechazar el audio de los no participantes, promoviendo una colaboración remota clara, pero exige procesamiento digital para la formación de haces y puede tener un rendimiento inferior en espacios altamente reverberantes sin tratamiento acústico.[151]
Los avances en audio espacial han extendido los principios estéreo a configuraciones de orden superior, como conjuntos de micrófonos ambisónicos para realidad virtual (VR). Estos conjuntos, que comprenden múltiples cápsulas dispuestas de forma esférica o irregular, codifican campos de sonido 3D completos en coeficientes ambisónicos, lo que permite un seguimiento de la cabeza con seis grados de libertad en entornos de realidad virtual; Una investigación reciente del IEEE ha mejorado la precisión de la codificación de diseños compactos y portátiles para mejorar la fidelidad de la reproducción binaural.[172][173]
Los micrófonos de cinta, conocidos por sus bajos niveles de salida, incorporan transformadores elevadores para aumentar el voltaje de la señal y hacer coincidir la impedancia con las líneas estándar de baja Z, a menudo usando relaciones de giro de alrededor de 1:37 a 1:40. Estos transformadores aíslan el elemento de cinta y proporcionan la ganancia necesaria sin electrónica activa. Se debe considerar la compatibilidad con la alimentación fantasma en configuraciones analógicas balanceadas, ya que suministra polarización de CC sin interferir con la ruta de la señal de audio.[186]
Los estándares inalámbricos emergentes como Bluetooth Low Energy (LE) Audio, introducido en Bluetooth 5.2 y ampliamente adoptado en 2025, ofrecen transmisión de baja latencia (menos de 20 ms) para aplicaciones de micrófono que utilizan el códec LC3, y admiten audio de transmisión múltiple y transmisión Auracast para dispositivos como micrófonos de solapa inalámbricos. Esto permite una conectividad inalámbrica sincronizada y de alta calidad con un consumo de energía reducido en comparación con el Bluetooth clásico.[193]
En general, estos estándares reducen la susceptibilidad a las interferencias electromagnéticas y permiten el procesamiento de señales digitales (DSP) integrado para funciones como la cancelación de ruido y la formación de haces directamente en el micrófono, mejorando la integridad de la señal desde la captura hasta la salida.[187]
La interferencia electromagnética introduce zumbidos y zumbidos en las frecuencias de las líneas eléctricas (50/60 Hz) y armónicos, acoplándose en líneas desequilibradas o mediante inducción magnética en bobinas dinámicas.[9] El blindaje con carcasas de mu-metal o conexiones XLR balanceadas mitiga esto de manera efectiva, reduciendo los voltajes inducidos al interceptar campos y corrientes de ruido de conexión a tierra. Los avances recientes en MEMS, como los diafragmas de grafeno, tienen como objetivo reducir el ruido propio hasta límites fundamentales, y hay investigaciones en curso a partir de 2024.[215][210]
Los avances posteriores a 2020 en el monitoreo bioacústico han integrado micrófonos especializados con clasificación impulsada por IA, lo que permite la detección e identificación autónoma de vocalizaciones de vida silvestre en ecosistemas remotos. Estos sistemas, que a menudo implementan condensadores omnidireccionales de baja potencia en recintos resistentes a la intemperie, utilizan modelos de aprendizaje automático para procesar espectrogramas para el reconocimiento de especies, apoyando los esfuerzos de conservación a través de estudios de biodiversidad escalables y no invasivos.[235]
Las adaptaciones del diseño garantizan la durabilidad en condiciones difíciles; por ejemplo, los micrófonos impermeables con clasificación IP67 de Cardo Systems protegen contra la inmersión en aplicaciones deportivas como motociclismo, manteniendo la integridad del audio en ambientes húmedos.[245] Los micrófonos de alto SPL, como los modelos de alta presión de GRAS, soportan niveles acústicos extremos de hasta 160 dB para pruebas automotrices, capturando el ruido y las vibraciones del motor sin distorsión.[246]
A pesar de sus ventajas, las matrices de varios micrófonos enfrentan desafíos que incluyen aliasing espacial y requisitos de DSP. El alias espacial ocurre cuando la frecuencia f excede el límite espacial de Nyquist c/(2d), causando ambigüedad en la estimación de la dirección ya que los frentes de onda desde diferentes ángulos producen patrones de fase idénticos en los micrófonos. Esto limita el rendimiento de alta frecuencia a menos que se reduzca el espacio d, lo que aumenta el tamaño o el costo del arreglo. Además, el DSP en tiempo real para la formación de haces exige importantes recursos computacionales, y a menudo requiere hardware dedicado para manejar los cálculos de retardo, el filtrado y la adaptación sin latencia.[258]
Los avances recientes (a partir de 2024) en el procesamiento neuromórfico, inspirados en redes neuronales con picos, permiten el procesamiento de audio de baja potencia (de menos de mW a unos pocos mW) para conjuntos de micrófonos en dispositivos portátiles, lo que respalda tareas como la localización de fuentes de sonido con computación basada en eventos, lo que reduce significativamente el uso de energía en comparación con el DSP tradicional. Por ejemplo, los marcos neuromórficos procesan salidas de micrófono binarias de modulación de densidad de pulso (PDM) para mejorar el habla en tiempo real con un consumo de energía ultrabajo, ideal para dispositivos con batería limitada, como audífonos o gafas AR. Estos sistemas reemplazan el DSP tradicional con neuronas bioinspiradas que se activan solo ante cambios de señal, lo que reduce la potencia en órdenes de magnitud en comparación con los métodos convencionales.[259]