Back to Glossary

Códec de Audio Opus

Todos los códecs de audio funcionan comprimiendo y descomprimiendo información. Aunque no es tan común como MP3, Opus es uno de los códecs de audio más populares en Internet. Opus es utilizado regularmente por miles de millones de usuarios. Tiene soporte integrado en Windows 10, macOS, iOS, Android y es parte de los principales sistemas multimedia Unix. Además, como Opus es una parte obligatoria del estándar WebRTC para el intercambio de datos en tiempo real, este códec de audio es compatible con todos los navegadores web modernos. Los principales sistemas de comunicación como WhatsApp, Facebook Messenger y la mayoría de las aplicaciones globales de videoconferencia utilizan Opus – y eso es solo el principio. Echemos un vistazo más de cerca al códec Opus: de dónde vino, qué lo hace especial, cómo se usa típicamente y qué podemos esperar de los códecs de audio en el futuro.

Cómo surgió Opus

Este códec de audio fue el resultado de varios otros proyectos de códecs en los que trabajó el Internet Engineering Task Force (IETF), con el objetivo de crear un códec de audio universal para Internet. Hace casi diez años, el IETF reconoció que Internet necesitaba un único códec de audio confiable que pudiera usarse para cualquier método de transmisión de sonido a través de Internet, desde la voz hasta la distribución de música en vivo. Los proyectos predecesores de Opus fueron los códecs CELT y Speex de Xiph.org y SILK de Skype. De hecho, Opus incorpora partes clave de estos códecs. Opus fue introducido en 2010 y estandarizado como RFC 6716 en 2012. Como estándar de Internet, fue compatible con navegadores, sistemas operativos y el software de audio/video más popular. La posición de Opus como códec de facto para la comunicación en tiempo real se consolidó más tarde cuando su uso se volvió obligatorio como parte del estándar WebRTC.

¿Por qué Opus?

Cuando se trata de códecs de audio, Opus es el líder indiscutible, combinando un conjunto moderno de características diseñadas para funcionar en diversas condiciones y formatos. El estándar de Internet ciertamente contribuyó a su popularidad, pero el códec se convirtió en número uno principalmente debido a su rendimiento, características únicas, falta de tarifas de licencia y numerosas referencias de código abierto.

Calidad

Todo el mundo sabe que los códecs de Internet deben proporcionar compresión para minimizar el ancho de banda. Esta proporción debe equilibrarse con la calidad del sonido de salida y el procesamiento necesario para codificar y decodificar esta información de audio. Una de las principales razones del éxito de Opus es su excelente rendimiento en una amplia variedad de condiciones.

Códec de Audio Opus – La mejor herramienta para streaming de video y videoconferencias

El códec de audio Opus funciona perfectamente para la reproducción de señales a velocidades que van desde 6 kbit/s hasta 510 kbit/s. En cualquier caso, la compresión se realiza con pérdidas mínimas, prácticamente imperceptibles para el oído humano. Este códec puede cambiar dinámicamente a compresión con diferentes tasas de bits, dependiendo de los cambios en el ancho de banda. Hasta la fecha, no ha surgido ninguna alternativa que ofrezca mejor rendimiento, mayor gama de capacidades o mejor calidad de sonido y video.

Características principales y ventajas:

  • Soporte para cualquier frecuencia de muestreo – de 8 a 48 kHz
  • Tasa de bits de 6 a 510 Kbit/s
  • Soporte para mono y estéreo
  • Soporte para tasas de bits constantes (CBR) y variables (VBR)
  • Latencia de solo 5 milisegundos
  • Flujo de audio fácilmente escalable con capacidad de cambiar configuraciones dinámicamente

Como resultado de numerosos estudios y pruebas, el códec de audio Opus fue reconocido como el más adecuado para la compresión del habla. Se sabe que durante la transmisión de video, una buena calidad de sonido es tan importante como el video. En comparación con otros códecs de voz populares, Opus recibió el mayor rendimiento y la capacidad de cambiar instantáneamente entre diferentes mecanismos de cifrado. Esto lo convirtió en una herramienta ideal para la transmisión de datos durante la transmisión de video. Todos los participantes pueden comunicarse entre sí en el entorno de sonido más cómodo, incluso con conexiones a Internet de baja velocidad.

Combinación integral de características de rendimiento

Muchos usuarios se preguntan: ¿de dónde viene un rendimiento tan excelente del códec Opus? La respuesta es simple – está todo en el conjunto de características y capacidades especialmente diseñado:

Baja latencia

El intervalo de tiempo entre cuando un usuario habla y cuando su interlocutor lo escucha se llama latencia de audio. Cuanto más corta sea, mejor, y esto es especialmente importante cuando necesitas interactividad en tiempo real. Por supuesto, la física y la naturaleza de Internet introducen algunos retrasos inherentes, pero Opus no agrega retrasos largos durante la codificación y decodificación. Este códec proporciona latencia prácticamente imperceptible, específicamente 26,5 ms, usando configuraciones predeterminadas (tamaño de cuadro 20 ms), lo que lo hace idealmente adecuado para Voz sobre IP (VoIP).

De banda estrecha a banda ancha

Una de las características únicas de Opus es que funciona tanto para el muestreo de voz humana como para la música. Cuando una persona habla, la mayor parte del tiempo se usa un rango de frecuencia relativamente limitado, lo que facilita la compresión – esto se llama sonido de banda estrecha. Tiene una distorsión sutil pero notable cuando lo escuchas. El sonido de banda ancha, que cubre todo el rango del habla humana – es lo que la mayoría de los códecs orientados al habla buscan. Por otro lado, la música cubre todo el rango espectral de lo que nuestros oídos pueden escuchar. La codificación de estas características adicionales requiere más bits y generalmente se llama banda ancha. Los códecs que proporcionan alta compresión a bajas tasas de bits están optimizados para un rango de frecuencia limitado. A diferencia de ellos, Opus admite comunicación de voz de bajo ancho de banda y todo el espectro de lo que escuchamos, como la música, ya que en realidad combina partes de dos códecs diferentes, a saber, SILK para banda estrecha y CELT para banda ancha. En las versiones más recientes del códec, se usa un algoritmo de red neuronal basado en aprendizaje profundo para determinar qué opción usar en un momento dado. Es por eso que la opción óptima siempre se selecciona automáticamente, incluso cuando están presentes tanto el habla como la música.

¿Dónde se usa?

Ahora veamos cómo se aplica Opus en Internet:

  1. Topologías típicas

    Opus se usa típicamente en aplicaciones de comunicación en tiempo real, transmisiones en vivo y visualización de video en línea. Esto a menudo va acompañado de transmisiones de video, aunque no necesariamente. Cuando se trata del componente de audio, recuerda que el video generalmente sigue al audio en paralelo, asegurando una calidad ideal tanto para el sonido como para la imagen.

  2. Llamadas

    Teniendo sus propios estándares de Internet, Opus puede funcionar sin WebRTC, pero WebRTC no puede funcionar sin Opus. Por lo tanto, el códec transmite perfectamente la parte de audio de las llamadas por Internet.

  3. Streaming de video Opus, con la ayuda del estándar WebRTC, también ha demostrado ser una herramienta muy útil para realizar transmisiones en vivo. En lugar de usar equipo especializado, software instalado o memoria flash, los streamers pueden enviar audio (y video) directamente desde el navegador, usando solo un micrófono (y/o webcam).

Flussonic y OPUS

A partir de la versión 21.12, Flussonic Media Server es compatible con el códec OPUS. Documentación