🎬 Tecnología

JPEG XS y Codecs de Ultra Baja Latencia para Producción Remota y Streaming

H.264 comprime en milisegundos. JPEG XS comprime en microsegundos — menos de 1 milisegundo. Para producción remota REMI donde cada frame cuenta, este codec cambia las reglas del juego. Te explicamos cómo funciona, cuándo tiene sentido y cómo encaja en la cadena de ultra baja latencia.

¿Qué es JPEG XS y por qué los broadcasters están obsesionados con él?

JPEG XS es un codec de compresión de video diseñado específicamente para latencia sub-milisegundo. No es un error tipográfico: estamos hablando de latencia menor a 1 milisegundo (0.001 segundos) en la codificación y decodificación.

Para poner esto en contexto:

CodecLatencia de encodingRatio de compresiónCalidad
H.264 (AVC)50-500 ms50:1 a 200:1Buena a excelente
H.265 (HEVC)100-1000 ms100:1 a 300:1Excelente
AV1500-5000 ms150:1 a 400:1Excelente
JPEG XS<1 ms3:1 a 10:1Visualmente idéntica al original

JPEG XS logra latencia sub-milisegundo porque usa un enfoque radicalmente diferente a H.264/H.265. No usa predicción inter-frame (B-frames, P-frames). Cada frame se comprime de forma completamente independiente, como si fuera una foto JPEG individual — pero con un algoritmo wavelet optimizado que mantiene calidad "visualmente lossless" con ratios de 3:1 a 10:1.

¿Por qué no comprimir más?

Porque en producción profesional, la calidad es no-negociable. JPEG XS no está diseñado para distribuir video a millones de espectadores por internet (para eso está H.264/H.265). Está diseñado para mover video sin comprimir entre equipos de producción — reemplazando cables SDI con IP, manteniendo la misma calidad pero con la flexibilidad de la red.

🎥 Caso de uso principal: JPEG XS reemplaza SDI (Serial Digital Interface) en infraestructuras de producción IP. En vez de cables SDI dedicados de 3G/12G, puedes enviar video por red Ethernet estándar con JPEG XS a calidad "visualmente sin pérdida" y latencia menor que SDI.

JPEG XS en producción remota REMI: el caso de uso estrella

La producción remota REMI (Remote Integration Model) es el modelo donde las cámaras están en el lugar del evento pero la producción (mezcla, graphics, replay, dirección) se hace desde un estudio remoto. Es el futuro de la producción broadcast:

Producción tradicional vs REMI

AspectoProducción tradicionalProducción REMI
Equipo en campoUnidad móvil completa ($500K-2M)Cámaras + encoder ($20K-50K)
Personal en campo15-30 personas3-5 personas
ProducciónEn el lugar del eventoEn estudio centralizado
Costo por evento$50K-200K$10K-30K
Transporte de videoSDI localSRT / JPEG XS por IP

Para que REMI funcione, las señales de cámara deben llegar al estudio remoto con latencia mínima y calidad máxima. Aquí es donde entran los diferentes codecs:

Codecs para transporte en producción REMI

CodecLatencia transporteAncho de banda por señal 1080p60Calidad
No comprimido (SDI 3G)~0 ms3 GbpsPerfecta
JPEG XS<1 ms250-500 MbpsVisualmente lossless
JPEG 200010-100 ms100-300 MbpsMuy alta
H.264 (SRT)50-500 ms10-50 MbpsAlta
H.265 (SRT)100-1000 ms5-25 MbpsAlta

JPEG XS ocupa el sweet spot: 10x menos ancho de banda que SDI sin comprimir, con calidad visualmente idéntica y latencia comparable. Para producción REMI con enlace de fibra dedicado, es ideal.

JPEG XS vs NDI vs SMPTE ST 2110: protocolos de video sobre IP

JPEG XS no existe solo. Se usa dentro de protocolos de transporte de video sobre IP más amplios:

SMPTE ST 2110

Es el estándar profesional de la industria broadcast para video sobre IP. Define cómo transportar video, audio y datos auxiliares sobre redes IP estándar. JPEG XS es el codec recomendado para ST 2110 cuando se necesita compresión con mínima latencia (ST 2110-22).

NDI (Network Device Interface)

Desarrollado por Vizrt (antes NewTek). Es más simple que ST 2110 y muy popular en producción corporativa y educativa. Usa compresión propietaria con mayor ratio que JPEG XS pero más latencia (~1-2 frames).

Comparativa de protocolos de video sobre IP

ProtocoloCodecLatenciaAncho de banda (1080p60)Uso principal
ST 2110 + JPEG XSJPEG XS<1 ms250-500 MbpsBroadcast profesional, estadios
NDI|HX3H.264/H.2651-3 frames20-100 MbpsProducción corporativa, eLearning
NDI FullSpeedHQ (propietario)1 frame150-250 MbpsLAN producción profesional
SRT + H.264H.264100-500 ms5-20 MbpsContribución remota internet

¿Cuándo usar cada uno?

  • 🏟️ Estadio/estudio con infraestructura 10GbE+: ST 2110 + JPEG XS
  • 🏢 Oficina/campus con red Gigabit: NDI (Full o HX3)
  • 🌐 Contribución por internet: SRT + H.264/H.265
  • 📡 REMI con enlace dedicado >1 Gbps: JPEG XS o JPEG 2000
📡 La realidad en LATAM: ST 2110 + JPEG XS requiere infraestructura de red de alto rendimiento (10/25 GbE con PTP) que pocos estudios en Latinoamérica tienen. NDI y SRT son las opciones más prácticas para la mayoría de productoras. JPEG XS es relevante para broadcasters grandes (canales de TV, estadios) que están migrando de SDI a IP.

Hardware que soporta JPEG XS hoy

JPEG XS requiere hardware o FPGA especializado para encoding/decoding en tiempo real. No es algo que puedas hacer con OBS Studio. Estos son los productos más relevantes:

Encoders/Decoders JPEG XS

ProductoFabricanteTipoPrecio aprox.
Makito X4HaivisionEncoder/Decoder$8,000-15,000 USD
TICO-XSintoPIXIP Core (FPGA)Bajo licencia
TicoXS ModuleMatroxTarjeta PCIe$3,000-6,000 USD
N20NevionGateway ST 2110$10,000+ USD
Aja BRIDGE NDI 3GAJAConverter SDI↔NDI$2,000 USD

Software con soporte JPEG XS

  • FFmpeg: Soporte experimental de JPEG XS (libsvtjpegxs)
  • GStreamer: Plugin JPEG XS disponible
  • VLC: Puede decodificar JPEG XS en versiones recientes
  • vMix: Soporte para ingesta JPEG XS via ST 2110

¿Cuándo tiene sentido invertir en JPEG XS?

  • ✅ Eres un broadcast grande migrando de SDI a IP
  • ✅ Tienes infraestructura de red 10GbE+ con PTP
  • ✅ Necesitas latencia sub-frame para producción en vivo
  • ✅ Manejas múltiples señales de cámara (8-16+) para mezcla en tiempo real
  • ❌ No tiene sentido si: transmites por internet, usas OBS, o tu presupuesto es <$10K

De JPEG XS a WebRTC: la cadena completa de ultra baja latencia

La cadena de latencia mínima absoluta en 2026 se ve así:

Cámara SDI
    │
    ├── JPEG XS → Red IP 10GbE → Estudio REMI (<1ms)
    │
    └── Mezcla/Producción en estudio
          │
          ├── SRT → XtreamCast (100-300ms) → WebRTC al espectador (200-500ms)
          │
          └── TOTAL: <1ms (producción) + 300-800ms (distribución) = <1 segundo

Desglose de latencia de la cadena

EtapaTecnologíaLatencia
Cámara → EncoderSDI / HDMI<1 ms
EncodingJPEG XS<1 ms
Transporte producciónST 2110 / LAN1-5 ms
Mezcla / GraphicsvMix / Tricaster1-2 frames (16-33 ms)
Re-encoding para distribuciónH.264 / VP850-100 ms
Ingesta al servidorSRT100-300 ms
Distribución al espectadorWebRTC (WHEP)200-500 ms

Total cadena JPEG XS → WebRTC: 370ms - 940ms. Menos de 1 segundo desde la cámara hasta la pantalla del espectador. Esto es verdadero "tiempo real" para streaming.

Para la mayoría de productoras en LATAM, la cadena realista es más simple:

Cámara → OBS (H.264 veryfast) → SRT → XtreamCast → WebRTC
TOTAL: 500ms - 2 segundos

Y eso sigue siendo extraordinariamente rápido para la mayoría de los casos de uso.

XtreamCast Ultra Baja Latencia: No necesitas JPEG XS para obtener latencia sub-2 segundos. Con ingesta SRT y distribución WebRTC via nuestro addon de WebRTC Ultra Baja Latencia ($20/mes), logras menos de 2 segundos de delay end-to-end con tu setup actual de OBS/encoder.

¿Necesitas la menor latencia posible?

XtreamCast ofrece distribución WebRTC sub-2 segundos con ingesta SRT/RTMP. Para producción REMI y broadcasting profesional con ultra baja latencia.