¿Qué es JPEG XS y por qué los broadcasters están obsesionados con él?
JPEG XS es un codec de compresión de video diseñado específicamente para latencia sub-milisegundo. No es un error tipográfico: estamos hablando de latencia menor a 1 milisegundo (0.001 segundos) en la codificación y decodificación.
Para poner esto en contexto:
| Codec | Latencia de encoding | Ratio de compresión | Calidad |
|---|---|---|---|
| H.264 (AVC) | 50-500 ms | 50:1 a 200:1 | Buena a excelente |
| H.265 (HEVC) | 100-1000 ms | 100:1 a 300:1 | Excelente |
| AV1 | 500-5000 ms | 150:1 a 400:1 | Excelente |
| JPEG XS | <1 ms | 3:1 a 10:1 | Visualmente idéntica al original |
JPEG XS logra latencia sub-milisegundo porque usa un enfoque radicalmente diferente a H.264/H.265. No usa predicción inter-frame (B-frames, P-frames). Cada frame se comprime de forma completamente independiente, como si fuera una foto JPEG individual — pero con un algoritmo wavelet optimizado que mantiene calidad "visualmente lossless" con ratios de 3:1 a 10:1.
¿Por qué no comprimir más?
Porque en producción profesional, la calidad es no-negociable. JPEG XS no está diseñado para distribuir video a millones de espectadores por internet (para eso está H.264/H.265). Está diseñado para mover video sin comprimir entre equipos de producción — reemplazando cables SDI con IP, manteniendo la misma calidad pero con la flexibilidad de la red.
🎥 Caso de uso principal: JPEG XS reemplaza SDI (Serial Digital Interface) en infraestructuras de producción IP. En vez de cables SDI dedicados de 3G/12G, puedes enviar video por red Ethernet estándar con JPEG XS a calidad "visualmente sin pérdida" y latencia menor que SDI.
JPEG XS en producción remota REMI: el caso de uso estrella
La producción remota REMI (Remote Integration Model) es el modelo donde las cámaras están en el lugar del evento pero la producción (mezcla, graphics, replay, dirección) se hace desde un estudio remoto. Es el futuro de la producción broadcast:
Producción tradicional vs REMI
| Aspecto | Producción tradicional | Producción REMI |
|---|---|---|
| Equipo en campo | Unidad móvil completa ($500K-2M) | Cámaras + encoder ($20K-50K) |
| Personal en campo | 15-30 personas | 3-5 personas |
| Producción | En el lugar del evento | En estudio centralizado |
| Costo por evento | $50K-200K | $10K-30K |
| Transporte de video | SDI local | SRT / JPEG XS por IP |
Para que REMI funcione, las señales de cámara deben llegar al estudio remoto con latencia mínima y calidad máxima. Aquí es donde entran los diferentes codecs:
Codecs para transporte en producción REMI
| Codec | Latencia transporte | Ancho de banda por señal 1080p60 | Calidad |
|---|---|---|---|
| No comprimido (SDI 3G) | ~0 ms | 3 Gbps | Perfecta |
| JPEG XS | <1 ms | 250-500 Mbps | Visualmente lossless |
| JPEG 2000 | 10-100 ms | 100-300 Mbps | Muy alta |
| H.264 (SRT) | 50-500 ms | 10-50 Mbps | Alta |
| H.265 (SRT) | 100-1000 ms | 5-25 Mbps | Alta |
JPEG XS ocupa el sweet spot: 10x menos ancho de banda que SDI sin comprimir, con calidad visualmente idéntica y latencia comparable. Para producción REMI con enlace de fibra dedicado, es ideal.
JPEG XS vs NDI vs SMPTE ST 2110: protocolos de video sobre IP
JPEG XS no existe solo. Se usa dentro de protocolos de transporte de video sobre IP más amplios:
SMPTE ST 2110
Es el estándar profesional de la industria broadcast para video sobre IP. Define cómo transportar video, audio y datos auxiliares sobre redes IP estándar. JPEG XS es el codec recomendado para ST 2110 cuando se necesita compresión con mínima latencia (ST 2110-22).
NDI (Network Device Interface)
Desarrollado por Vizrt (antes NewTek). Es más simple que ST 2110 y muy popular en producción corporativa y educativa. Usa compresión propietaria con mayor ratio que JPEG XS pero más latencia (~1-2 frames).
Comparativa de protocolos de video sobre IP
| Protocolo | Codec | Latencia | Ancho de banda (1080p60) | Uso principal |
|---|---|---|---|---|
| ST 2110 + JPEG XS | JPEG XS | <1 ms | 250-500 Mbps | Broadcast profesional, estadios |
| NDI|HX3 | H.264/H.265 | 1-3 frames | 20-100 Mbps | Producción corporativa, eLearning |
| NDI Full | SpeedHQ (propietario) | 1 frame | 150-250 Mbps | LAN producción profesional |
| SRT + H.264 | H.264 | 100-500 ms | 5-20 Mbps | Contribución remota internet |
¿Cuándo usar cada uno?
- 🏟️ Estadio/estudio con infraestructura 10GbE+: ST 2110 + JPEG XS
- 🏢 Oficina/campus con red Gigabit: NDI (Full o HX3)
- 🌐 Contribución por internet: SRT + H.264/H.265
- 📡 REMI con enlace dedicado >1 Gbps: JPEG XS o JPEG 2000
📡 La realidad en LATAM: ST 2110 + JPEG XS requiere infraestructura de red de alto rendimiento (10/25 GbE con PTP) que pocos estudios en Latinoamérica tienen. NDI y SRT son las opciones más prácticas para la mayoría de productoras. JPEG XS es relevante para broadcasters grandes (canales de TV, estadios) que están migrando de SDI a IP.
Hardware que soporta JPEG XS hoy
JPEG XS requiere hardware o FPGA especializado para encoding/decoding en tiempo real. No es algo que puedas hacer con OBS Studio. Estos son los productos más relevantes:
Encoders/Decoders JPEG XS
| Producto | Fabricante | Tipo | Precio aprox. |
|---|---|---|---|
| Makito X4 | Haivision | Encoder/Decoder | $8,000-15,000 USD |
| TICO-XS | intoPIX | IP Core (FPGA) | Bajo licencia |
| TicoXS Module | Matrox | Tarjeta PCIe | $3,000-6,000 USD |
| N20 | Nevion | Gateway ST 2110 | $10,000+ USD |
| Aja BRIDGE NDI 3G | AJA | Converter SDI↔NDI | $2,000 USD |
Software con soporte JPEG XS
- FFmpeg: Soporte experimental de JPEG XS (libsvtjpegxs)
- GStreamer: Plugin JPEG XS disponible
- VLC: Puede decodificar JPEG XS en versiones recientes
- vMix: Soporte para ingesta JPEG XS via ST 2110
¿Cuándo tiene sentido invertir en JPEG XS?
- ✅ Eres un broadcast grande migrando de SDI a IP
- ✅ Tienes infraestructura de red 10GbE+ con PTP
- ✅ Necesitas latencia sub-frame para producción en vivo
- ✅ Manejas múltiples señales de cámara (8-16+) para mezcla en tiempo real
- ❌ No tiene sentido si: transmites por internet, usas OBS, o tu presupuesto es <$10K
De JPEG XS a WebRTC: la cadena completa de ultra baja latencia
La cadena de latencia mínima absoluta en 2026 se ve así:
Cámara SDI
│
├── JPEG XS → Red IP 10GbE → Estudio REMI (<1ms)
│
└── Mezcla/Producción en estudio
│
├── SRT → XtreamCast (100-300ms) → WebRTC al espectador (200-500ms)
│
└── TOTAL: <1ms (producción) + 300-800ms (distribución) = <1 segundo
Desglose de latencia de la cadena
| Etapa | Tecnología | Latencia |
|---|---|---|
| Cámara → Encoder | SDI / HDMI | <1 ms |
| Encoding | JPEG XS | <1 ms |
| Transporte producción | ST 2110 / LAN | 1-5 ms |
| Mezcla / Graphics | vMix / Tricaster | 1-2 frames (16-33 ms) |
| Re-encoding para distribución | H.264 / VP8 | 50-100 ms |
| Ingesta al servidor | SRT | 100-300 ms |
| Distribución al espectador | WebRTC (WHEP) | 200-500 ms |
Total cadena JPEG XS → WebRTC: 370ms - 940ms. Menos de 1 segundo desde la cámara hasta la pantalla del espectador. Esto es verdadero "tiempo real" para streaming.
Para la mayoría de productoras en LATAM, la cadena realista es más simple:
Cámara → OBS (H.264 veryfast) → SRT → XtreamCast → WebRTC
TOTAL: 500ms - 2 segundos
Y eso sigue siendo extraordinariamente rápido para la mayoría de los casos de uso.
⚡ XtreamCast Ultra Baja Latencia: No necesitas JPEG XS para obtener latencia sub-2 segundos. Con ingesta SRT y distribución WebRTC via nuestro addon de WebRTC Ultra Baja Latencia ($20/mes), logras menos de 2 segundos de delay end-to-end con tu setup actual de OBS/encoder.
¿Necesitas la menor latencia posible?
XtreamCast ofrece distribución WebRTC sub-2 segundos con ingesta SRT/RTMP. Para producción REMI y broadcasting profesional con ultra baja latencia.