Explorando los Límites: Resolución, HDR, HFR y Visión Humana

Explorando los Límites: Resolución, HDR, HFR y Visión Humana

Más resolución, alto rango dinámico (HDR), mayores frecuencias de cuadro… ¿De qué manera afectan los límites del sistema visual humano a nuestra tecnología exactamente?

¿Cuándo suficiente es suficiente? Esta es una de las preguntas más interesantes que se plantearon después de una discusión que surgió en el reciente ARRI Broadcast Day celebrado en las instalaciones de estudio Die Fernsehwerft en el nuevo distrito creativo del Puerto Este de Berlín. En un estudio lleno de invitados internacionales de toda la industria, Marc Shipman-Mueller -el jefe de sistemas de cámaras de ARRI- abrió este tema de una manera que realineó de forma permanente la forma en que veo los avances actuales en la adquisición, post-producción y entrega del cine digital.

Estas son opiniones puramente personales basadas en un proceso de pensamiento en evolución basado en la exploración de nuevas tecnologías, y no en una verdad absoluta. Bien puedo terminar equivocándome, y estoy feliz de aprender cosas que puedan cambiar mis puntos de vista expresados aquí. De hecho, desearía compartirlo con ustedes, y escuchar algunas de sus reflexiones, así que los animo a que dejen sus comentarios.

El Santo Grial

Hace una década, igualar el rendimiento y la estética de la película de 35mm era el “Santo Grial” del cine digital. Hoy hemos alcanzado y superado los desafíos establecidos en el nacimiento del cine digital, igualando técnicamente la emulsión de 35mm, y acaso también en cualquier otro aspecto. Ahora estamos mucho más preocupados por los matices de la ciencia del color digital que por la pelea película vs. digital. Esa batalla ha sido ganada y, en su mayor parte, el resultado es universalmente aceptado.

Entonces, ¿qué sigue para el cine digital? ¿Y en qué medida está comercialmente impulsado por la necesidad de vender televisores nuevos y dispositivos para el consumidor en lugar de una mejora significativa de la experiencia visual? Quizás más de lo que nos gustaría pensar. Por otro lado, después de algunos años de sentirnos en la oscuridad, finalmente algunos estándares básicos están siendo definidos y adoptados en toda la industria.

Cine Digital 2.0

Si la fase inicial en la evolución del cine digital nos vio igualar y superar la película de 35mm, la segunda fase ha cambiado completamente de marcha y dirección. Ya no es cuestión de imitar lo que vino antes, sino de imaginar y realizar un futuro desconocido. El cine como el santo grial de la experiencia cinematográfica era un objetivo fijo y conocido, pero la pregunta de hacia dónde ir luego, nos ha visto caminar por algunos callejones sin salida, solo para retroceder y cambiar de rumbo.

¿El Carro por delante del Caballo?

Quizás es esta misma falta de un objetivo fijo y conocido en el horizonte lo que nos ha permitido seguir a la tecnología por el bien de la misma, en detrimento tanto del arte como del consumidor de cine de entretenimiento. Los fabricantes de televisores han tomado la delantera, impertérritos por el reciente auge y caída de la TV 3D, la UHD, SUHD, HDR y cualquier otro acrónimo que puedan inventar -legítima o ilegítimamente- para deslumbrar a los consumidores para que les den su dinero. Esto ya estaba ocurriendo antes de que se acordaran los estándares formales, mientras que los creadores de contenido se encontraban perdidos en cuanto a dirección técnica y los proveedores de contenido luchaban por lanzar sus primeros canales y servicios UHD sin importar el hecho de que hay muy poco contenido UHD.

UHD, alto rango dinámico (HDR, por sus siglas en inglés), amplia gama de colores, alta frecuencia de cuadros… Le hemos tirado a la pantalla con todo lo que podíamos, cuando quizás hacer una combinación de tecnologías más mesurada podía dar los mejores resultados tanto para los creadores como para el público.

Sólo porque podamos hacer algo no significa que sea la mejor (o única) solución al problema. Puede que, de hecho, ni siquiera comprendamos el problema por completo.

Resolución

La guerra de la resolución se ha calmado durante los últimos años. Todos sabemos que el 4K llegó para quedarse, y seríamos unos tontos en no reconocer que el 8K ya se ha asomado por el horizonte y está cargando contra nosotros. De acuerdo, no creo que veamos al 8K adoptado como una resolución de entrega dominante en el corto plazo, pero RED (y por supuesto NHK y los socios en la parte de la transmisión) ha hecho de la adquisición 8K una realidad, y en realidad no es tan poco práctico como a los cínicos les gustaría pensar.

Sin embargo, el simple aumento de la resolución de píxeles tiene algunas implicaciones de largo alcance.

Más píxeles a una profundidad de bits de color más alta significan mayor cantidad de datos. Esto aumenta los requerimientos de ancho de banda en locación, a través de la post-producción y, por supuesto, en la entrega. La razón de aumentar la resolución de píxeles es aumentar la nitidez y los detalles percibidos en la imagen, aunque hay otras maneras de conseguir esto sin la gran sobrecarga.

Hay una diferencia entre la resolución percibida y la resolución real de píxeles -una diferencia que es importante distinguir-. Lo único que le importa al espectador es la nitidez y el detalle “percibidos” y, como tal, es imperativo incorporar la respuesta de la visión humana a la ecuación si estamos sopesando los pros y los contras de las diferentes tecnologías, sus avances e implicaciones. Muy a menudo, resolver un problema por la fuerza bruta -como el aumento del 400% en píxeles reales- conlleva otros problemas.

Muy a menudo en estas discusiones parece que no tenemos en cuenta cómo vemos, procesamos y percibimos la ilusión de imágenes en movimiento en absoluto.

Resolución y Visión Humana

En nuestras retinas hay sólo una pequeña región que agrupa las células cono a una densidad muy alta. Esta área se llama “fóvea” y, si bien comprende menos del 1% de la retina, ocupa más del 50% de la corteza visual en el cerebro. Solo los dos grados centrales del campo visual se enfocan en la fóvea, aproximadamente el doble del ancho de tu pulgar visto con el brazo extendido.

Por Ben Bogart – Trabajo propio, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=31009153

Cuando observas un objeto en detalle que ocupa más que estos dos grados centrales de tu campo de visión, tu ojo debe explorar el área y tu cerebro rellena los huecos. Tu campo de visión periférico tiene efectivamente mucha menos resolución, pero tu cerebro es capaz de construir la imagen global de la escena frente a ti cuando tu ojo pasa sobre ella. Recuerdas y memorizas los detalles en partes de la escena después de que tu ojo se haya movido, incluso cuando está en movimiento, que es la razón por la cual puedes mantener la conciencia visual en tiempo real a través de todo el campo de visión.

Lo que estás viendo, sin embargo, es una construcción que se actualiza constantemente procesada en tu cerebro en lugar de la imagen proyectada “real” que tus ojos están viendo. Estás percibiendo una realidad construida computacionalmente todo el tiempo, algo mucho más complejo y matizado que una cámara que registra la totalidad de una imagen enfocada en un sensor de imagen a una densidad de píxel y velocidad de cuadros fija y uniforme.

Esta es la razón por la que tu ojo se mueve para escanear la pantalla mientras lees esto: para que puedas detenerte y volver a ver en detalle otra parte de la pantalla, debes mover tus ojos para leerlo nuevamente. Puedes percibir el resto del texto y el diseño general y la posición espacial de todo lo demás en tu campo de visión, pero para leer realmente el texto tienes que mover físicamente tus ojos.

Una imagen en movimiento en una pantalla es una ilusión. Es un truco que nuestro cerebro percibe como una imagen fluida en movimiento. Debemos tener cuidado de no romper la ilusión, que es más frágil de lo que piensas.

HDR

La resolución de píxeles no es la única medida de nitidez. Matemáticamente, no hay duda de que aumentar el número de píxeles es una forma de lograrlo, pero más allá de un cierto umbral los beneficios se acercan cada vez más al cero, mientras que aumenta exponencialmente las tasas de datos.

Nuestra percepción de detalle y nitidez se basa intrínsecamente en el contraste. Es especialmente el contraste de bordes lo que permite que nuestro cerebro aisle y reconozca un objeto de otro. También va en contexto con el resto de la imagen, no es necesariamente uniforme -especialmente cuando está en movimiento- y está mayormente formado por el contraste en brillo y color. Esta es la razón por la que aumentar sencillamente la resolución de píxeles en toda la imagen es muy posiblemente una solución de fuerza bruta a un problema que puede abordarse mejor alimentando nuestro sistema visual tan solo con la información adicional que necesita, exactamente donde lo necesita para lograr la ilusión deseada.

Uno de los ejemplos prácticos que Marc Shipman-Mueller mostró en ARRI Broadcast Day fue una comparación lado a lado entre 1080p SDR y UHD HDR, seguida de 1080p HDR y UHD HDR en monitores calibrados en una habitación a oscuras. La diferencia entre 1080p SDR y UHD HDR fue clara, pero la de 1080p HDR y UHD HDR que le siguió inmediatamente después, no lo fue.

Luego de verlo varias veces, todos coincidieron en que cuando se compara con el 1080p SDR, el 1080p HDR proporcionó el 90% del incremento percibido en los detalles al cuadruplicar el conteo de píxeles estando sentados a la misma distancia de visualización (normal) de la pantalla. Esos son un montón píxeles desperdiciados.

Tironeo (Judder)

Es momento de notar el elefante en la habitación. Todos lo hemos visto -es sin duda el mayor desafío al que nos enfrentamos en la actualidad para mantener la ilusión de movimiento cuando nuestros cerebros no logran conectar e integrar fácilmente los cuadros individuales.

Pero ¿Qué es lo que causa el “judder” exactamente?

El “judder” se produce cuando nuestros cerebros no pueden conectar en forma fluida el movimiento de los objetos con bordes brillantes y de alto contraste a través de cuadros individuales. La razón que presenta un mayor problema para nosotros en el contexto del HDR es el mayor brillo de la pantalla, pero se reduce a una combinación de factores:

  • la relación del área de detalle en movimiento en comparación con el campo de visión total,
  • velocidad de movimiento,
  • contraste en el detalle,
  • nitidez del detalle,
  • nivel de brillo de la pantalla.

El brillo de la pantalla no es realmente una causa de fondo, pero definitivamente empeora la situación. Cuanto menor es el brillo general de la imagen, menos obvio es el efecto, y en el nivel de las pantallas de resolución estándar o SDR, el tironeo ha sido enmascarado por el desenfoque de movimiento en frecuencias de cuadro de video y cine.

Sin embargo, en relaciones de contraste HDR y niveles de luz de fondo de la pantalla, ya no es posible ocultar estos artefactos.

Entonces, ¿cómo resolvemos este problema? Sigue leyendo.

Frecuencias de Fotograma

En el mundo real, nuestros ojos proveen a nuestro cerebro con un flujo constante de información de imágenes. No vemos en cuadros discretos o imágenes fijas muestreadas en el tiempo. Sin embargo, la ilusión de movimiento que percibimos cuando vemos una serie de imágenes estáticas en rápida sucesión es causada por lo que llamamos la persistencia retineana, ya que la retina puede mantener una imagen durante aproximadamente 40 ms.

El estándar de 24 fps surgió como la velocidad de fotogramas mínima aceptable para la percepción de movimiento fluido: lo suficientemente alta como para que la ilusión se mantenga, pero lo suficientemente baja como para que sea rentable.

La razón por la que 24 fps aún se siente como cinematográfico, se debe en gran parte a la referencia histórica y cultural. En otras palabras, es la forma en que siempre ha sido. El parpadeo sutil y casi imperceptible nos hace suponer grandes superproducciones de Hollywood, interpretaciones actorales dignas de premios y alto valor de producción y artístico en comparación con las menores expectativas de la televisión y el video.

Esto ha estado bien durante más de 100 años de películas, para cine, televisión, hasta llegar a lo que considero el final del “cine digital 1.0″, donde hemos igualado la película de 35mm en resolución y color. Pero ya sea en una pantalla pequeña o en una proyección de cine, nuestra experiencia visual se ha mantenido dentro del umbral de contraste, color y brillo aceptables para que la ilusión de movimiento se mantenga a las velocidades de fotogramas tradicionales.

Con imágenes de alta resolución, alto rango dinámico y pantallas más brillantes, surge la necesidad de mayores velocidades de fotograma. En pocas palabras, percibimos menos judder a velocidades de fotograma más altas porque el movimiento relativo de los objetos se reduce entre fotograma y fotograma. Las áreas de muy alto nivel de detalle, alto contraste y movimiento rápido podrían requerir velocidades de fotograma muy altas para que podamos percibirlas sin ningún tipo de judder.

Hay otras ventajas en la adquisición de frecuencias de cuadro elevadas. Grabar a 120 fps permite interpolar el desenfoque de movimiento en post-producción, y la capacidad de realizar el Master fácilmente en cualquier frecuencia de cuadro requerida para la entrega.

También hay desventajas, la primera es obvia: al igual que la resolución, aumentar la frecuencia de fotogramas aumenta drásticamente el ancho de banda de datos requerido para capturar, almacenar y procesar imágenes en movimiento.

Súper realismo y el efecto de “telenovela”

La segunda desventaja es la que están enfrentando algunos de los primeros cineastas que han experimentado con altas frecuencias de fotograma. Muchos críticos de la decisión de Peter Jackson de rodar y masterizar “El Hobbit” a 48 fps, y más recientemente “Long Halftime Walk en 3D” de Ang Lee a 120 fps, afirman que el efecto hiperrealista del estilo nítido y súper cristalino, aunque técnicamente impresionante , es imposible de ver y anti-cinematográfico.

Un praxinoscopio proyectando, 1882, aquí se muestra superponiendo una figura animada en un fondo proyectado por separado.

No es la ilusión de movimiento lo que se rompe, sino el rasgo de ensoñación que te absorbe en una historia y te aleja de la realidad. Es la experiencia etérea lo que se rompe, y esto, yo diría, es quizás más importante para la experiencia que las pantallas 4K de 1000-nit.

Por supuesto, tal vez tengamos que acostumbrarnos a una nueva estética.

Imágenes Computacionales

Quizás la solución ideal no sea golpear la imagen con el martillo de la resolución 4K u 8K a 120 fps. ¿Podría haber un enfoque más específico en el que aumentamos los detalles y la velocidad de cuadros en ciertas partes de la imagen solamente? Recuerda, solo eres capaz de ver los dos grados centrales de todo tu campo de visión con mucho detalle, e incluso mientras miras una pantalla, estás constantemente escaneando, moviendo tus ojos de un punto de interés al otro. ¿No deberíamos pensar más acerca de cómo experimentaremos y percibiremos realmente las imágenes que creamos?

Dirigir nuestras soluciones a la percepción humana significa comprender que nuestros cerebros ya están haciendo una gran cantidad de sofisticados procesos de compresión y filtrado en tiempo real. Nuestras retinas son parte de nuestro sistema nervioso central, y hay alrededor de 150 millones de receptores en el ojo y solo 1 millón de fibras en el nervio óptico. La retina codifica (comprime) espacialmente la imagen para que se ajuste a la capacidad limitada del nervio óptico.

Tu cerebro está procesando dinámicamente un flujo constante de información de imagen de alta resolución en un foco estrecho proveniente de la fóvea junto con un campo de visión más amplio de baja resolución, aumentado con detalles adicionales del recuerdo de la memoria para construir lo que conocemos y vemos como el mundo que nos rodea.

Si tu percepción de la realidad ya está basada en que tus ojos y tu cerebro filtran una tonelada de información extra innecesaria, y dejando pasar sólo lo que se modifica de momento a momento (no muy distinto a la compresión de imagen espacial y temporal digital que usamos para comprimir video) tal vez solo necesitemos presentar información adicional sólo donde sea relevante, dónde será vista y afectará nuestra percepción de la imagen.

Tal vez de esta manera podamos mejorar la forma en que experimentamos el cine, dándole una sensación de mayor realismo y claridad, pero evitando el momento en que nos desconectamos de la fantasía.

En conclusión

Seguro, el 4K y 8K HDR, HFR, las imágenes de gama amplia de colores en una pantalla gigante OLED de última generación podrían hacerte sentir como si estuvieras mirando desde una ventana a un escenario real del otro lado. ¿Pero es la realidad lo que realmente queremos de nuestras historias?

No lo creo.

Dinos lo que piensas de estas tecnologías, tendencias y el impacto en la forma de narrar y experimentar el cine en los comentarios debajo.

Deja un Comentario

guest
Filtro:
Todo
Ordenar por:
latest
Filtro:
Todo
Ordenar por:
latest

Se parte de la experiencia comunitaria de CineD