Y llegó Turing: así es la arquitectura de unas NVIDIA RTX 2000 que lo quieren cambiar todo.

En tecnología hay empresas que se acomodan y otras que intentan mirar al futuro. Que precisamente es lo que hace la arquitectura Turing, que es absoluta protagonista de las nuevas tarjetas gráficas NVIDIA GeForce RTX 2070, RTX 2080 y RTX 2080 Ti.

En NVIDIA lo dejaron bien claro durante la presentación de esta familia: era relativamente sencillo darle una vuelta de tuerca a las GTX 1000, pero en NVIDIA querían ir más allá, y lo cierto es que Turing tiene muchas papeletas para dar ese salto incremental que quizás solo apreciemos con el paso del tiempo. Estos son los secretos de Turing, la arquitectura que refuerza la apuesta por el gaming, pero que además plantea una revolución tanto con el ray-tracing como con sus procesadores neuronales.

Bienvenida, Turing

El pasado 20 de agosto de 2018 se iniciaba la era Turing. En NVIDIA nos presentaban la tecnología con todo lujo de detalles, y lo hacían además dedicando toda una jornada —el llamado ‘Editor’s Day’— a desvelarnos los entresijos de esta arquitectura.

En este evento varios de los máximos responsables de NVIDIA desgranaron cada uno de los componentes de una arquitectura que representa un cambio fundamental en algunos apartados frente a lo que ofrecía Pascal.

De hecho en Turing se aprovechan algunas de las fortalezas de Pascal, pero todas ellas se refuerzan para mejorar el rendimiento en el ámbito del gaming. En esta primera parte nos centraremos en el análisis de la arquitectura: ya hemos recibido las tarjetas que nos permitirán evaluar su rendimiento en los próximos días, y será entonces cuando podamos hablar de esos resultados reales que tanta expectación están causando.

Nueva arquitectura, nuevos cores

Tan importante como esos resultados es entender esa arquitectura que debuta con las NVIDIA GeForce RTX 2070, RTX 2080 y RTX 2080 Ti. Y lo primero que hay que entender en Turing es cómo cambian sus núcleos de proceso.

La base de todo ello es el procesador Turing SM (Streaming Multiprocessor), que combina una nueva unidad de ejecución de enteros (INT32) con una unidad para ejecución de números en coma flotante (FP32).

Eso habilita la ejecución de ambos tipos de proceso en paralelo, y según NVIDIA eso permite aumentar en un 36% el rendimiento de las operaciones en coma flotante, sobre todo porque, como nos explicaron, muchas instrucciones en procesos de todo tipo no son de coma flotante, algo que hacía que anteriores generaciones desaprovechasen ese foco.

A esa combinación se le suma una nueva arquitectura de cachés unificadas que alcanza un ancho de banda que es un 50% superior al de la anterior generación.

Estos chips son los primeros en soportar además memoria GDDR6, otra de las novedades tecnológicas introducidas con las nuevas tarjetas gráficas de NVIDIA. Aunque en NVIDIA consideraron alternativas como HBM2, acabaron decidiéndose por una GDDR6 que entre otras cosas permite alcanzar transferencias de datos de hasta 14 Gbps.

Tensor Cores: a por la inteligencia artificial

Ahí no acaba la cosa, porque junto a dichos cores encontramos a los otros dos núcleos que precisamente plantean esa verdadera revolución en esta arquitectura. El primero de esos núcleos es el llamado Tensor Core, que está orientado a ser un elemento clave para esa otra revolución llamada aprendizaje profundo (deep learning) que en NVIDIA llevan tiempo poniendo como pilar de su futuro.

Este tipo de cores plantea un cambio radical en ámbitos como la clasificación de imágenes, que hasta no hace mucho era una tarea especialmente exigente en recursos y tiempo. Con deep learning todo cambió de forma notable, porque se permite poder realizar operaciones sobre matrices enormes.

Como indicaban en aquella presentación, estos Tensor Core permiten alcanzar hasta 114 TFLOPS de operaciones FP16, hasta 228 TOPS INT8 y hasta 455 TOPS INT4, cifras que como decimos multiplican hasta por 8 las que se conseguían con GPUs de la era Pascal.

En Pascal esas operaciones eran ineficientes, pero gracias a estos Tensor Cores es posible lograr 8 veces el rendimiento de proceso en esas operaciones con Turing.

RT Cores: el ray-tracing llega a la informática de consumo

Reservado hasta ahora a los grandes estudios de cine y de diseño y animación 3D, la tecnología de ray-tracing o trazado de rayos da su primer paso en el segmento de consumo, tanto en el ámbito del gamingcomo en otros muchos en los que podría ser aplicado para que asistamos a esa esperada revolución del fotorrealismo.

Es ahí donde entran los llamados RT Cores, los núcleos en los que NVIDIA llevaba trabajando literalmente años pero que por limitaciones tecnológicas jamás se habían podido integrar en un procesador gráfico convencional.

El algoritmo BVH (Bounding Volume Hierarchy) era una de las claves a la hora de resolver el problema del trazado de rayos, que en anteriores generaciones de gráficas de NVIDIA se resolvía con ese algoritmo y emulación software.

Ese tratamiento del trazado de rayos en Pascal era ineficiente, complejo y difícl, pero con Turing y estos RT Cores esas tareas multiplican su rendimiento en este ámbito de forma asombrosa. Según las pruebas internas de NVIDIA, una 2080 Ti es 10 veces más rápida que una 1080 Ti en este tipo de escenarios.

En esa aceleración hardware intervienen los nuevos Mesh Renderers, que permiten calcular muchos más objetos para renderizar en paralelo que antes. Esa inteligencia que aportan estos RT Cores permite además que se “dibujen” muchos menos triángulos de los que hay realmente en la escena gracias a su trabajo con los Mesh Shaders.

Related posts

Leave a Comment