Nvidia Nemotron 3 Super: un nuevo estándar para la IA empresarial

8

Nvidia ha lanzado Nemotron 3 Super, un innovador modelo de lenguaje de 120 mil millones de parámetros diseñado para abordar las crecientes demandas de los sistemas de inteligencia artificial multiagente. Este modelo combina tres arquitecturas distintas: modelos de espacio de estado (Mamba), transformadores y una novedosa mezcla de expertos latentes (LatentMoE), para ofrecer un rendimiento y capacidades de razonamiento sin precedentes y, al mismo tiempo, seguir siendo comercialmente viable bajo una licencia de código abierto modificada.

El desafío de la escala en los agentes de IA

El surgimiento de agentes de IA capaces de manejar tareas complejas y de largo plazo (como ingeniería de software o ciberseguridad) presenta un problema de escala. Estos agentes requieren procesar grandes cantidades de datos, pero los modelos tradicionales luchan por mantener la rentabilidad a esa escala. Nemotron 3 Super de Nvidia aborda directamente este problema optimizando tanto el rendimiento como la eficiencia.

Innovación arquitectónica: un enfoque en tríada

La principal fortaleza de Nemotron 3 Super radica en su arquitectura híbrida. Combina tres tecnologías clave:

  • Hybrid Mamba-Transformer Backbone: Combina la velocidad de los modelos de espacio de estados de Mamba-2 (que manejan el procesamiento de secuencias con complejidad lineal) con la recuperación asociativa precisa de las capas de atención de Transformer. El resultado es un modelo capaz de mantener una ventana de contexto de 1 millón de tokens sin una sobrecarga excesiva de memoria.
  • Mezcla de expertos latentes (LatentMoE): A diferencia de los diseños tradicionales de MoE, LatentMoE comprime los tokens antes de enrutarlos a modelos “expertos” especializados. Esto permite que el sistema consulte cuatro veces más expertos con el mismo costo computacional, crucial para los agentes que cambian entre diversas tareas.
  • Predicción de tokens múltiples (MTP): Nemotron 3 Super predice múltiples tokens futuros simultáneamente, funcionando como un modelo borrador incorporado. Esto acelera las tareas de generación estructurada (como código o llamadas a herramientas) hasta 3 veces.

Optimización de Blackwell: velocidad y eficiencia

El modelo está optimizado para la plataforma GPU Blackwell de Nvidia, previamente entrenado en NVFP4 (punto flotante de 4 bits). Esto produce una velocidad de inferencia 4 veces mayor en comparación con los modelos de 8 bits de la arquitectura Hopper anterior, sin pérdida de precisión.

En las pruebas comparativas, Nemotron 3 Super ocupa actualmente el puesto número 1 en DeepResearch Bench, lo que demuestra su capacidad para realizar investigaciones exhaustivas en grandes conjuntos de documentos. También supera a GPT-OSS-120B y Qwen3.5-122B en rendimiento hasta 2,2x y 7,5x, respectivamente, en entornos de alto volumen.

La licencia de modelo abierto de Nvidia: uso comercial con garantías

El modelo se publica bajo el Acuerdo de licencia de modelo abierto de Nvidia, que permite el uso comercial pero incluye cláusulas críticas de “salvaguardia”. Estas disposiciones protegen a Nvidia de litigios de propiedad intelectual y garantizan que las características de seguridad del modelo no se pasen por alto sin los reemplazos adecuados. Específicamente, la licencia termina si los usuarios desactivan las barreras de seguridad o inician un litigio de derechos de autor/patentes contra Nvidia.

Adopción de la industria e implicaciones futuras

El lanzamiento ha sido recibido con entusiasmo por parte de los desarrolladores y líderes de la industria. Nvidia está implementando el modelo como un microservicio NIM, lo que permite la integración local y basada en la nube a través de Dell AI Factory, HPE, Google Cloud, Oracle, AWS y Azure. Empresas como CodeRabbit, Siemens y Palantir ya están integrando el modelo en los flujos de trabajo de producción.

A medida que los agentes de IA se vuelven más sofisticados, la demanda de modelos de lenguaje eficientes y de alto rendimiento no hará más que aumentar. Nemotron 3 Super representa un importante paso adelante para abordar esta necesidad, proporcionando la “capacidad intelectual” de un modelo grande con la eficiencia operativa de un especialista.