Nvidia acelera la conducción autónoma con nuevos modelos abiertos de IA

10

Nvidia presentó el lunes un conjunto de nuevos modelos de inteligencia artificial y herramientas para desarrolladores, diseñados para acelerar la investigación sobre vehículos autónomos y sistemas físicos de inteligencia artificial. El núcleo del anuncio es Alpamayo-R1, un modelo de lenguaje de visión de código abierto diseñado específicamente para el desarrollo de vehículos autónomos. Esto marca un importante paso adelante en el equipamiento de los vehículos con la capacidad de comprender su entorno y tomar decisiones de conducción similares a las de los humanos.

El auge de la “IA física”

El impulso hacia la conducción autónoma es parte de la estrategia más amplia de Nvidia para dominar el campo emergente de la “IA física”. Como ha declarado el director ejecutivo de Nvidia, Jensen Huang, la próxima gran ola de IA irá más allá del software y entrará en el mundo físico, abarcando robots, sistemas autónomos y vehículos que interactúan con la realidad. Es por eso que Nvidia está invirtiendo fuertemente en la tecnología fundamental para estos sistemas, incluidas las GPU y los modelos de inteligencia artificial que los impulsan.

Alpamayo-R1: Visión y Razonamiento Combinados

Alpamayo-R1 es único porque es el primer modelo de acción, lenguaje y visión diseñado para la conducción autónoma. A diferencia del reconocimiento de imágenes básico, este modelo puede procesar tanto texto como entrada visual simultáneamente. Esto significa que un vehículo que utiliza Alpamayo-R1 puede “ver” una señal de alto, leer el texto de una señal de tráfico e interpretar la información combinada para tomar decisiones adecuadas.

El modelo se basa en la arquitectura Cosmos-Reason existente de Nvidia, una IA de razonamiento lanzada por primera vez en enero de 2025. Cosmos permite que los sistemas de IA piensen en las decisiones antes de actuar, imitando la resolución de problemas similar a la humana. Esta capacidad es fundamental para lograr el Nivel 4 de autonomía, donde los vehículos pueden operar de forma independiente dentro de entornos definidos.

Soporte para desarrolladores: El libro de cocina del Cosmos

Para ayudar a los desarrolladores a integrar estas herramientas de inteligencia artificial en sus proyectos, Nvidia lanzó el Cosmos Cookbook en GitHub. Este recurso proporciona guías paso a paso, herramientas de inferencia y flujos de trabajo posteriores a la capacitación para la curación de datos, la generación de datos sintéticos y la evaluación de modelos. Nvidia quiere que estas herramientas sean lo más accesibles posible.

Por qué esto es importante

El desarrollo de IA avanzada para la conducción autónoma no se trata sólo de conveniencia; se trata de seguridad y escalabilidad. Los sistemas de conducción autónoma actuales luchan con casos extremos y escenarios impredecibles. Un modelo de razonamiento como Alpamayo-R1 podría ayudar a los vehículos a navegar situaciones complejas de manera más confiable, acercando la verdadera autonomía de Nivel 4 a la realidad.

La naturaleza de código abierto de estas herramientas también es importante, ya que fomenta la colaboración y la rápida innovación dentro de la comunidad de conductores autónomos. La medida de Nvidia indica un compromiso para dar forma al futuro de la movilidad impulsada por la IA.

El agresivo impulso de Nvidia hacia la IA física subraya su visión a largo plazo: ser el proveedor de tecnología fundamental para la próxima generación de sistemas inteligentes. Los líderes de la compañía, incluido el científico jefe Bill Dally, creen que la robótica y la automatización impulsada por la inteligencia artificial se convertirán en una fuerza dominante en los próximos años, y Nvidia pretende estar en el centro de esa transformación.