Nvidia accelera la guida autonoma con nuovi modelli di intelligenza artificiale aperta

7

Nvidia ha presentato lunedì una suite di nuovi modelli di intelligenza artificiale e strumenti di sviluppo, progettati per accelerare la ricerca sui veicoli autonomi e sui sistemi di intelligenza artificiale fisica. Il fulcro dell’annuncio è Alpamayo-R1, un modello di linguaggio di visione open source specificamente progettato per lo sviluppo di auto a guida autonoma. Ciò segna un significativo passo avanti nel dotare i veicoli della capacità di comprendere l’ambiente circostante e prendere decisioni di guida simili a quelle umane.

L’ascesa dell’”intelligenza artificiale fisica”

La spinta verso la guida autonoma fa parte della più ampia strategia di Nvidia volta a dominare il campo emergente dell’“intelligenza artificiale fisica”. Come ha affermato il CEO di Nvidia Jensen Huang, la prossima grande ondata di intelligenza artificiale si sposterà oltre il software e si estenderà al mondo fisico, comprendendo robot, sistemi autonomi e veicoli che interagiscono con la realtà. Questo è il motivo per cui Nvidia sta investendo molto nella tecnologia di base di questi sistemi, comprese le GPU e i modelli di intelligenza artificiale che li alimentano.

Alpamayo-R1: Visione e Ragionamento Combinati

Alpamayo-R1 è unico perché è il primo modello di azione con linguaggio visivo su misura per la guida autonoma. A differenza del riconoscimento di immagini di base, questo modello può elaborare simultaneamente sia testo che input visivo. Ciò significa che un veicolo che utilizza Alpamayo-R1 può “vedere” un segnale di stop, leggere il testo su un segnale stradale e interpretare le informazioni combinate per prendere le decisioni appropriate.

Il modello si basa sull’architettura Cosmos-Reason esistente di Nvidia, un’intelligenza artificiale ragionata rilasciata per la prima volta nel gennaio 2025. Cosmos consente ai sistemi di intelligenza artificiale di riflettere sulle decisioni prima di agire, imitando la risoluzione dei problemi simile a quella umana. Questa capacità è fondamentale per raggiungere il Livello 4 di autonomia, in cui i veicoli possono funzionare in modo indipendente all’interno di ambienti definiti.

Supporto per gli sviluppatori: The Cosmos Cookbook

Per aiutare gli sviluppatori a integrare questi strumenti di intelligenza artificiale nei loro progetti, Nvidia ha rilasciato il Cosmos Cookbook su GitHub. Questa risorsa fornisce guide dettagliate, strumenti di inferenza e flussi di lavoro post-formazione per la cura dei dati, la generazione di dati sintetici e la valutazione dei modelli. Nvidia vuole rendere questi strumenti il ​​più accessibili possibile.

Perché è importante

Lo sviluppo dell’intelligenza artificiale avanzata per la guida autonoma non è solo una questione di comodità; si tratta di sicurezza e scalabilità. Gli attuali sistemi di guida autonoma lottano con casi limite e scenari imprevedibili. Un modello di ragionamento come Alpamayo-R1 potrebbe aiutare i veicoli a navigare in situazioni complesse in modo più affidabile, avvicinando la vera autonomia di livello 4 alla realtà.

Anche la natura open source di questi strumenti è importante, poiché favorisce la collaborazione e la rapida innovazione all’interno della comunità della guida autonoma. La mossa di Nvidia segnala l’impegno a dare forma al futuro della mobilità basata sull’intelligenza artificiale.

La spinta aggressiva di Nvidia verso l’intelligenza artificiale fisica sottolinea la sua visione a lungo termine: essere il fornitore di tecnologia fondamentale per la prossima generazione di sistemi intelligenti. La leadership dell’azienda, compreso il capo scienziato Bill Dally, ritiene che la robotica e l’automazione basata sull’intelligenza artificiale diventeranno una forza dominante nei prossimi anni, e Nvidia intende essere al centro di questa trasformazione.