W poniedziałek Nvidia zaprezentowała serię nowych modeli sztucznej inteligencji i narzędzi programistycznych, których zadaniem jest przyspieszenie badań nad pojazdami autonomicznymi i fizyczną sztuczną inteligencją. Kluczowym elementem ogłoszenia jest Alpamayo-R1, model języka wizyjnego o otwartym kodzie źródłowym, zaprojektowany specjalnie do opracowywania samochodów autonomicznych. Oznacza to znaczący krok naprzód w wyposażaniu pojazdów w zdolność rozumienia otoczenia i podejmowania decyzji na poziomie ludzkim.
Powstanie „fizycznej sztucznej inteligencji”
Skupienie się na jeździe autonomicznej jest częścią szerszej strategii Nvidii mającej na celu zdominowanie wyłaniającej się dziedziny „fizycznej sztucznej inteligencji”. Następna wielka fala sztucznej inteligencji wykroczy poza oprogramowanie i wkroczy do świata fizycznego, obejmując roboty, systemy autonomiczne i pojazdy wchodzące w interakcję z rzeczywistością, powiedział dyrektor generalny Nvidii, Jensen Huang. Dlatego Nvidia mocno inwestuje w podstawowe technologie dla tych systemów, w tym w procesory graficzne i modele AI, które je obsługują.
Alpamayo-R1: połączenie wizji i rozumowania
Alpamayo-R1 jest wyjątkowy, ponieważ jest pierwszym modelem działania opartym na języku wizyjnym przystosowanym do jazdy autonomicznej. W przeciwieństwie do podstawowego rozpoznawania obrazu, model ten może jednocześnie przetwarzać zarówno dane tekstowe, jak i wizualne. Oznacza to, że samochód korzystający z Alpamayo-R1 może „zobaczyć” znak stopu, przeczytać tekst na znaku drogowym i zinterpretować połączone informacje w celu podjęcia właściwych decyzji.
Model opiera się na istniejącej architekturze Cosmos-Reason firmy Nvidia, sztucznej inteligencji do wnioskowania, wydanej po raz pierwszy w styczniu 2025 r. Cosmos umożliwia systemom AI myślenie o rozwiązaniach przed podjęciem działań, naśladując rozwiązywanie problemów przez człowieka. Ta zdolność ma kluczowe znaczenie dla osiągnięcia autonomii poziomu 4, w którym pojazdy mogą działać niezależnie w określonych środowiskach.
Wsparcie dla programistów: Książka kucharska Cosmos
Aby pomóc programistom zintegrować te narzędzia AI ze swoimi projektami, Nvidia udostępniła Cosmos Cookbook w serwisie GitHub. Ten zasób zawiera instrukcje krok po kroku, narzędzia do wnioskowania i przepływy pracy przetwarzania końcowego w celu sprawdzania danych, generowania danych syntetycznych i oceny modelu. Nvidia dokłada wszelkich starań, aby narzędzia te były jak najbardziej dostępne.
Dlaczego to jest ważne
Opracowywanie zaawansowanej sztucznej inteligencji na potrzeby jazdy autonomicznej to nie tylko kwestia wygody; to kwestia bezpieczeństwa i skalowalności. Współczesne systemy samorządowe mają trudności z radzeniem sobie z skrajnymi przypadkami i nieprzewidywalnymi scenariuszami. Model rozumowania, taki jak Alpamayo-R1, może pomóc samochodom w bardziej niezawodnym radzeniu sobie ze złożonymi sytuacjami, przybliżając do rzeczywistości prawdziwą autonomię na poziomie 4.
Otwarte pozyskiwanie tych narzędzi jest również ważne, ponieważ zachęca do współpracy i szybkich innowacji w społeczności kierowców autonomicznych. Posunięcie Nvidii sygnalizuje jej zaangażowanie w kształtowanie przyszłości mobilności opartej na sztucznej inteligencji.
Agresywne podejście Nvidii do fizycznej sztucznej inteligencji podkreśla jej długoterminową wizję bycia dostawcą podstawowych technologii dla następnej generacji inteligentnych systemów. Kierownictwo firmy, w tym główny naukowiec Bill Dally, wierzy, że robotyka i automatyzacja oparte na sztucznej inteligencji staną się dominującą siłą w nadchodzących latach, a Nvidia zamierza znaleźć się w centrum tej transformacji.

























