Nvidia прискорює розробку автономного водіння за допомогою нових відкритих моделей ШІ

2

У понеділок Nvidia представила серію нових моделей ШІ та інструментів для розробників, призначених для прискорення досліджень автономних транспортних засобів і фізичного ШІ. Ключовим елементом оголошення є Alpamayo-R1, мовна модель бачення з відкритим кодом, спеціально розроблена для розробки безпілотних автомобілів. Це знаменує значний крок вперед у забезпеченні транспортних засобів здатністю розуміти навколишнє середовище та приймати людські рішення.

Розквіт «фізичного ШІ»

Акцент на автономне водіння є частиною ширшої стратегії Nvidia щодо домінування у новій сфері «фізичного ШІ». За словами генерального директора Nvidia Дженсена Хуанга, наступна велика хвиля штучного інтелекту вийде за рамки програмного забезпечення та охопить фізичний світ, охоплюючи роботів, автономні системи та транспортні засоби, які взаємодіють із реальністю. Ось чому Nvidia інвестує значні кошти в фундаментальні технології для цих систем, включаючи графічні процесори та моделі ШІ, які їх підтримують.

Alpamayo-R1: поєднання бачення та міркування

Alpamayo-R1 унікальний тим, що це перша модель мовного бачення, адаптована для автономного водіння. На відміну від основного розпізнавання зображень, ця модель може обробляти і текстові, і візуальні дані одночасно. Це означає, що автомобіль, який використовує Alpamayo-R1, може «бачити» знак зупинки, читати текст на дорожньому знаку та інтерпретувати об’єднану інформацію для прийняття відповідних рішень.

Модель базується на існуючій архітектурі Nvidia Cosmos-Reason, ШІ для міркування, вперше випущеній у січні 2025 року. Cosmos дозволяє системам ШІ думати про рішення, перш ніж діяти, імітуючи вирішення проблем людиною. Ця здатність має вирішальне значення для досягнення автономії 4 рівня, коли транспортні засоби можуть працювати незалежно в певних умовах.

Підтримка розробників: Cosmos Cookbook

Щоб допомогти розробникам інтегрувати ці інструменти ШІ у свої проекти, Nvidia випустила Cosmos Cookbook на GitHub. Цей ресурс містить покрокові інструкції, інструменти логічного висновку та робочі процеси постобробки для контролю даних, генерації синтетичних даних і оцінки моделі. Nvidia прагне зробити ці інструменти максимально доступними.

Чому це важливо

Розробка вдосконаленого штучного інтелекту для автономного водіння — це не просто питання зручності; це питання безпеки та масштабованості. Сучасним системам самоврядування важко справлятися з крайніми випадками та непередбачуваними сценаріями. Така модель міркування, як Alpamayo-R1, може допомогти автомобілям надійніше орієнтуватися в складних ситуаціях, наближаючи справжню автономію рівня 4 до реальності.

Відкритий доступ до цих інструментів також важливий, оскільки він заохочує співпрацю та швидкі інновації в спільноті автономного водіння. Цей крок Nvidia свідчить про її прагнення формувати майбутнє мобільності, керованої ШІ.

Агресивний поштовх Nvidia до фізичного штучного інтелекту підкреслює її довгострокове бачення бути постачальником базових технологій для наступного покоління інтелектуальних систем. Керівництво компанії, в тому числі головний науковий співробітник Білл Деллі, вважає, що робототехніка та автоматизація на основі ШІ стануть домінуючою силою в найближчі роки, і Nvidia має намір бути в центрі цієї трансформації.