Nvidia представила ряд новых AI-моделей и инструментов для разработчиков в понедельник, разработанных для ускорения исследований в области автономных транспортных средств и физического AI. Ключевым элементом анонса является Alpamayo-R1, открытая модель языка зрения, специально разработанная для разработки автомобилей с автономным управлением. Это знаменует собой значительный шаг вперед в оснащении транспортных средств способностью понимать окружающую среду и принимать решения, подобные человеческим.
Расцвет «Физического AI»
Нацеленность на автономное вождение является частью более широкой стратегии Nvidia по доминированию в развивающейся области «физического AI». Как заявил генеральный директор Nvidia Дженсен Хуанг, следующая крупная волна AI выйдет за рамки программного обеспечения и проникнет в физический мир, охватывая роботов, автономные системы и транспортные средства, взаимодействующие с реальностью. Именно поэтому Nvidia активно инвестирует в фундаментальные технологии для этих систем, включая графические процессоры и AI-модели, которые их поддерживают.
Alpamayo-R1: Зрение и Рассуждение в Комбинации
Alpamayo-R1 уникален тем, что является первой моделью действия языка зрения, адаптированной для автономного вождения. В отличие от базового распознавания изображений, эта модель может одновременно обрабатывать как текст, так и визуальные данные. Это означает, что автомобиль, использующий Alpamayo-R1, может «видеть» знак «Стоп», читать текст на дорожном знаке и интерпретировать объединенную информацию для принятия соответствующих решений.
Модель основана на существующей архитектуре Cosmos-Reason от Nvidia, AI для рассуждений, впервые выпущенной в январе 2025 года. Cosmos позволяет AI-системам обдумывать решения, прежде чем действовать, имитируя человеческое решение проблем. Эта возможность критически важна для достижения автономии уровня 4, при которой транспортные средства могут работать независимо в определенных средах.
Поддержка Разработчиков: Cosmos Cookbook
Чтобы помочь разработчикам интегрировать эти AI-инструменты в свои проекты, Nvidia выпустила Cosmos Cookbook на GitHub. Этот ресурс предоставляет пошаговые инструкции, инструменты вывода и рабочие процессы постобработки для курирования данных, генерации синтетических данных и оценки моделей. Nvidia стремится сделать эти инструменты максимально доступными.
Почему Это Важно
Разработка продвинутого AI для автономного вождения — это не просто вопрос удобства; это вопрос безопасности и масштабируемости. Современные системы самоуправления испытывают трудности с крайними случаями и непредсказуемыми сценариями. Модель рассуждений, такая как Alpamayo-R1, может помочь автомобилям более надежно ориентироваться в сложных ситуациях, приближая настоящую автономию уровня 4 к реальности.
Открытый исходный код этих инструментов также важен, поскольку способствует сотрудничеству и быстрым инновациям в сообществе автономного вождения. Этот шаг Nvidia сигнализирует об ее приверженности формированию будущего AI-управляемой мобильности.
Агрессивное продвижение Nvidia в области физического AI подчеркивает ее долгосрочное видение: быть поставщиком фундаментальных технологий для следующего поколения интеллектуальных систем. Руководство компании, включая главного ученого Билла Далли, считает, что робототехника и автоматизация на базе AI станут доминирующей силой в ближайшие годы, и Nvidia намерена быть в центре этой трансформации.







































