Google представила очки с ИИ: изображение пока нечеткое, но будущее уже близко

21

Google в эти дни представил на конференции I/O свои новые очки с искусственным интеллектом. Речь не об аудиоверсии. Это полноценное устройство. Оно объединяет звук и дисплей. Компания хочет выводить информацию прямо перед глазами. Не просто на экран смартфона, а прямо перед собой.

Конструкция выглядит сырой

Нам удалось пощупать устройство. Не ждите гладкого и отполированного пластика. Это прототип. И довольно грубый. Ощущение такое, будто кто-то приклеил внутренности будущего продукта к обычной оправе от Warby Parker. Отказались от эстетики ради емкости батареи и технологий дисплея. Это понятно. Но устройство еще не готово для уличной жизни. Даже близко нет.

Очки не всегда понимают: они на вашем лице или лежат на столе. Раздражает. Но сейчас мы смотрим сквозь пальцы на неудобную посадку.

Интересен и альянс. Samsung, Warby Parker и Gentle Monster. Google отвечает за «мозги», партнеры — за стиль. Аудиоверсия появится в продаже этой осенью. А эта «визуальная машина»? До нее еще далеко. Но она работает с iOS. Это обнадеживает. Пока нет «налога Apple».

Странная активация

Как поговорить с ИИ? Сильно нажмите правой дужкой на висок. Удерживайте две секунды. Вы услышите сигнал. Gemini прислушивается. А в этой демонстрационной версии камера включается автоматически. Жутковато? Возможно. В финальной версии это, вероятно, можно будет отключить.

Чтобы выключить музыку? Одиночное нажатие на дужку. Как будто щелчок по вене.

Качество звука: «Достаточно хорошо»

Мы попросили включить музыку. В помещении было шумно. Ужасная акустика. Я выкрутил громкость на максимум. Вокал все равно еле слышался. Звук четкий и ясный. Но не берите их на концерт. Не заменяйте ими AirPods.

Используйте их для прогулок, походов или уборки в гараже. Главный плюс? Свободные уши. Кто-то может заговорить с вами, и вам не придется искать кнопку прозрачного режима на AirPods Pro. Ситуационная осведомленность встроена в концепцию.

Изображение мутное

Один дисплей. Только над правым глазом. Появляется главный экран. Виджет погоды. Обратный отсчет до конца конференции. Это начало. Можно создать быстрые ярлыки для карт или переводчика, если очень хочется.

Само изображение? Немного мутное. Размытое. Возможно, виноваты мои контактные линзы с разной диоптрией: одна для близи, другая для дали. Когда я щурился и закрывал левый глаз, картинка становилась четче. Потом заболела лобная часть головы. Напряжение глаз нарастает быстро. Посмотрим, как это изменится в серийном производстве.

Магия перевода

Это было главным достижением. Абсолютным хитом.

Демонстратор говорил на быстром испанском. Быстро и агрессивно. Очки уловили речь. Определили язык. И вывели перевод на сетчатку глаза текстом на английском. Одновременно Gemini озвучивал речь мне в ухо.

Представьте, что вы гуляете по Токио или Барселоне с этим устройством. Не нужно открывать приложение. Не нужно переключаться между экранами. Просто понимание.

«Сделай фото и преврати этого человека в персонажа аниме».

Можно сказать это. Просто так. Очки делают снимок. Отправляют его в облако (здесь задействованы серверы Nano Banana, не спрашивайте). Вы ждете 45 секунд (Wi-Fi на I/O был ужасным, помните). И bam. У вас есть аниме-версия вас. Отправленная на телефон. Работает. Медленно. Но работает.

Навигация без экрана

Мы не могли выйти на улицу. Безопасность не разрешила. Но мы видели, как работает Google Карты.

«Повези меня за кофе». Достаточно этого. Даже такая неопределенность? Работает.

Gemini связывается с картами на вашем телефоне. Есть задержка. Краткая пауза. Затем направления появляются в периферийном зрении. Смотрите вперед, видите поворот. Смотрите вниз на обувь? Там карта с вашей синей точкой. Крутите головой влево и вправо? Карта поворачивается вместе с вами. Вы ориентируетесь, поднимаете взгляд и продолжаете движение. Карта не закрывает обзор. Она уступает место. Это изобретательно. Сохраненные места вроде «Дом» тоже на месте. Настройка не требуется заново.

Распознавание объектов (отчасти)

Мы попробовали указать на репродукцию картины Моне на полке. Не получилось. Камера не активировалась автоматически в демо-программном обеспечении. Пришлось возиться с приложением, чтобы ее разбудить. Затем оно все равно не могло идентифицировать картину, пока мы не встали носом к холсту, чтобы рассмотреть подпись.

Растение в горшке оно распознало нормально. Спросили про книгу с рецептами? Прочитала страницу и дала советы. Все это можно сделать через Google Lens уже сегодня. Да. Можно.

Дело не в новизне. А в удобстве. Не нужно рыться в сумке, полной ключей и чеков, чтобы достать телефон. Просто смотри и спрашивай.

Почему сейчас выходят аудиоочки

Google признает, что они еще не готовы. Пока нет. Технологии дисплея сложны. Meta активно продвигается. Snap тоже. Возможно, Google играет в четырехмерные шахматы?

Они запускают очки с акцентом на аудио первыми. Хитрый ход. Они выпускают железо, обучают пользователей голосовым командам, развивают экосистему приложений. Когда экраны наконец заработают как надо? Вы уже привыкли.

Аудиоочки все равно могут делать все, что демонстрировало тестовое устройство, за исключением визуальной части. Готовить ужин? Спросите, готова ли курица. Камера видит, ИИ отвечает. Добавить продукты из фотографии рецепта в список? Готово. Это контекстный компьютер. Умный компаньон, который носит на лице.

Тестирование откроют позже в этом году. А пока? Следите за аудиоверсией. Это троянский конь. А версия с экраном? Она идет. С размытым фокусом и всем остальным.

Меняет ли это способ, которым вы видите мир? Пока нет. Но это уже достаточно близко, чтобы пристально всматриваться.