
Стратегія Google щодо розумних окулярів з Project Astra та Gemini Live: Нова ера візуальної допомоги ШІ від Google – Зображення: Xpert.Digital
Розумні окуляри з родзинкою: бачення Google нової ери технологій
Зміна парадигми на горизонті: шлях Google до розумного штучного інтелекту в повсякденному житті
Google знаходиться на порозі значної технологічної еволюції в галузі носимих технологій. Нещодавні розробки з Gemini Live, у поєднанні з конкретними планами щодо нових розумних окулярів, вказують на неминучу зміну парадигми, яка може докорінно змінити те, як ми взаємодіємо зі штучним інтелектом. Інтеграція можливостей візуального розпізнавання в Gemini Live на смартфонах забезпечує технологічну основу для майбутніх рішень для розумних окулярів і знаменує собою стратегічний поворотний момент у баченні Google щодо повсюдної допомоги штучного інтелекту в повсякденному житті.
Підходить для цього:
Друга спроба: повернення Google на ринок розумних окулярів
Перший прорив Google у розробці розумних окулярів датується понад десятьма роками. Google Glass, представлені у 2012 році та зняті з виробництва у 2015 році, випереджали свій час у багатьох відношеннях. Вагою всього 42 грами, окуляри були відносно легкими, але мали практичні обмеження, такі як короткий час роботи від батареї – лише дві-три години – явно недостатньо для продуктивного робочого дня. Крім того, їм бракувало вирішального елемента, який міг би зробити сучасні розумні окуляри революційними: передового генеративного штучного інтелекту.
Після комерційного провалу Google Glass компанія зосередилася на корпоративних додатках і значною мірою відійшла від споживчого ринку. Тим часом сама технологія продовжувала розвиватися. Придбання Google компанії North, виробника розумних окулярів Focal, кілька років тому вже свідчило про стійкий інтерес до цієї категорії продуктів. Нові розумні окуляри, які зараз розробляє Google, мають бути значно тоншими та зручнішими за Focal, таким чином враховуючи досвід попередніх поколінь.
Нещодавні повідомлення свідчать про те, що Google веде переговори з відомими виробниками окулярів, такими як EssilorLuxottica, якій також належить Ray-Ban. Цей стратегічний крок може допомогти Google обійти одну з головних проблем Google Glass: його недостатнє сприйняття модою. Ray-Ban вже має досвід роботи з розумними сонцезахисними окулярами завдяки співпраці з Meta. Ці партнерства можуть бути вирішальними для позиціонування нових розумних окулярів як модного аксесуару, а не як яскравої демонстрації технологій.
Підходить для цього:
Проект Astra: основа для візуальної допомоги Google на базі штучного інтелекту
В основі стратегії Google щодо розумних окулярів лежить «Проект Astra» — амбітний дослідницький проєкт із розробки універсального візуального помічника на базі штучного інтелекту. Google вперше продемонстрував Проєкт Astra на своїй конференції розробників I/O у травні 2024 року, продемонструвавши вражаючу технічну демонстрацію, яка підкреслила потенціал візуальної допомоги на базі штучного інтелекту.
В рамках значної організаційної реструктуризації Google нещодавно інтегрувала команду Project Astra з командою Gemini. Це злиття підкреслює центральну роль Gemini у баченні Google щодо розумних окулярів і демонструє, що обидві технології розглядаються як частина єдиної стратегії. У Gemini команда Astra зосередиться саме на живих функціях, подальшому розвитку візуальної складової Gemini.
Технологічна основа проекту Astra надзвичайно просунута. На відміну від Google Glass, який десять років тому був радше футуристичним баченням, ніж зрілим продуктом, проект Astra базується на реалістичних технологіях, які вже доступні сьогодні. Демонстрація на Google I/O показала, як користувач може бачити своє оточення через розумні окуляри та одночасно розмовляти про нього з помічником на базі штучного інтелекту. Те, що одинадцять років тому вважалося бажаним за дійсне, тепер технічно здійсненне.
Gemini Live: Міст між смартфоном та розумними окулярами
Найновіші розробки Gemini Live утворюють важливий місток між сучасними додатками для смартфонів та майбутніми розумними окулярами. У березні 2025 року Google оголосила про значні покращення Gemini Live, насамперед покращивши візуальні можливості помічника зі штучним інтелектом.
Нові функції включають введення відео в реальному часі та спільний доступ до екрана, що дозволяє користувачам спілкуватися з Gemini про те, що вони бачать, у режимі реального часу. Ці функції працюють на базі Gemini 2.0 Flash, версії мультимодальної моделі, спеціально оптимізованої для швидких мобільних додатків. Починаючи з кінця березня 2025 року, ці функції будуть доступні для передплатників Gemini Advanced на пристроях Android у рамках плану Google One AI Premium.
Спосіб роботи цих нових функцій надзвичайно інтуїтивний: користувачі можуть направити камеру свого смартфона на цікавий об'єкт і безпосередньо поставити Gemini запитання про нього. Помічник зі штучним інтелектом аналізує відеозображення в режимі реального часу та надає контекстну інформацію. Користувачі також можуть ділитися своїм екраном з Gemini та обговорювати побачене, взаємодіючи з ботом зі штучним інтелектом на своєму смартфоні.
Ці функції не слід розглядати лише як окремі особливості смартфона, а радше як прямий попередник запланованої функціональності розумних окулярів. Сам Google чітко пояснює цей зв’язок: «Gemini Live, з його візуальним компонентом, є, по суті, інтерфейсом, який Google має намір використовувати для розумних окулярів найближчим часом». Ключова відмінність між застосунком для смартфона та розумними окулярами зрештою полягає лише в тому, чи використовується спільний дисплей смартфона, чи зображення з камери розумних окулярів – базова технологія ідентична.
Майбутні розумні окуляри від Google
Очікується, що нові розумні окуляри Google стануть значним кроком уперед порівняно з попередніми спробами. Gemini слугуватимуть центральним елементом, постійно доступним для користувачів через аудіо та візуальний зворотний зв'язок. Поле зору користувача для Gemini буде постійно очищене, що дозволить боту зі штучним інтелектом взаємодіяти з користувачем віртуально в реальному світі.
Проєкт «Gemini Sight», поданий на конкурс розробників Gemini API, представив концепції розумних окулярів на базі штучного інтелекту, які можуть бути особливо корисними для незрячих та слабозорих людей. Ці революційні розумні окуляри на базі штучного інтелекту розроблені для безперешкодної інтеграції з сервісами Google та автоматизації різноманітних завдань за допомогою простих голосових команд – від керування календарем та надсилання електронних листів до бронювання столиків у ресторанах.
Деяка група людей вже мала можливість отримати практичний досвід роботи з окулярами Gemini AI. Звіти свідчать, що ці окуляри насправді забезпечують враження від Google Glass, яких Google не міг досягти понад десять років тому. Технологічний прогрес, особливо в галузі генеративного штучного інтелекту, тепер робить можливим те, що колись було лише мрією.
Інтеграція з послугами Google та багатомодальними навичками
Ключовим аспектом майбутніх розумних окулярів є їхня комплексна інтеграція з існуючими сервісами Google. Gemini вже можна підключити до численних програм та сервісів Google, включаючи Gmail, Google Диск, Google Документи, Google Карти, YouTube, Google Авіаквитки та Google Готелі. Ці з’єднання дозволяють Асистенту швидше знаходити відповідну інформацію та автоматизувати складні завдання.
Мультимодальні можливості Gemini Live постійно розширюються. Спочатку Gemini Live був доступний лише англійською мовою, але тепер підтримує понад 45 мов, включаючи німецьку. Ця лінгвістична універсальність є ключовим кроком до глобального запуску розумних окулярів. Особливої уваги заслуговує можливість вести розмови двома мовами на одному пристрої та навіть перемикатися між мовами посеред речення.
Візуальні можливості Gemini Live виходять далеко за рамки простого аналізу зображень. Користувачі можуть завантажувати фотографії або переглядати відео на YouTube та одночасно обговорювати їх з Gemini. За допомогою відео Gemini може узагальнювати вміст і відповідати на пов'язані запитання, наприклад, щодо огляду продукту на YouTube. За допомогою PDF-файлів штучний інтелект може не лише узагальнювати та відповідати на запитання, але й створювати вікторини для перевірки знань користувачів.
Підходить для цього:
- Переваги режиму Google AI порівняно з іншими продуктами пошуку AI, такими як здивування AI та пошуку Chatgpt OpenAI
Ринковий потенціал та вплив на суспільство
Ринковий потенціал для розумних окулярів на базі штучного інтелекту величезний. Хоча Google Glass зазнали невдачі переважно через проблеми конфіденційності та практичної зручності використання, інтеграція Gemini могла б частково подолати ці проблеми. Практичне застосування різноманітне, починаючи від повсякденних допоміжних засобів та спеціалізованих професійних програм і закінчуючи допоміжними системами для людей з інвалідністю.
Тим не менш, залишаються важливі питання, зокрема щодо конфіденційності даних. Постійне використання поля зору штучного інтелекту породжує нові етичні та правові питання, які Google має вирішити, щоб досягти ширшого визнання, ніж у випадку з Google Glass. Співпраця з відомими виробниками окулярів може допомогти зробити технологію більш витонченою та соціально прийнятною.
Google веде жорстку конкуренцію з іншими технологічними компаніями у сфері доповненої реальності. У той час як Apple прагне створити більш комплексне рішення XR зі своїм Vision Pro, Google зосереджується на легшій, більш повсякденній формі доповненої реальності зі своїми розумними окулярами. Google також оголосила про розробку Android XR, платформи, призначеної для підтримки як розумних окулярів, так і більш комплексних VR-гарнітур.
Gemini Live як передвісник нової ери взаємодії людини та штучного інтелекту
Інтеграція візуальних можливостей у Gemini Live знаменує собою вирішальний крок у довгостроковому баченні Google щодо повсюдної допомоги штучного інтелекту. Очікується, що те, що починається зі смартфонів, завершиться майбутніми розумними окулярами. Технологічні основи вже закладені, і Google використовує широке використання смартфонів як полігон для тестування функцій, які згодом будуть реалізовані в розумних окулярах.
Розробка Gemini Live ілюструє стратегічний підхід Google: нові функції штучного інтелекту спочатку впроваджуються, тестуються та оптимізуються на смартфонах, перш ніж інтегруватися в спеціалізоване обладнання, таке як розумні окуляри. Такий поетапний підхід може допомогти Google уникнути помилок минулого та розробити продукт, який є одночасно технологічно зрілим та соціально прийнятним.
Найближчі місяці покажуть, наскільки швидко Google перейде від розширених функцій Gemini Live на смартфонах до повноцінного рішення для розумних окулярів. Організаційна реструктуризація з інтеграцією команди Project Astra до команди Gemini свідчить про прискорення цього розвитку. Із запуском візуальних можливостей Gemini Live наприкінці березня 2025 року буде закладено вирішальний фундамент, що прокладе шлях для наступного важливого кроку Google у розвитку технологій носимого штучного інтелекту.
Підходить для цього:
Ваш глобальний партнер з маркетингу та розвитку бізнесу
☑ Наша ділова мова - англійська чи німецька
☑ Нове: листування на вашій національній мові!
Я радий бути доступним вам та моїй команді як особистого консультанта.
Ви можете зв’язатися зі мною, заповнивши тут контактну форму або просто зателефонуйте мені за номером +49 89 674 804 (Мюнхен) . Моя електронна адреса: Вольфенштейн ∂ xpert.digital
Я з нетерпінням чекаю нашого спільного проекту.

