Објављено: 20. марта 2025. / Ажурирано: 20. марта 2025. – Аутор: Konrad Wolfenstein

Google Gemini 2.0, Вештачка интелигенција и роботика: Gemini Robotics и Gemini Robotics-ER – Креативна слика: Xpert.Digital
DeepMind представља Gemini: Почиње следећа ера роботике
Gemini Robotics: Гуглова трансформативна фузија вештачке интелигенције и роботике
Дана 12. марта 2025. године, компанија Google DeepMind представила је свој најновији пројекат, Gemini Robotics, импресивну технологију која комбинује моћни језички модел Gemini 2.0 са напредном роботиком. Ова иновација означава значајну прекретницу у развоју интелигентних роботских система способних да разумеју природни језик и обављају сложене физичке задатке.
Гугл ДипМајнд је водећа компанија за истраживање вештачке интелигенције (ВИ), основана 2010. године, а коју је Гугл купио 2014. године. Фокусира се на развој напредних ВИ технологија које карактеришу неуронске мреже са краткорочним складиштењем и вештачком меморијом. ДипМајнд је постигао значајне продоре, укључујући победу над људским играчима у игри Го и развој АлфаФолда, система за предвиђање структура протеина. ДипМајндове технологије се примењују у областима као што су роботика, медицина, енергетска ефикасност и обрада природног језика.
Технолошке основе Gemini Robotics-а
Џемини Роботикс је дизајниран као напредни модел Визија-Језик-Акција (VLA), надовезујући се на већ моћни Џемини 2.0. Кључна иновација је да систем не само да може да обрађује дигиталне податке као што су текст, слике или видео снимци, већ по први пут и да изводи физичке радње у стварном свету.
Технологија користи могућности мултимодалног разумевања Gemini 2.0 и проширује их тако да укључују кључни нови модалитет: физичке акције. Ово омогућава роботима да премосте дигитални и физички свет на начин који је раније био немогућ.
У вези са овим:
- Гуглова Gemini платформа са Google AI Studio-ом, Google Deep Research са Gemini Advanced-ом и Google DeepMind-ом
Функционисање и перцептивне способности
Технолошки пробој компаније Gemini Robotics лежи у њеној способности да опажа своје окружење путем камера, препознаје објекте и снима њихове просторне димензије. Ове информације се затим трансформишу у 3Д свет са прецизним техничким координатама.
Систем такође може:
- Разумевање команди природног језика и њихово превођење у физичке радње
- Разумевање сложених просторних односа између објеката
- Прилагођавање новим, непознатим ситуацијама
- генерализовање различитих типова робота
Два комплементарна модела: Gemini Robotics и Gemini Robotics-ER
Гугл ДипМајнд је представио не један, већ два специјализована модела који се баве различитим аспектима роботичке вештачке интелигенције.
Gemini Robotics
Главни модел Gemini Robotics комбинује могућности обраде говора Gemini 2.0 са физичком контролом. Омогућава роботима да реагују на команде природног језика, разумеју сложена окружења и извршавају адаптивне радње.
Gemini Robotics-ER
Други модел, Gemini Robotics-ER (где ER означава „отеловљено резоновање“), фокусира се на побољшано просторно резоновање. Ова способност је кључна за роботе који морају да раде у динамичним, тродимензионалним окружењима.
На пример, Gemini Robotics-ER може интуитивно препознати најбољи начин за хватање предмета. Ако се моделу прикаже шоља кафе, он може самостално да изабере одговарајући хват са два прста да би подигао шољу за дршку и израчунао безбедан низ покрета.
Доказане вештине и практичне примене
У импресивним демонстрационим видео записима, Google DeepMind приказује практичне могућности својих нових вештачких интелигенција. Роботски системи могу да обављају широк спектар сложених задатака, укључујући:
- Савијање оригамија и папира
- Сортирање и организовање предмета на основу вербалних инструкција
- Прецизно хватање и померање крхких предмета
- Пажљиво стављање наочара у кутијицу
- Бацање коцкица и манипулисање малим предметима
- Затварање рајсфершлуса заједно
- Намотавање каблова за слушалице
- Извршавање прецизних задатака као што су закуцавања у кошарци
Посебно је запањујуће то што роботи обављају ове задатке аутономно након што приме само једну инструкцију. Систем самостално препознаје објекте, идентификује их, изводи потребне појединачне кораке и сходно томе контролише роботске руке.
Стратешка партнерства за даљи развој
Да би откључао пуни потенцијал ове технологије, Google DeepMind сарађује са водећим компанијама у индустрији роботике:
- Аптроник, стартап компанија са седиштем у Тексасу, развила је хуманоидног робота „Аполо“, дизајнираног за логистичке и производне задатке као што су подизање, премештање и слагање кутија
- Бостон Дајнамикс, позната компанија за роботику коју је иронично једном купио Гугл, а касније поново продао
- Agility Robotics и Agile Robots као додатни партнери за развој и тестирање Gemini Robotics-ER
Ова сарадња демонстрира Гуглову стратегију имплементације и тестирања технологије на различитим роботским платформама како би се осигурала њена широка применљивост.
У вези са овим:
Значај за будућност роботике
Директор роботике у компанији DeepMind, Канишка Рао, објаснио је током конференције за новинаре да је један од највећих изазова у роботици то што роботи обично добро функционишу у познатим сценаријима, али не успевају у непознатим ситуацијама. Gemini Robotics има за циљ да реши управо тај проблем.
У вези са овим:
- Контрола устајања хуманоида: Са „HoST-ом“, хуманоиди уче да устају – пробој за роботе у свакодневном животу
Интеграција великих језичких модела (LLM) у роботику је део растућег тренда, а приступ компаније Gemini могао би бити један од најупечатљивијих примера тога. Јан Липхарт, професор биоинжењеринга на Универзитету Станфорд и оснивач компаније OpenMind, наглашава да је ово „један од првих примера примене генеративне вештачке интелигенције и великих језичких модела на напредне роботе“ и да би ово „заиста могло бити кључ за откључавање робота-наставника, робота-помоћника и робота-пратилаца“.
Генерални директор компаније Нвидија, Јенсен Хуанг, иде још даље, сугеришући да би употреба генеративне вештачке интелигенције за распоређивање робота у великим размерама могла представљати тржишни потенцијал од неколико билиона америчких долара.
Близанци и роботика: Прекретница за интелигентне системе?
Упркос импресивном напретку, изазови остају. Кен Голдберг, професор роботике на Универзитету Калифорније у Берклију, описује системе вештачке интелигенције као „узбудљив развој у области роботике“, али упозорава да „још много посла треба урадити пре него што роботи опште намене буду спремни за свакодневну употребу“.
Гугл планира да пружи додатни увид у могућности ове технологије око предстојеће конференције Гугл I/O. Са својим дугогодишњим интересовањем за роботику, а сада и са Џеминијем као одговарајућом софтверском компонентом, Гугл би могао да отвори ново поглавље у развоју интелигентних робота.
Од речи до дела: Гугл поставља нове стандарде у роботици
Са Gemini Robotics, Google DeepMind је направио значајан корак ка спајању вештачке интелигенције и роботике. Његова способност да разуме природни језик, перципира сложена окружења и обавља физичке радње могла би револуционисати начин коришћења робота у будућности.
Ова технологија означава прелаз са чисто дигиталних вештачких интелигенција на системе који могу имати директан утицај на физички свет. Иако ово може изазвати забринутост код неких скептика према вештачкој интелигенцији, примарни фокус компаније Google DeepMind је на развоју адаптивних и корисних роботских система који могу да обављају сложене задатке уз мање обуке.
Наредне године ће показати како ће се ова технологија развијати и какве ће практичне примене пронаћи у различитим областима, од индустрије до свакодневног живота.
У вези са овим:
Ваш глобални партнер за маркетинг и развој пословања
☑️ Наш пословни језик је енглески или немачки
☑️ НОВО: Преписка на вашем матерњем језику!
Ја и мој тим смо срећни што вам можемо бити на располагању као ваш лични саветник.
Можете ме контактирати попуњавањем контакт форме овде или једноставно позовите на +49 89 89 674 804 ( Минхен) . Моја имејл адреса је: [email protected]
Радујем се нашем заједничком пројекту.














