Објављено: 4. марта 2025. / Ажурирано: 4. марта 2025. – Аутор: Konrad Wolfenstein

Google Gemini AI са аналитиком видеа уживо и функционалношћу дељења екрана – Светски мобилни конгрес (MWC) 2025 – Слика: Xpert.Digital
Мултимодална интеракција: Будућност Google AI асистента
Нове вештачке интелигенције: Шта Gemini Boost значи за кориснике
На Светском мобилном конгресу (MWC) 2025 у Барселони, Google је представио значајна побољшања за свог AI асистента Gemini, дизајнираног да побољша корисничко искуство кроз нове визуелне функције. Главни додаци укључују аналитику видеа уживо и могућности дељења екрана, које ће бити доступне претплатницима премијум плана Google One AI крајем марта. Ови развоји представљају важну прекретницу у Google-овој стратегији да дубље интегрише вештачку интелигенцију у свакодневни живот и побољша мултимодалну интеракцију
У вези са овим:
- Вештачка интелигенција и паметни телефони са вештачком интелигенцијом: Самсунгов Галакси АИ на Светском мобилном конгресу у Барселони
Нове визуелне карактеристике за Gemini
Анализа видеа уживо
Једна од најистакнутијих иновација које је Гугл представио на MWC 2025 је функција видео преноса уживо за Џемини. Ова технологија омогућава корисницима да вештачкој интелигенцији у реалном времену прикажу шта снима камера њиховог паметног телефона и да се укључе у природни дијалог. Први пут најављена на Гугловој I/O конференцији у мају 2024. године, функција је сада спремна за лансирање. У демонстрационом видеу који је приказао Гугл, грнчарка усмерава своју камеру ка колекцији керамичких комада и тражи савет од Џеминија о избору боја за своју следећу вазу. Асистент вештачке интелигенције анализира доступне боје и даје информисану препоруку за одговарајућу глазуру.
Ова функција користи Џеминијеве мултимодалне могућности за обраду визуелних информација у реалном времену и њихово тумачење у контексту природног разговора. Део је већег пројекта компаније Гугл, познатог као „Пројекат Астра“, и представља значајан напредак у развоју вештачке интелигенције асистената способних за интеракцију са стварним светом.
Функционалност дељења екрана
Друго важно визуелно побољшање је функција дељења екрана, која омогућава корисницима да деле екран свог паметног телефона са Џеминијем. Када се Џемини интерфејс покрене на Андроиду, појављује се ново дугме са ознаком „Дели екран са уживо“, које омогућава корисницима да деле свој екран са вештачком интелигенцијом (AI) асистентом у реалном времену. Ову функцију допуњује ново обавештење стилизовано под телефонски позив, што омогућава беспрекорну интеграцију у кориснички интерфејс.
У практичним сценаријима примене, Gemini може да користи ову функцију као помоћ при куповини преко интернета, на пример. У демонстрацији, Google показује како корисник може да пита Gemini шта би се добро слагало са фармеркама приказаним на екрану. На основу онога што види, Gemini затим може дати препоруке и водити корисника кроз процес куповине.
Технички детаљи и доступност
Временски оквир за увод
Гугл планира да нове функције преноса уживо и дељења екрана понуди претплатницима Gemini Advanced-а већ у марту 2025. године. Ове функције ће бити понуђене као део Google One AI Premium плана, који кошта 21,99 евра месечно. У почетку ће побољшања бити доступна само за Андроид уређаје, а Пиксел и Самсунг уређаји ће бити међу првима који ће бити подржани.
Интеграција у Gemini Live
Нове визуелне функције су интегрисане у Gemini Live, Google-овог континуираног AI асистента који омогућава разговоре у реалном времену. Gemini Live је ажуриран са Gemini 2.0 Flash, верзијом мултимодалног модела посебно оптимизованом за брзу, мобилну употребу. Занимљиво је да је дељење екрана подржано новим обавештењем стилизованим као телефонски позив, што омогућава беспрекорну интеграцију у корисничко искуство.
Технолошка основа
Нове функције су засноване на Пројекту Астра, Гугловој иницијативи за универзалног, мултимодалног вештачког асистента. Циљ овог пројекта је развој асистента који може да обрађује текстуалне, видео и аудио податке у реалном времену и да их чува у контексту разговора до десет минута. Ова технологија је такође намењена да искористи Гугл претрагу, Објектив и Мапе како би пружила свеобухватно искуство асистента.
У вези са овим:
- Гуглов лични вештачки асистент: Постоје две верзије – Gemini (стандардна верзија) и Gemini Advanced (плаћена премиум верзија)
Близанци у контексту тржишта вештачке интелигенције и асистената
Конкурентно позиционирање
Овим новим визуелним карактеристикама, Google се стратешки позиционира у односу на свог главног конкурента, OpenAI, и његов ChatGPT. ChatGPT-ов напредни гласовни режим подржава дељење уживо и екрана од децембра 2024. године. Интеграцијом ових функција у Gemini Live, Google осигурава да његов AI асистент остане конкурентан и да нуди упоредиве могућности.
Значај за индустрију паметних телефона
Увођење напредних вештачких интелигенција, попут оних које нуди Џемини, могло би имати значајан утицај на индустрију паметних телефона. Након две године пада продаје, током којих су многи потрошачи дуже задржавали своје уређаје, интеграција вештачких интелигенција са побољшаним могућностима могла би створити нове подстицаје за куповину. У Немачкој, према истраживању компаније Битком, само једна од три особе сада поседује уређај млађи од годину дана – што је пад у односу на 55 процената у 2023. години.
Произвођачи паметних телефона користе нове функције вештачке интелигенције као фактор разликовања, јер су уређаји веома слични по изгледу и технологији. На пример, Самсунг демонстрира како агент на свом новом паметном телефону С25 може да обавља задатке у више апликација, док Опо приказује визуелне могућности вештачке интелигенције за обраду слика.
Више новости за Близанце
Побољшана језичка подршка
Поред визуелних карактеристика, Google је проширио и језичке могућности Gemini-ја. Асистент са вештачком интелигенцијом сада може да разуме и говори 45 језика. Једна посебно иновативна карактеристика је његова могућност промене језика усред реченице, без потребе да корисници мењају језичка подешавања свог телефона – „Gemini Live ће разумети и одговорити“.
Нови виџети за кориснике iPhone-а
Иако ће визуелне функције у почетку бити доступне само за Андроид уређаје, Гугл је такође најавио ажурирања за кориснике ајфона. Верзија 1.2025.0762303 апликације Џемини представља шест различитих виџета за закључани екран који омогућавају бржи приступ вештачкој интелигенцији асистенту. Ови виџети укључују опције као што су „Упит за куцање“, „Разговарај са Џемини уживо“, „Отвори микрофон“, „Користи камеру“, „Дели слику“ и „Дели датотеку“. Могу се поставити и на закључани екран и на контролни центар ајфона, што олакшава приступ апликацији Џемини.
Неки посматрачи тумаче овај развој догађаја као покушај да се корисници iPhone-а и iPad-а одврате од Apple-овог гласовног асистента, Siri. Извештаји указују да Apple споро напредује у развоју моћније верзије Siri-ја која може да се такмичи са водећим платформама за вештачку интелигенцију.
Закључак: Значај и перспективе
Ажурирања за Gemini, која је Google представио на MWC 2025, означавају значајан корак у еволуцији вештачке интелигенције. Нове визуелне функције – анализа видеа уживо и дељење екрана – омогућавају интуитивнију и контекстуално свесну интеракцију између корисника и вештачке интелигенције. Оне су део ширег развоја ка мултимодалним асистентима који могу све више да интерагују са стварним светом.
Интеграција ових функција могла би имати далекосежне ефекте у различитим секторима. За индустрију паметних телефона, оне би могле створити нове подстицаје за куповину и помоћи у оживљавању стагнирајућег тржишта. За кориснике, оне отварају нове могућности за коришћење вештачке интелигенције у свакодневном животу, било да је у питању куповина, креативни пројекти или претрага информација.
Истовремено, ови развоји истичу сталну конкуренцију међу великим технолошким компанијама у области вештачке интелигенције (AI) асистената. Google, OpenAI, Apple и други континуирано раде на побољшању својих асистената и опремању њима новим функцијама. Ово подстиче иновације и могло би довести до још моћнијих и интуитивнијих AI асистената у наредним годинама.
Са Пројектом Астра и новим функцијама за Gemini, Google представља своју дугорочну визију за AI асистенте: они би требало да буду универзални, мултимодални и дубоко интегрисани у свакодневни живот. Ажурирања представљена на MWC 2025 су важан корак у том правцу и нуде увид у будућност интеракције човека и машине.
У вези са овим:
Ваш глобални партнер за маркетинг и развој пословања
☑️ Наш пословни језик је енглески или немачки
☑️ НОВО: Преписка на вашем матерњем језику!
Ја и мој тим смо срећни што вам можемо бити на располагању као ваш лични саветник.
Можете ме контактирати попуњавањем контакт форме овде или једноставно позовите на +49 89 89 674 804 ( Минхен) . Моја имејл адреса је: [email protected]
Радујем се нашем заједничком пројекту.













