Избор језика 📢


Гугл Џемини капи вештачке интелигенције: Гуглов нови месечни ритам за иновације у области вештачке интелигенције – овде за јул 2025

Објављено: 25. јула 2025. / Ажурирано: 25. јула 2025. – Аутор: Konrad Wolfenstein

Близанци капи вештачке интелигенције: Гуглов нови месечни ритам за иновације у вези са вештачком интелигенцијом

Близанци капи вештачке интелигенције: Гуглов нови месечни ритам за иновације вештачке интелигенције – Слика: Xpert.Digital

Gemini Drops: Како Google корак по корак мења свет вештачке интелигенције

Будућност вештачке интелигенције: Гуглов план за интелигентне иновације

Гугл прелази на режим континуираног објашњавања за свој вештачки екосистем: Са новим „Gemini Drops“, компанија прикупља све најновије функције везане за свој мултимодални Gemini модел, API за програмере, Gemini апликацију и повезане производе (Pixel, Wear OS, Chrome, Workspace, cloud сервиси и још много тога) у једном месечном пакету. Идеја се надовезује на познате Android и Pixel функције, али иде корак даље: Свака функција не само да пружа једноставну листу промена, већ и прича континуирану причу о томе куда се Google вештачка интелигенција креће – од генерисања видеа и звука до аутоматизованих свакодневних рутина.

Следећи чланак пружа детаљан преглед концепта, објашњава позадину, описује специфичне иновације првих капи, смешта све у оквир ширег плана Џеминија и нуди увид у будућност. Сви цитати из саопштења за штампу, блогова или презентација представљени су кохерентним прозним језиком, а стил писања је намерно јасан и приступачан.

У вези са овим:

Ново поглавље у Гугловој стратегији вештачке интелигенције

Од увођења прве генерације Gemini крајем 2023. године, Google је стално убрзавао темпо иновација. Оно што је у почетку почело као модел говора и слике брзо се развило у изворно мултимодални систем који подједнако обрађује текст, слике, аудио, видео и код. Gemini екосистем је растао паралелно: апликација за крајњег корисника, API за програмере, интеграције са Chrome-ом, претрагом, Workspace апликацијама, Pixel функцијама, Wear OS сатовима, паметним екранима, па чак и будућим аутомобилским интерфејсима.

Са сваким новим ажурирањем производа, број питања се повећавао:

  • Које функције су бесплатне за све, а које су доступне само уз претплату на AI Pro или AI Ultra?
  • Шта може основни модел, а шта је са напреднијим верзијама Gemini 2.5 Pro, Flash или Flash-Lite?
  • Где су скривене нове функције попут генерисања видеа у Veo 3, изворног аудио излаза или заказаних акција?

Да би се провукао кроз ову гомилу информација, Google је сада основао Gemini Drops. Једном месечно се објављује сажет преглед, који истиче кључне карактеристике, пружа примере апликација, одговара на често постављана питања и повезује са додатним ресурсима. Мале исправке грешака или постепена побољшања се настављају одмах објављивати, али Drop сумира све и јасно објашњава.

Зашто ове капи Gemini имају смисла

Гугл често развија своје вештачке интелигенције моделе у позадини у микрокорацима. Иако су ове промене документоване у дневницима промена програмера, оне ретко доспевају до пажње редовних корисника. Управо ту долазе до изражаја капљице. Оне…

  • Карактеристике пакета: Уместо раштрканих мини-ажурирања, корисници добијају курирани каталог нових могућности.
  • Фокусирају се на кључна подручја: Сваки пад истиче 4-6 основних побољшања која Google сматра посебно вредним.
  • Они пружају практичне примере: кратки видео снимци, анимирани ГИФ-ови или водичи за ГИФ-ове корак по корак илуструју како одмах испробати нове функције.
  • Поједностављује подршку: Јасан рок олакшава форуме за помоћ јер сви знају на коју верзију функционалности се позивају.
  • Јачање маркетинга: Појачане функције имају култни статус међу фановима Андроида и Пиксела. Концепт се може пренети на вештачку интелигенцију како би се усмерила пажња и пробудила радозналост.

Више информација овде:

Први пад Џеминија у јулу 2025. – турнеја

Премијера је пуна садржаја и показује колико су вишеслојни постали планови компаније Google за вештачку интелигенцију. Кључне компоненте су:

Veo 3: Претварање фотографије у видео са звуком

Најважнија новост је надоградња видео генератора Veo 3, који је сада директно интегрисан у апликацију Gemini. Корисници бирају слику из своје галерије – портрет, пејзажну фотографију, скицу – а Veo креира осмосекундни клип у 720p резолуцији, са аутоматски генерисаним звучним ефектима и музиком у позадини. По жељи, више слика се може комбиновати у сториборд секвенцу.

  • Опције: Објаве на друштвеним мрежама, анимиране рођенданске честитке, кратки клипови за презентације.
  • Контроле: Параметри стила (кинематографски, стрип, стоп-моушн), негативни подстицаји (елементи које треба искључити) и унапред подешена подешавања покрета (кретање камере, зумирање, панорамирање од 360 степени).
  • Техничка позадина: Veo 3 се може похвалити конзистентним приказивањем ликова, контролом камере и изворном синтезом звука; користи исте градивне блокове дифузије и трансформатора као Gemini 2.5 Pro.

Gemini на Wear OS-у

Гугл постепено уводи Gemini на све Wear OS 4 сатове и новије. Четбот замењује класични Google асистент, али нуди знатно боље препознавање говора, приступ имејлу и подацима календара, пречице за навигацију и спонтана решења за кодирање или математику директно на зглобу.

– Гугл остаје; алтернативно, можете држати бочно дугме или додирнути икону нове апликације.
– Контекстуални приступ: резимеи недавних имејлова пре састанка, подсетници о бројевима ормарића у теретани, упутства путем исечка мапе док сте у покрету.
– Хардверска функција: Старији сатови стримују обраду на упарени паметни телефон; новији чипови (нпр. Snapdragon W5+) подржавају локално закључивање за основне задатке.

Заказане акције – Рутине на стероидима

Са заказаним акцијама, Gemini постаје лични аутоматизатор тока посла. Корисници могу да подесе распоред за било које захтеве: дневни, недељни, месечни или једнократни.

  • Примери: у 7 ујутру резиме календара, временске прилике, имејлова и листе обавеза.
  • Пет идеја за блог понедељком; листа ресторана у околини петком; недељни преглед недељом.
  • Аутоматски шаљите статистику утакмица на ваш мобилни телефон након спортских догађаја.
  • Ограничења: До десет активних акција, функција је тренутно укључена у AI Pro/Ultra претплату или квалификоване Workspace планове.
  • Операција: Креирајте путем команде за ћаскање, управљајте под „Заказане акције“ у подешавањима; Паузирајте/Наставите могуће.

Gemini 2.5 Pro – више образложења, више контекста

Уз функције за крајње кориснике, Google објављује Thinking модел Gemini 2.5 Pro у GA.

  • Подаци о перформансама: прозор од 1 милион токена, мултимодални улази, супериорни резултати у тесту кодирања, ранг 1 на LMArena.
  • Додатне функције за програмере: стримовање ланца мисли, асинхрони позиви функција, дијалог уживо са аудио записом API-ја, алати за извршавање кода.
  • Цена: Доступно у апликацији Gemini као део AI-Pro (20 долара месечно) или AI-Ultra (120 долара годишње) – рани тестери добијају бесплатан приступ ограничено време.

Титлови уживо за Gemini Live

Gemini Live, модул за разговоре у реалном времену, сада приказује титлове у реалном времену. Ово је корисно за приступачност и бучна окружења, а такође је практично као основа за вођење белешки на састанцима.

Чак и мале ствари могу изазвати проблеме

  • Gemini-in-Apps: Дубљи приступ Документима, Keep-у и Порукама, укључујући интеграцију резултата вештачке интелигенције методом превлачења и испуштања.
  • Gemini Cloud Assist: Побољшан фронтенд за помоћ при кодирању у Google Cloud-у са конфигурацијом конектора за природни језик.
  • Lyria-Realtime: Стварање музике током наступа уживо (преглед).
  • Flash-Lite: Још јефтинији модел за задатке масовног закључивања.

Механика која стоји иза падова

Свака кап прати јасан редослед:

  1. Меко имплементирање – Појединачне функције се објављују постепено, често упарене са заставицама на страни сервера.
  2. Ознака „Drop“ – Google објављује блог пост, друштвене елементе, кратки видео на YouTube-у и ажурира страницу Gemini Drops.
  3. Ажурирање чворишта – одељак са честим питањима, видео демонстрације, линкови за детаљно истраживање програмера.
  4. Прозор за повратне информације – У року од 48 сати, повратне информације корисника се претварају у хитне исправке; интерни тимови прилагођавају заставице функција.

На овај начин, Гугл комбинује агилност (континуирано увођење) и наратив (месечне приче) без жртвовања брзине иновација.

Падови у функцији Gemini у поређењу са падовима функција за Android и Pixel

У динамичном свету технологије, ажурирања софтвера се развијају различитим стратегијама. Док Андроид и Пиксел традиционално објављују нове функције квартално, Џемини користи месечни циклус који боље одражава брзи развој вештачке интелигенције.

Објављивање нових функција се разликује не само по учесталости већ и по фокусу: ажурирања за Андроид се фокусирају на функције оперативног система, ажурирања за Пиксел нуде ексклузивне погодности за Гугл уређаје, а објављивање за Гемини циља на функције модела и апликација вештачке интелигенције.

Корисничка база такође варира: ажурирања за Андроид стижу до свих уређаја од одређеног издања па надаље, ажурирања за Пиксел су ограничена на тренутне Пиксел уређаје, а Гемини Дропови утичу на апликацију Гемини, АПИ и повезане производе.

Механизми дистрибуције крећу се од имплементације закрпа и ажурирања система Google Play до заставица на страни сервера и имплементација у облаку. Примери разноврсних иновација укључују подршку за лозинке, надоградње екрана позива и генератор видео записа Veo 3.

Месечни циклус Близанаца одражава брз развој вештачке интелигенције и значајно се истиче од традиционалнијих, споријих циклуса ажурирања Андроида и Пиксела.

У вези са овим:

Како програмери имају користи од падова

За заједницу програмера, Gemini Drops су много више од самог маркетинга:

  • Планирање: Фиксни датуми помажу у синхронизацији планова и тестова временске компатибилности.
  • Документација: Белешке о издању у API Hub-у пружају прецизне ИД-ове модела, упозорења о застаревању и путање миграције.
  • Време песковите кутије: Модели прегледа попут `gemini-2.5-flash-preview-native-audio-dialog` могу се рано проценити.
  • Примери отвореног кода: Google објављује пратеће Colab свеске, GitHub исечке и Cloud Codelabs.
  • Догађаји заједнице: Након сваког објављивања, следи пренос уживо за програмере, сесије питања и одговора на Дискорду и консултације у АИ студију.

Предности за пословне и образовне кориснике

Предузећа и образовне институције добијају Капи…

  • Јасне информације о лиценцирању: Које функције су укључене у Workspace планове, а које захтевају додатке?
  • Безбедносна ажурирања: Истакнуте промене у усклађености, нпр. опције чувања података за Gemini 2.5 Pro.
  • Приче о случајевима употребе: Практични примери ботова за корисничку подршку, аутоматизације CRM-а и евалуације истраживања.
  • Материјали за обуку: Слајдови, демо рачуни и студије случаја подржавају интерну обуку.

Критике и отворена питања

  1. Баријера претплате: Многе истакнуте функције (Заказане акције, 2.5 Pro, Veo 3 у пуном квалитету) налазе се иза AI-Pro/Ultra пејволова.
  2. Фрагментација модела: Flash-Lite, Flash, Pro, Native Audio, TTS – лаици брзо губе нит.
  3. Приватност података: Повећан контекстуални приступ (Пошта, Календар, Диск) захтева поверење у безбедносну архитектуру компаније Google.
  4. Фрагментација екосистема: Функције се понекад прво појављују на Pixel-у, затим на iOS-у, а касније на вебу; имплементација Wear OS-а захтева време.

Гугл се супротставља порталима за транспарентност, детаљним картицама модела, ажурирањима политика и маркетингом повећаног поверења.

Поглед унапред – шта би предстојећи падови могли да донесу

  • Навигација Gemini-in-Maps: Планирање руте уживо са преклапањима разговора.
  • Интеграција са пројектом Астра: Визуелни гласовни асистент са анализом стрима камере у реалном времену.
  • Агенти за дубинско истраживање: Аутоматизовани прегледи литературе, анализе тржишта, извештаји конкуренције.
  • Gemini Studio додаци: Градивни блокови без кода за веб продавнице, фронтенде за ћаскање или платформе за учење.
  • Комплет алата за закључивање на рубу мреже: Гема огранак за вештачку интелигенцију на уређају у IoT хардверу.
  • Имерзивна AR подршка: Видео контекстуални прозор у AR наочарима, укључујући транскрипцију уживо.

Месечна магија вештачке интелигенције: Гуглов нови ритам иновација

Гемини капљице сигнализирају промену стратегије: Гугл се више не ослања искључиво на блиставе мега-догађаје попут I/O или одвојених блогова о производима, већ успоставља континуирани дијалог са вештачком интелигенцијом. Ово ствара јасан ритам очекивања за кориснике, даје програмерима сигурност у планирању и пружа маркетингу платформу која испоручује нове приче из месеца у месец.

Свако ко већ ради са Gemini-јем – било креативно, професионално или једноставно из радозналости – требало би да прати Drop календар. Сваки месец би могао да донесе нови комад AI магије – било да је то паметни дневни планер, мини-ремек-дело од осам секунди направљено од ваших фотографија или сат који одговара на сложена питања чак и пре него што извадите паметни телефон из џепа.

На крају, можда највећи напредак није појединачна функција, већ поузданост са којом Гугл испуњава своја обећања у вези са вештачком интелигенцијом – транспарентно, ритмично и са сталним фокусом на користи из стварног света.

У вези са овим:

 

Ваш стручњак за трансформацију вештачке интелигенције, интеграцију вештачке интелигенције и индустрију платформи за вештачку интелигенцију

☑️ Наш пословни језик је енглески или немачки

☑️ НОВО: Преписка на вашем матерњем језику!

 

Дигитални пионир - Konrad Wolfenstein

Konrad Wolfenstein

Ја и мој тим смо срећни што вам можемо бити на располагању као ваш лични саветник.

Можете ме контактирати попуњавањем контакт форме овде или једноставно позовите на +49 89 89 674 804 ( Минхен) . Моја имејл адреса је: [email protected]

Радујем се нашем заједничком пројекту.

 

 

☑️ Подршка малим и средњим предузећима у стратегији, консултацијама, планирању и имплементацији

☑️ Креирање или преусмеравање стратегије вештачке интелигенције

☑️ Пионирски развој пословања


⭐️ Вештачка интелигенција (ВИ) - Блог о ВИ, жариште и центар за садржај ⭐️ Дигитална интелигенција ⭐️ XPaper