Pictogramă site web Xpert.Digital

Google Gemini AI cu analiză video live și funcționalitate de partajare a ecranului – Mobile World Congress (MWC) 2025

Google Gemini AI cu analiză video live și funcționalitate de partajare a ecranului - Mobile World Congress (MWC) 2025

Google Gemini AI cu analiză video în timp real și funcționalitate de partajare a ecranului – Mobile World Congress (MWC) 2025 – Imagine: Xpert.Digital

Interacțiune multimodală: viitorul asistentului Google AI

Noi funcții AI: Ce înseamnă Gemini Boost pentru utilizatori

La Mobile World Congress (MWC) 2025 de la Barcelona, ​​Google a dezvăluit îmbunătățiri semnificative pentru asistentul său bazat pe inteligență artificială Gemini, concepute pentru a îmbunătăți experiența utilizatorului prin noi funcții vizuale. Principalele completări includ analize video live și capacități de partajare a ecranului, care vor fi disponibile pentru abonații planului premium Google One AI la sfârșitul lunii martie. Aceste dezvoltări marchează o etapă importantă în strategia Google de a integra inteligența artificială mai profund în viața de zi cu zi și de a îmbunătăți interacțiunea multimodală

Legat de asta:

Noile caracteristici vizuale pentru Gemini

Analiză video live

Una dintre inovațiile remarcabile dezvăluite de Google la MWC 2025 este funcția de video live pentru Gemini. Această tehnologie permite utilizatorilor să arate inteligenței artificiale în timp real ceea ce captează camera smartphone-ului lor și să se angajeze într-un dialog natural. Prezentată pentru prima dată la conferința Google I/O din mai 2024, funcția este acum gata de lansare. Într-un videoclip demonstrativ prezentat de Google, o olar își îndreaptă camera spre o colecție de piese ceramice și îi cere sfaturi lui Gemini cu privire la alegerea culorilor pentru următoarea sa vază. Asistentul de inteligență artificială analizează culorile disponibile și oferă o recomandare informată pentru o glazură potrivită.

Această funcție valorifică capacitățile multimodale ale Gemini pentru a procesa informații vizuale în timp real și a le interpreta în contextul unei conversații naturale. Face parte din proiectul mai amplu al Google, cunoscut sub numele de „Project Astra”, și reprezintă un progres semnificativ în dezvoltarea asistenților AI capabili să interacționeze cu lumea reală.

Funcționalitate de partajare a ecranului

A doua îmbunătățire vizuală importantă este funcția de partajare a ecranului, care permite utilizatorilor să partajeze ecranul smartphone-ului lor cu Gemini. Când interfața Gemini este lansată pe Android, apare un nou buton etichetat „Partajează ecranul cu Live”, permițând utilizatorilor să partajeze ecranul lor cu asistentul AI în timp real. Această funcție este completată de o nouă notificare, asemănătoare unui apel telefonic, permițând o integrare perfectă în interfața cu utilizatorul.

În scenarii practice, Gemini poate folosi această funcție pentru a ajuta la cumpărăturile online, de exemplu. Într-o demonstrație, Google arată cum un utilizator poate întreba Gemini ce s-ar potrivi cu o pereche de blugi afișată pe ecran. Pe baza a ceea ce vede, Gemini poate face apoi recomandări și ghida utilizatorul prin procesul de cumpărături.

Detalii tehnice și disponibilitate

Cronologia introducerii

Google intenționează să lanseze noile funcții de partajare a ecranului și de redare video în direct pentru abonații Gemini Advanced încă din martie 2025. Aceste funcții vor fi oferite ca parte a planului Google One AI Premium, care costă 21,99 EUR pe lună. Inițial, îmbunătățirile vor fi disponibile numai pentru dispozitivele Android, dispozitivele Pixel și Samsung fiind printre primele care vor fi acceptate.

Integrare în Gemini Live

Noile funcții vizuale sunt integrate în Gemini Live, asistentul AI continuu de la Google, care permite conversații în timp real. Gemini Live a fost actualizat cu Gemini 2.0 Flash, o versiune a modelului multimodal optimizată special pentru utilizare mobilă rapidă. Interesant este că partajarea ecranului este acceptată de o nouă notificare, asemănătoare unui apel telefonic, permițând o integrare perfectă în experiența utilizatorului.

Baza tehnologică

Noile funcții se bazează pe Project Astra, inițiativa Google pentru un asistent AI universal și multimodal. Scopul acestui proiect este de a dezvolta un asistent care poate procesa date text, video și audio în timp real și le poate stoca într-un context conversațional de până la zece minute. Această tehnologie este, de asemenea, menită să utilizeze Google Search, Lens și Maps pentru a oferi o experiență completă de asistență.

Legat de asta:

Gemenii în contextul pieței asistenților AI

Poziționare competitivă

Cu aceste noi funcții vizuale, Google se poziționează strategic față de principalul său competitor, OpenAI, și ChatGPT. Modul vocal avansat al ChatGPT acceptă partajarea live și a ecranului din decembrie 2024. Prin integrarea acestor funcții în Gemini Live, Google se asigură că asistentul său AI rămâne competitiv și oferă capabilități comparabile.

Importanța pentru industria smartphone-urilor

Introducerea unor funcții avansate de inteligență artificială, precum cele oferite de Gemini, ar putea avea un impact semnificativ asupra industriei smartphone-urilor. După doi ani de scădere a vânzărilor, timp în care mulți consumatori și-au păstrat dispozitivele mai mult timp, integrarea asistenților de inteligență artificială cu capabilități îmbunătățite ar putea crea noi stimulente pentru cumpărare. În Germania, potrivit unui sondaj realizat de Bitkom, doar una din trei persoane deține acum un dispozitiv mai vechi de un an - în scădere de la 55% în 2023.

Producătorii de smartphone-uri folosesc noile funcții de inteligență artificială ca factor de diferențiere, deoarece dispozitivele sunt foarte similare ca aspect și tehnologie. De exemplu, Samsung demonstrează cum un agent de pe noul său smartphone S25 poate efectua sarcini în mai multe aplicații, în timp ce Oppo prezintă capacitățile vizuale ale inteligenței artificiale pentru procesarea imaginilor.

Mai multe actualizări pentru Gemeni

Suport lingvistic îmbunătățit

Pe lângă funcțiile vizuale, Google a extins și capacitățile lingvistice ale Gemini. Asistentul AI poate acum înțelege și vorbi în 45 de limbi. O caracteristică deosebit de inovatoare este capacitatea sa de a schimba limba în timpul propoziției, fără ca utilizatorii să fie nevoiți să modifice setările de limbă ale telefonului - „Gemini Live va înțelege și va răspunde”.

Widget-uri noi pentru utilizatorii de iPhone

Deși inițial funcțiile vizuale vor fi disponibile doar pentru dispozitivele Android, Google a anunțat actualizări și pentru utilizatorii de iPhone. Versiunea 1.2025.0762303 a aplicației Gemini introduce șase widget-uri diferite pentru ecranul de blocare, care oferă acces mai rapid la asistentul AI. Aceste widget-uri includ opțiuni precum „Prompt de tipărire”, „Vorbește cu Gemini Live”, „Deschide microfon”, „Utilizează camera”, „Partajează imaginea” și „Partajează fișierul”. Acestea pot fi plasate atât pe ecranul de blocare, cât și pe Centrul de control al iPhone-ului, facilitând accesul la Gemini.

Unii observatori interpretează această evoluție ca o încercare de a atrage utilizatorii de iPhone și iPad departe de asistentul vocal Siri de la Apple. Rapoartele indică faptul că Apple face progrese lente în dezvoltarea unei versiuni mai puternice a Siri, care poate concura cu platformele de inteligență artificială de top.

Concluzie: Semnificație și perspective

Actualizările pentru Gemini, prezentate de Google la MWC 2025, marchează un pas semnificativ în evoluția asistenților AI. Noile funcții vizuale - analiza video live și partajarea ecranului - permit o interacțiune mai intuitivă și contextuală între utilizatori și inteligența artificială. Acestea fac parte dintr-o dezvoltare mai amplă către asistenți multimodali care pot interacționa din ce în ce mai mult cu lumea reală.

Integrarea acestor funcții ar putea avea efecte de amploare în diverse sectoare. Pentru industria smartphone-urilor, acestea ar putea crea noi stimulente pentru cumpărare și ar putea ajuta la revitalizarea pieței stagnante. Pentru utilizatori, acestea deschid noi posibilități de utilizare a inteligenței artificiale în viața de zi cu zi, fie că este vorba de cumpărături, proiecte creative sau căutări de informații.

În același timp, aceste evoluții evidențiază concurența continuă dintre marile companii de tehnologie în domeniul asistenților IA. Google, OpenAI, Apple și alții lucrează continuu pentru a-și îmbunătăți asistenții și a-i dota cu noi funcții. Acest lucru stimulează inovația și ar putea duce la asistenți IA și mai puternici și mai intuitivi în următorii ani.

Prin intermediul Proiectului Astra și al noilor funcții pentru Gemini, Google își prezintă viziunea pe termen lung pentru asistenții IA: aceștia ar trebui să fie universali, multimodali și profund integrați în viața de zi cu zi. Actualizările prezentate la MWC 2025 reprezintă un pas important în această direcție și oferă o privire asupra viitorului interacțiunii om-mașină.

Legat de asta:

 

Partenerul dumneavoastră global de marketing și dezvoltare a afacerilor

☑️ Limba noastră de afaceri este engleza sau germana

☑️ NOU: Corespondență în limba ta maternă!

 

Konrad Wolfenstein

Eu și echipa mea suntem bucuroși să vă fim la dispoziție în calitate de consilier personal.

Mă puteți contacta completând formularul de contact de aici sau pur și simplu sunându-mă la +49 89 89 674 804 ( München) . Adresa mea de e-mail este: wolfenstein@xpert.digital

Aștept cu nerăbdare proiectul nostru comun.

 

 

☑️ Suport pentru IMM-uri în strategie, consultanță, planificare și implementare

☑️ Crearea sau realinierea strategiei digitale și a digitalizării

☑️ Extinderea și optimizarea proceselor de vânzări internaționale

☑️ Platforme de tranzacționare B2B globale și digitale

☑️ Dezvoltare Afaceri Pioneer / Marketing / PR / Târguri Comerciale

Părăsiți versiunea mobilă