⭐️ Kecerdasan buatan (AI) -AI blog, hotspot dan hub konten ⭐️ Robotika/robotika ⭐️ xpaper

Pemilihan suara 📢

Google Gemini 2.0, Kecerdasan Buatan dan Robotika: Robotika Gemini dan Robotika Gemini-ER

Diterbitkan pada: 20 Maret 2025 / Pembaruan Dari: 20 Maret 2025 - Penulis: Konrad Wolfenstein

Google Gemini 2.0, Kecerdasan Buatan dan Robotika: Robotika Gemini dan Robotika Gemini-ER-Creative Image: Xpert.digital

DeepMind Presents Gemini: Era robotika berikutnya dimulai

Robotika Gemini: Penggabungan Transformatif Google tentang Kecerdasan Buatan dan Robotika

Pada 12 Maret 2025, Google DeepMind mempresentasikan proyek terbaru Gemini Robotics, sebuah teknologi yang mengesankan yang menggabungkan model bahasa Gemini 2.0 yang kuat dengan robotika canggih. Inovasi ini menandai tonggak penting dalam pengembangan sistem robot cerdas yang dapat memahami bahasa alami dan melakukan tugas fisik yang kompleks.

Google DeepMind adalah perusahaan riset terkemuka untuk Buatan Kecerdasan (AI), yang didirikan pada 2010 dan diambil alih oleh Google pada tahun 2014. Ini berfokus pada pengembangan teknologi AI canggih, yang ditandai oleh jaringan saraf dengan penyimpanan jangka pendek dan memori buatan. DeepMind telah mencapai terobosan yang signifikan, termasuk membela pemain manusia dalam permainan "GO" dan pengembangan Alphafold, sebuah sistem untuk memprediksi struktur protein. Teknologi DeepMind digunakan di bidang -bidang seperti robotika, kedokteran, efisiensi energi dan pemrosesan bahasa.

Yayasan Teknologi Robotika Gemini

Robotika Gemini dirancang sebagai model penglihatan progresif model (VLA), yang dibangun di atas Gemini 2.0 yang sudah kuat. Inovasi pusat adalah bahwa sistem tidak hanya dapat memproses data digital seperti teks, gambar atau video, tetapi juga dapat melakukan tindakan fisik di dunia nyata untuk pertama kalinya.

Teknologi ini menggunakan pemahaman multimodal tentang Gemini 2.0 dan memperluasnya dengan modalitas baru yang menentukan: tindakan fisik. Ini memungkinkan robot untuk menjembatani dunia digital dan fisik dengan cara yang belum mungkin.

Cocok untuk:

Platform Gemini Google dengan Google AI Studio, Google Deep Research dengan Gemini Advanced, dan Google DeepMind

Keterampilan fungsionalitas dan persepsi

Terobosan teknologi robot Gemini terletak pada kemampuannya untuk memahami lingkungan melalui kamera, untuk mengenali benda -benda dan untuk menangkap dimensi spasial mereka. Informasi ini kemudian dikonversi menjadi dunia 3D dengan koordinat teknis yang tepat.

Sistem ini juga bisa:

Memahami perintah bahasa alami dan mengimplementasikannya dalam tindakan fisik
Memahami hubungan spasial yang kompleks antara objek
Beradaptasi dengan situasi baru yang tidak diketahui
Menghasilkan jenis robot yang berbeda

Dua model pelengkap: robotika gemini dan robotika gemini-er

Google DeepMind tidak hanya menyajikan satu, tetapi dua model khusus yang membahas berbagai aspek robotika AI.

Robotika Gemini

Model utama robotika Gemini menggabungkan keterampilan pemrosesan bahasa Gemini 2.0 dengan kontrol fisik. Ini memungkinkan robot bereaksi terhadap perintah bahasa alami, memahami lingkungan yang kompleks dan melakukan tindakan adaptif.

Robotika Gemini

Model kedua, Gemini Robotics-ER (di mana ia singkatan dari "Ralasan yang Diwujudkan" atau "Modifikasi Logika"), berfokus pada pemikiran spasial yang lebih baik. Kemampuan ini sangat penting untuk robot yang harus bertindak dalam lingkungan dinamis, tiga dimensi.

Robotika Gemini, misalnya, dapat secara intuitif dapat mengenali bagaimana suatu objek dapat digunakan. Jika cangkir kopi ditunjukkan pada model, ia dapat secara mandiri memilih pegangan dua jari yang cocok untuk mengangkat cangkir di pegangan dan menghitung gerakan yang aman.

Keterampilan yang ditunjukkan dan aplikasi praktis

Dalam video demonstrasi yang mengesankan, Google DeepMind menunjukkan keterampilan praktis dari model AI baru. Sistem robot dapat melakukan berbagai tugas kompleks, termasuk:

Lipatan origami dan kertas
Menyortir dan mengatur objek berdasarkan instruksi verbal
Benda rapuh yang mencengkeram dan bergerak tepat
Penyisipan kacamata yang cermat dalam etui
Dadu dan manipulasi benda kecil
Menutup ritsleting
Kabel headphone yang membungkus
Eksekusi tugas presisi seperti basket dunking

Sangat penting bahwa robot melakukan tugas -tugas ini secara mandiri setelah mereka hanya menerima instruksi. Sistem secara independen mendeteksi objek, mengidentifikasi mereka, memperoleh langkah -langkah individu yang diperlukan dan mengendalikan lengan robot yang sesuai.

Kemitraan strategis untuk pengembangan lebih lanjut

Untuk membuka potensi penuh teknologi ini, Google DeepMind bekerja dengan perusahaan terkemuka dari industri robotika:

Apptronik, start-up Texas yang telah mengembangkan robot humanoid "Apollo", yang dirancang untuk tugas logistik dan pembuatan seperti mengangkat, memindahkan dan menumpuk kotak
Boston Dynamics, perusahaan robotika terkenal yang ironisnya dibeli oleh Google dan dijual lagi
Agility Robotics dan Agile Robot sebagai mitra lain untuk pengembangan dan tes robotika Gemini-ER

Kerja sama ini menunjukkan strategi Google untuk mengimplementasikan dan menguji teknologi pada berbagai platform robot untuk memastikan penerapannya yang luas.

Cocok untuk:

Google Deep Research dengan Gemini 2.0 - Analisis Komprehensif Fungsi Penelitian Lanjutan

Artinya untuk masa depan robotika

Direktur Robotika di DeepMind, Kanishka Rao, mengatakan selama konferensi pers, salah satu tantangan terbesar dalam robotika terdiri dari robot biasanya bekerja dengan baik dalam skenario yang diketahui, tetapi gagal dalam situasi yang tidak diketahui. Robotika Gemini harus menyelesaikan masalah ini dengan tepat.

Cocok untuk:

Humanoid Standing-Up Control: Belajar bangun dengan humanoids "host"-terobosan untuk robot dalam kehidupan sehari-hari

Integrasi model bahasa besar (LLM) ke dalam robot adalah bagian dari tren yang berkembang, dan pendekatan Gemini bisa menjadi salah satu contoh yang paling mengesankan dari ini. Jan Liphardt, Profesor Bio Engineering di Stanford University dan pendiri OpenMind, menekankan bahwa ini adalah "salah satu contoh pertama dari penggunaan AI generatif dan model bahasa besar pada robot canggih" dan "benar -benar kunci pengembangan pembantu robot dan robot yang bisa terjadi".

CEO NVIDIA Jensen Huang melangkah lebih jauh dan menunjukkan bahwa penggunaan AI generatif untuk menyediakan robot bisa menjadi potensi pasar beberapa triliun dolar AS dalam skala besar.

Gemini dan Robotika: Titik balik untuk sistem cerdas?

Terlepas dari kemajuan yang mengesankan, masih ada tantangan. Ken Goldberg, profesor robotika di University of California di Berkeley, menggambarkan sistem AI sebagai "perkembangan yang menarik di bidang robotika", tetapi menunjukkan bahwa "masih banyak yang harus dilakukan sebelum robot serba guna siap untuk digunakan dalam kehidupan sehari-hari".

Google berencana untuk memberikan wawasan lebih lanjut tentang kemungkinan teknologi ini di sekitar konferensi Google I/O yang akan datang. Dengan minatnya selama bertahun -tahun dalam robotika dan sekarang dengan Gemini sebagai komponen perangkat lunak yang sesuai, Google dapat membuka bab baru dalam pengembangan robot cerdas.

Dari bahasa ke tindakan: Google menetapkan standar baru dalam robotika

Dengan robotika Gemini, Google DeepMind telah mengambil langkah penting menuju perpaduan AI dan robotika. Kemampuan untuk memahami bahasa alami, memahami lingkungan yang kompleks dan melakukan tindakan fisik dapat merevolusi cara robot akan digunakan di masa depan.

Teknologi ini menandai transisi dari aplikasi AI murni digital ke sistem yang dapat berdampak langsung pada dunia fisik. Meskipun ini dapat memicu kekhawatiran dengan beberapa skeptis AI, fokus utama Google DeepMind adalah pada pengembangan sistem robot adaptif dan berguna yang dapat mengelola tugas kompleks dengan pelatihan yang lebih sedikit.

Tahun -tahun mendatang akan menunjukkan bagaimana teknologi ini berkembang dan aplikasi praktis apa yang akan Anda temukan di berbagai bidang, dari industri hingga kehidupan sehari -hari.

Cocok untuk:

Mitra pemasaran global dan pengembangan bisnis Anda

☑️ Bahasa bisnis kami adalah Inggris atau Jerman

☑️ BARU: Korespondensi dalam bahasa nasional Anda!

Konrad Wolfenstein

Saya akan dengan senang hati melayani Anda dan tim saya sebagai penasihat pribadi.

Anda dapat menghubungi saya dengan mengisi formulir kontak atau cukup hubungi saya di +49 89 89 674 804 (Munich) . Alamat email saya adalah: wolfenstein ∂ xpert.digital

Saya menantikan proyek bersama kita.