O sistema Robotics AI System "Helix" da Figura AI para Modelo de Ação de Linguagem da Visão Humanóide--uma Visão de Visão (VLA)
Pré-lançamento do Xpert
Seleção de voz 📢
Publicado em: 28 de fevereiro de 2025 / atualização de: 28 de fevereiro de 2025 - Autor: Konrad Wolfenstein
O sistema Robotics AI “Helix” da Figura AI para Robots Humanóides-Modelo de Ação de Languagem da Visão (VLA): Xpert.Digital
Helix: o sistema de IA que leva os robôs humanóides a um novo nível
Versão curta: visão, idioma, movimento: helix como um marco em robótica
A Helix é um sistema de IA inovador para robôs humanóides desenvolvidos pela Figura AI. É um modelo de ação de visão de visão (VLA) que combina a percepção visual, a compreensão da linguagem e o controle preciso do motor em um único sistema. A helix marca um progresso significativo no desenvolvimento de sistemas de robôs flexíveis para ambientes não estruturados, como famílias. Com sua capacidade de realizar tarefas complexas sem treinamento prévio, ele pode revolucionar a interação entre homem e máquina.
Adequado para:
- Linguagem -Robô controlado: Helix da Figura AI muda tudo! Indústria, família, futuro - entendimento, aprendizado, execução em tempo real
Helix Skills
- Controle em tempo real de toda a parte superior do corpo de robôs humanóides, incluindo 35 eixos de movimento
- Processamento de entrada de voz e informações visuais sobre a execução de tarefas complexas
- Detecção e manuseio de objetos desconhecidos sem treinamento específico
- Cooperação entre vários robôs na execução de tarefas
- Execução de tarefas domésticas, como a limpeza de uma geladeira
Detalhes técnicos
Consiste em dois componentes principais:
- Um modelo de linguagem multimodal com 7 bilhões de parâmetros (7-9 Hz)
- Um movimento IA com 80 milhões de parâmetros (200 Hz)
- Treinado com apenas 500 horas de treinamento monitorado
- Executa GPUs incorporadas eficientes de energia
Maior concorrente
- Google DeepMind: modelos de VLA desenvolvidos como RT-2
- Meta: Trabalhando em robôs humanóides avançados
- Apple: também na corrida para o desenvolvimento de humanóides avançados de IA
- OpenAai: ex -parceiro da Figura AI, agora concorrente no campo do desenvolvimento da IA
Google DeepMind
Com o RT-2 (Robotics Transformer 2), o Google Deepmind apresentou um modelo inovador de ação de visão de visão (VLA). O RT-2 permite que os robôs realizem novas tarefas sem treinamento específico, aprendendo conceitos de dados de texto e imagem da Internet e implementando-os em ações robóticas. Nos testes, o RT-2 mostrou um desempenho significativamente melhorado em novas tarefas em comparação com o modelo anterior RT-1.
Adequado para:
- Google Project Mariner: agente experimental de IA como extensão de navegador – navegação autônoma na web com tecnologia DeepMind
Meta
A Meta investe fortemente no desenvolvimento de robôs humanóides controlados pela IA. A empresa fundou uma nova equipe em sua divisão de laboratórios de realidade, que se concentra na pesquisa e desenvolvimento de robôs para os consumidores. Os meta -planos para desenvolver sistemas de IA, sensores e plataformas de software que também podem ser usados por outros fabricantes.
Maçã
A Apple também pesquisa humanóides e designs de robôs não humanóides. No entanto, a empresa ainda está em uma fase de desenvolvimento inicial. O analista Ming-Chi Kuo prevê uma possível produção em massa o mais cedo possível para 2028. A Apple se concentra particularmente na interação entre humanos e robôs.
Adequado para:
- Apple na febre do robô? Os anúncios de emprego revelam ofensiva de robô da Apple: a gigante da tecnologia agora ataca o mercado doméstico?
OpenAI
O OpenAai, ex -parceiro da Figura AI, cria seu próprio departamento de robótica e lida com robôs como uma personificação da inteligência artificial no mundo real. A empresa agora compete diretamente com o Google DeepMind e outras pessoas no campo do desenvolvimento da IA para a robótica.
🎯🎯🎯 Beneficie-se da extensa e quíntupla experiência do Xpert.Digital em um pacote de serviços abrangente | P&D, XR, RP e SEM
Máquina de renderização 3D AI e XR: experiência quíntupla da Xpert.Digital em um pacote de serviços abrangente, R&D XR, PR e SEM - Imagem: Xpert.Digital
A Xpert.Digital possui conhecimento profundo de diversos setores. Isso nos permite desenvolver estratégias sob medida, adaptadas precisamente às necessidades e desafios do seu segmento de mercado específico. Ao analisar continuamente as tendências do mercado e acompanhar os desenvolvimentos da indústria, podemos agir com visão e oferecer soluções inovadoras. Através da combinação de experiência e conhecimento, geramos valor acrescentado e damos aos nossos clientes uma vantagem competitiva decisiva.
Mais sobre isso aqui:
Helix: diferenciação em comparação com outros sistemas de IA para robôs
Modelo VLA inovador: Helix combina percepção, linguagem e movimento
A introdução mais recente da hélice através da Figura AI marca um progresso significativo na paisagem robótica para fazer. Esse modelo inovador de ação de comprimento de visão (VLA) se destaca através de várias propriedades inovadoras dos sistemas existentes e estabelece novos padrões para o controle de robôs Humanid. A Helix combina percepção visual, compreensão da linguagem e controle preciso do movimento em um sistema integrado que foi especialmente projetado para os desafios da robótica física.
Arquitetura de sistema duplo exclusivo
A diferença mais significativa entre a Helix e outros sistemas de IA para robôs está em sua inovadora arquitetura de dois componentes. Essa estrutura de sistema duplo resolve um problema fundamental da IA da robótica.
Sistema 1 e Sistema 2: Inteligência complementar
Em contraste com as abordagens convencionais, a Helix usa dois sistemas complementares que juntos alcançam um equilíbrio único entre universalidade e velocidade. O sistema 2 (S2) é um modelo de linguagem multimodal com 7 bilhões de parâmetros que trabalham com uma frequência de 7-9 Hz e atua como o "cérebro" analítico do robô. Ele processa dados visuais e comandos de voz, interpreta o ambiente e decide quais ações devem ser realizadas.
Sistema 1 (S1), uma unidade de controle visuo-motor rápida e reativa com 80 milhões de parâmetros. Este componente traduz as informações semânticas fornecidas pelo S2 em ações precisas e contínuas com uma frequência impressionante de 200 Hz. O robô é rápido, mas não universal ”. Helix supera essa dicotomia através de sua estrutura dupla.
Essa arquitetura difere fundamentalmente de outros modelos conhecidos de VLA, como o Google DeepMinds RT-2, que também combina dados visuais e comandos de voz, mas não possui divisão comparável de dois.
Adequado para:
- Plataforma Gemini do Google com Google AI Studio, Google Deep Research com Gemini Advanced e Google DeepMind
Habilidades de controle abrangentes
Controle acima de 35 graus de liberdade
Outra distinção de Helix é sua capacidade de coordenar 35 graus de liberdade ao mesmo tempo. Esse controle abrangente permite o controle preciso de toda a parte superior do corpo humanóide, incluindo pulsos, torso, cabeça e dedos individuais em alta velocidade. Essa capacidade de controle excede a maioria dos sistemas existentes e permite tarefas complexas de manipulação que exigem um alto grau de habilidades motoras finas.
Geração de objetos e aprendizado
Reconhecimento universal de objetos sem treinamento específico
Uma excelente qualidade da hélice é a capacidade de reconhecer e lidar praticamente todos os pequenos objetos domésticos sem ter sido treinados em suas propriedades específicas com antecedência. Essa capacidade de generalização de extrema alcance permite que o sistema lide com milhares de objetos com diferentes formas, tamanhos, cores e propriedades do material.
Em contraste com muitos outros sistemas de robôs de IA que precisam ser programados ou treinados para cada nova tarefa ou novo tipo de objeto, a Helix pode se adaptar a diferentes situações e reagir a comandos de voz naturais. Isso representa uma mudança de paradigma, uma vez que o sistema usa uma única rede neuronal para aprender todos os comportamentos - como pegar e pegar objetos, usando gavetas e geladeiras, bem como interação cruzada - sem tarefas - ajuste fino específico.
Coordenação de robôs múltiplos
Habilidades únicas de colaboração
Helix é o primeiro modelo VLA capaz de controlar dois robôs ao mesmo tempo e permitir que eles trabalhem juntos. Essa habilidade permite que os robôs resolvam tarefas complexas juntas, nas quais são suficientes e coordenam seus movimentos. A comunicação quase humana entre os robôs através de acenos e contato visual é particularmente notável.
Essa forma de coordenação representa um progresso significativo em comparação com os sistemas convencionais, nos quais cada robô é tipicamente controlado individualmente ou deve ser treinado especificamente para certas funções. Com a Helix, ambos os robôs usam os mesmos pesos do modelo sem a necessidade de ajustes individuais.
Eficiência de treinamento e implementação
Necessidades mínimas de treinamento, desempenho máximo
Outra diferença significativa está na notável eficiência do processo de treinamento. Com apenas 500 horas de dados de treinamento de alta qualidade e telefoto, foi desenvolvido helix, o que é consideravelmente menor do que em abordagens comparáveis que geralmente precisam de milhares de horas de demonstrações específicas. Essa eficiência não apenas destaca a sofisticação técnica do sistema, mas também sua viabilidade econômica para aplicações comerciais.
Processamento com capacidade incorporado
Ao contrário de muitos sistemas de IA da robótica que dependem de servidores externos poderosos, a Helix é executada inteiramente em GPUs incorporadas e com eficiência energética no robô. Esse processamento a bordo elimina a necessidade de uma conexão constante com os recursos aritméticos externos e torna o robô mais autônomo e flexível em vários ambientes.
Diferenciação estratégica
Integração vertical em vez de modelos genéricos de IA
A Figura AI inicia estrategicamente por outras empresas, encerrando a cooperação com o OpenAI e buscando uma estratégia verticalmente integrada na qual hardware e software são desenvolvidos internamente. O CEO Brett Adcock disse que os modelos genéricos de IA não são suficientes para atender aos requisitos de “IA incorporada”-ou seja, IA em robôs físicos. Essa decisão destaca a abordagem de desenvolver soluções personalizadas para os desafios específicos da robótica, em vez de confiar nos modelos da IA em geral.
Orientação do aplicativo
Concentre -se no uso doméstico
Enquanto muitos atores da indústria estão atualmente focados em aplicações de robôs relacionadas ao local de trabalho ou no local de trabalho, a Figura AI com Helix está buscando uma abordagem estrategicamente surpreendente, com foco na robótica doméstica. A capacidade do robô, atividades cotidianas, como classificar os alimentos, a agitação da geladeira ou o manuseio de uma ampla variedade de itens domésticos, é destinado a um mercado que geralmente é considerado muito complexo para a entrada de outros atores.
Coordenação de vários robôs: a chave para a próxima geração robótica
Com sua arquitetura de sistema duplo, a Helix se destaca claramente de outros sistemas de IA para robôs através de outros sistemas de IA para robôs. Com seu processo de treinamento eficiente, processamento incorporado e foco estratégico nos tratamentos domésticos, representa um progresso significativo no desenvolvimento de robôs humanóides. Enquanto outros sistemas como o Google DeepMinds RT-2 buscam abordagens semelhantes para a combinação de dados visuais e comandos de voz, a Helix oferece vantagens diferenciadas com sua arquitetura exclusiva e sua abordagem de desenvolvimento integrado, o que o torna um pioneiro na próxima geração de robôs controlados pela IA.
Estamos à sua disposição - aconselhamento - planejamento - implementação - gerenciamento de projetos
☑️ Apoio às PME em estratégia, consultoria, planeamento e implementação
☑️ Criação ou realinhamento da estratégia digital e digitalização
☑️ Expansão e otimização dos processos de vendas internacionais
☑️ Plataformas de negociação B2B globais e digitais
☑️ Desenvolvimento de negócios pioneiro
Ficarei feliz em servir como seu conselheiro pessoal.
Você pode entrar em contato comigo preenchendo o formulário de contato abaixo ou simplesmente ligando para +49 89 89 674 804 (Munique) .
Estou ansioso pelo nosso projeto conjunto.
Xpert.Digital - Konrad Wolfenstein
Xpert.Digital é um hub para a indústria com foco em digitalização, engenharia mecânica, logística/intralogística e energia fotovoltaica.
Com nossa solução de desenvolvimento de negócios 360°, apoiamos empresas conhecidas, desde novos negócios até o pós-venda.
Inteligência de mercado, smarketing, automação de marketing, desenvolvimento de conteúdo, PR, campanhas por email, mídias sociais personalizadas e nutrição de leads fazem parte de nossas ferramentas digitais.
Você pode descobrir mais em: www.xpert.digital - www.xpert.solar - www.xpert.plus