텍스트에서 꿈의 세계까지 :이 스타트 업은 자신의 상상력을 통해 하이킹 할 수 있습니다.
꿈의 그림에서 산책? 이 ai는 가능하게 만들고 직접 테스트 할 수 있습니다.
인공 지능의 세계는 세 차원의 미래로 큰 도약을합니다. 유명한 Stanford 연구원 인 Fei-Fei Li가 설립 한 KI 스타트 업 World Labs는 간단한 텍스트 설명 또는 2D 이미지에서 대화식 3D 환경을 생성하는 흥미로운 기술을 개발했습니다. 이 혁신을 통해 사용자는 Meta Quest 3 또는 Apple Vision Pro와 같은 VR 안경을 사용하여 완전히 인위적으로 생성 된 3D 세계에 몰입 할 수 있습니다.
"Lofi Worlds"응용 프로그램은이 기술의 잠재력을 인상적으로 보여줍니다. 사용자는 장엄한 알파인 배경 앞의 가상의 스위스 마운틴 마을에 몰입하거나 예술적 시계와 뾰족한 탑이있는 인상적인 스팀 펑크 도시를 걸어 가거나 형광성 거대한 버섯으로 가득 찬 동화 숲을 걸을 수 있습니다. 이 세계는 사진 -실현적인 표현에서 환상적인 꿈의 풍경, 예술적으로 양식화 된 환경에 이르기까지 다양하며, Edward Hopper의 "Nighthawks"와 같은 유명한 그림을 확장하여 추가 차원을 확장합니다.
기술의 비전
종종 "AI의 대모"라고 불리는 Fei-Fei Li는 컴퓨터 비전 개발에 대한 탁월한 장점을 가진 인공 지능의 선구자입니다. 현대 AI 혁명의 세 기둥 중 하나로 간주되는 ImageNet 데이터 세트의 개발로 유명합니다. Stanford University의 세쿼이아 교수이자 Stanford Institute for Human Centered AI의 공동 설립자로서 그녀는 공간 지능 세계에 독특한 전문 지식을 제공합니다.
Li는 AI의 다음 주요 개발 단계는 공간 지능에 있으며 공간을 이해하고 3 차원 환경과 상호 작용할 수있는 능력이라고 확신합니다. 이러한 역량은 AI 시스템이 세상을 2 차원의 정적 이미지로만 고려하지 않고 역동적 인 워크 인 현실로 이해할 수있게 해줍니다.
기술 기본 및 혁신
World Labs Technology의 중심부는 3D 가우시안 스플릿으로, 작고 공간적으로 배열 된 컬러 입자로부터 3 차원 환경을 조립하는 혁신적인 렌더링 기술입니다. 이 방법은 인상적인 예술 작품과 유사한 이미지를 만듭니다. 개별 색상은 전반적인 관점에서 가짜 풍경 만 있습니다.
Lofi Worlds의 혁신적인 혁신은 이러한 스포츠가 정적이지 않지만 역동적으로 반응 할 수 있다는 것입니다. 그들은 바람에 부드럽게 움직이고, 잎의 삐걱 거리는 소리를 시뮬레이션하거나, 마치 살아있는 것처럼 만지면 손을 흔들기 시작합니다. 이 상호 작용은 World Labs가 특별히 개발 한 웹 애플리케이션을위한 3D 렌더러 인 Spark Technology에서 가능합니다.
Spark는 Gaussian Splats의 렌더링에 WebGL2를 사용하며 광범위한 3D 그래픽 라이브러리 3.js와 호환됩니다. 이 조합은 광범위한 장치 호환성을 보장하고 VR 안경뿐만 아니라 스마트 폰 및 데스크탑 컴퓨터에서도 응용 프로그램을 사용할 수 있습니다.
WebXR : 웹과 가상 현실 사이의 다리
Lofi Worlds의 접근성은 브라우저에서 직접 몰입 형 경험을 제공하는 오픈 웹 API 인 WebXR 기술에 의해 가능합니다. WebXR은 확장 된 현실을 나타내며 특별한 앱 다운로드없이 가상 현실과 증강 현실을 모두 지원합니다.
이 기술은 웹과 VR 사이의 원활한 인터페이스를 생성하기 때문에 몰입 형 컨텐츠가 제공되는 방식에 혁명을 일으킨다. 개발자는 모바일 장치에서 고급 VR 헤드셋에 이르기까지 다양한 장치에서 작동하는 XR 애플리케이션을 만들 수 있습니다. 프로그래밍 노력이 최소화되는 동안 범위는 최대화됩니다.
가상 현실 하드웨어 및 핸드 추적
Meta Quest 3과 Apple Vision Pro는 외부 컴퓨터없이 복잡한 3D 애플리케이션을 수행 할 수있는 최신 자급 자족 VR 안경을 나타냅니다. 이 장치에는 통합 핸드 추적 기술이있어 사용자가 가상 객체와 직접 상호 작용할 수 있습니다.
핸드 추적은 실시간으로 손의 위치, 깊이, 속도 및 정렬을 캡처하는 카메라 및 센서를 통해 작동합니다. 이 데이터는 분석 및 손 움직임의 가상 표현으로 변환 된 다음 3D 환경에 통합됩니다. 이 기술을 통해 물리적 컨트롤러가 필요하지 않고 물체를 잡고 조작하거나 던질 수 있습니다.
인공 지능 및 공간 지능
World Labs는 소위 "대형 세계 모델"-IA 시스템을 개발하는 야심 찬 목표를 추구합니다. 이 모델은 AI가 세상과 사람들을 공간적이고 물리적으로 경험하는 것으로 인식 할 수 있도록해야합니다.
공간 지능은 공간을 상상하고 대상과 상호 작용하는 능력입니다. 인식과 행동과 결합하는 역량입니다. 예를 들어, 사람들이 테이블에 유리를 볼 때 뇌는 즉시 기하학, 배치 및 다른 물체와의 관계를 처리합니다. 이러한 유형의 공간 의식은 AI가 실제로 현실 세계를 이해하고 상호 작용할 수 있다는 것이 중요합니다.
도전과 한계
인상적인 진보에도 불구하고 기술은 여전히 중대한 제한 사항을 가지고 있습니다. 3D 세계에서의 움직임의 자유는 몇 가지 가상 미터 후에 매우 제한적이며, 사용자는 보이지 않는 한계에 도달하여 연속 3D 세계의 환상을 파괴합니다. 또한 해상도는 비교적 낮고 이미지는 종종 초점이 맞지 않습니다.
원래 관점에서 너무 멀리 이동하는 사람은 가우스 스플 랏에서 어두운 빈 공간을 발견하여 침수에 영향을 미칩니다. 이러한 문제는 신기술의 초기 발달 단계의 전형적인 것이며 알고리즘의 추가 개발 및 사용 가능한 컴퓨팅 능력으로 해결 될 것으로 예상됩니다.
🗒️ Xpert.Digital: 확장 및 증강 현실 분야의 선구자
🗒️ 컨설팅 회사 등 적합한 메타버스 대행사 및 기획 사무소 찾기 - 컨설팅 및 기획에 대한 상위 10가지 팁 검색 및 검색
자세한 내용은 여기를 참조하세요.
World Labs : 스타트 업은 단어를 사진 현실 3D 환경으로 변환합니다.
적용분야 및 향후 전망
AI 생성 3D 세계의 가능한 용도는 다양하고 광범위합니다. 영화 산업에서는 정교한 배경이나 컴퓨터 그래픽 팀없이 복잡한 장면과 환경을 만들 수 있습니다. 건축가는 워크 인 3D 모델로 디자인을 제시 할 수있는 반면, 게임 개발자는 기록적인 시간에 새로운 세계를 생성 할 수 있습니다.
교육 분야에서 몰입 형 학습 경험을위한 완전히 새로운 기회가 열립니다. 역사 시간은 역사적으로 정확한 3D 재구성에서 발생할 수있는 반면, 생물학 수업은 자세한 세포 구조 또는 생태계에서 수행 될 수 있습니다. 의학은 가상 환경에서 외과 적 개입을 실천함으로써 기술의 혜택을받을 수 있습니다.
기술과 시각적 품질 렌더링
사용 된 3D 가우시안 분할 기술은 기존 다각형 모델에 비해 몇 가지 장점을 제공합니다. 고체 기하학적 구조를 사용하는 대신 프로세스는 가벼운 상황과 관점에 유연하게 적응하는 동적 포인트 구름을 기반으로합니다. 이를 통해 최고의 표면 구조가 원본에 충격을받는 놀라운 수준의 디테일이 가능합니다.
분할 기술로 인한 인상파 외관은 19 세기 프랑스 인상가의 그림 스타일을 연상시킵니다. Claude Monet의 그림과 마찬가지로 개별 색상은 거리에서 일관된 그림까지만 형성됩니다. 이 속성은 인위적으로 생성 된 세계에 특별한 미적 품질을 제공합니다.
시장 위치 및 투자
개발 초기 단계에도 불구하고 World Labs는 이미 2 억 2 천만 달러의 위험 자본을 수집했습니다. 투자자에는 Andreessen Horowitz 및 New Enterprise Associates와 같은 유명한 위험 자본 회사와 AMD, Intel 및 Nvidia와 같은 기술 그룹이 포함됩니다. 이러한 상당한 투자는 공간 AI 기술의 잠재력에있어 산업의 신뢰를 강조합니다.
20 명의 회사는 2025 년까지 시장을 기준으로 기술을 만들고 3D 컨텐츠 생성을 근본적으로 혁신하기 위해 노력하고 있습니다. 비전은 텍스트 설명 또는 개별 이미지를 기반으로 완전하고 액세스 가능한 3D 환경을 생성하는 생성 AI를 개발하는 것입니다.
사회적, 문화적 영향
AI 생성 된 3D 세계의 발전은 광범위한 사회적 영향을 미칠 수 있습니다. 한편으로, 그것은 3D 모델링 또는 애니메이션에 대한 특별한 지식이 필요하지 않기 때문에 고품질 3D 컨텐츠의 생성을 민주화합니다. 반면에, 그녀는 진정성과 인간 창의성의 가치에 대한 의문을 제기합니다.
엔터테인먼트 산업에서는 새로운 형태의 스토리 텔링이 발전 할 수 있으며, 관중은 수동적 인 소비자 일뿐 만 아니라 이야기에 활발한 참가자가됩니다. 몰입 형 경험은 미디어와 엔터테인먼트에 대한 전통적인 이해를 근본적으로 변화시킬 수 있습니다.
기술적 인 도전과 솔루션
대형 세계 모델의 개발은 중요한 기술적 과제를 나타냅니다. 비디오 및 언어 데이터에서 수백만 개의 토큰을 처리하려면 스토리지 관리 및 계산에 대한 혁신적인 접근 방식이 필요합니다. World Labs는 링 적응과 같은 고급 기술을 사용하여 긴 시퀀스를 훈련시키고 컨텍스트 크기를 4,000에서 백만 개의 토큰으로 점차적으로 증가시킵니다.
생성 된 세계의 품질은 기본 AI 모델의 훈련 품질에 크게 의존합니다. 훈련 데이터가 다양하고 광범위할수록 3D 환경이 생성 된 3D 환경이 더 현실적이고 상세합니다. 문제는 충분히 고품질 3D 데이터를 수집하고 처리하는 것입니다.
전통적인 3D 제작 방법과 비교
전통적인 3D 모델링에는 블렌더 또는 마야와 같은 특수 소프트웨어와 3D 디자인에 대한 수년간의 경험이 필요합니다. 이 과정은 시간이 소요되며 기하학, 질감 및 조명에 대한 자세한 지식이 필요합니다. 반면에 AI 생성 3D 세계는 간단한 텍스트 설명이나 참조 이미지를 기반으로 몇 분 또는 몇 시간 안에 만들 수 있습니다.
이러한 효율성이 증가하면 텍스트 생성기와 유사하게 작문 산업에 영향을 미쳤습니다. 전문 3D 아티스트는 수동 생성에서 AI 생성 컨텐츠의 큐 레이션 및 개선으로 자신의 역할을 전환 할 수 있습니다.
전망과 미래 개발
AI 생성 된 3D 세계의 미래는 흥미 진진한 발전을 약속합니다. 기술의 추가 개발로 생성 된 환경의 품질, 상세 및 상호 작용이 지속적으로 향상됩니다. 음성 모델 및 로봇 기술과 같은 다른 AI 시스템과의 통합은 완전히 새로운 애플리케이션 분야를 열 수 있습니다.
의학에서 AI 대조 스마트 센서는 클리닉 직원의 위생을 모니터링하거나 수술기구 사용에 기록하여 환자 치료를 향상시킬 수 있습니다. 자율 로봇이 의료 용품을 운송하는 미래는 증강 현실 외과 의사와 심각한 마비 제어 로봇 암 환자를 자신의 생각으로 이끌고 있습니다.
World Labs 및 이와 유사한 회사의 개발은 우리가 새로운 공간 지능 시대의 시작에 있음을 보여줍니다. 컴퓨터와 로봇에는 3 차원 세계와의 결론을 내리고 상호 작용할 수있는 기능이 장착되어 있습니다. 이러한 디지털 시스템은 세상을 이해하고 개선하려는 노력에서 신뢰할 수있는 파트너가 될 수 있습니다.
World Labs 기술은 단순한 기술 혁신 이상입니다. 물리적 세계와 디지털 세계의 경계가 흐려지는 미래의 창입니다. 공간 지능의 모든 진전이있을 때, 우리는 AI가 정보를 처리 할뿐만 아니라 객실을 이해하고, 그와 함께 생성하고 상호 작용하는 세상에 더 가까워집니다.
우리는 당신을 위해 존재합니다 - 조언 - 계획 - 구현 - 프로젝트 관리
✓ 전략, 컨설팅, 계획 및 구현에 대한 중소기업 지원
✔️ 디지털 전략 및 디지털화의 생성 또는 재편성
✔️ 해외 영업 프로세스의 확장 및 최적화
✔️ 글로벌 및 디지털 B2B 거래 플랫폼
✔️ 선구적인 사업 개발
저는 귀하의 개인 조언자로 기꺼이 봉사하겠습니다.
아래 문의 양식을 작성하여 저에게 연락하시거나 +49 89 89 674 804 (뮌헨) .
나는 우리의 공동 프로젝트를 기대하고 있습니다.
Xpert.Digital - Konrad Wolfenstein
Xpert.Digital은 디지털화, 기계 공학, 물류/내부 물류 및 태양광 발전에 중점을 둔 산업 허브입니다.
360° 비즈니스 개발 솔루션을 통해 우리는 신규 비즈니스부터 판매 후까지 유명 기업을 지원합니다.
시장 정보, 마케팅, 마케팅 자동화, 콘텐츠 개발, PR, 메일 캠페인, 개인화된 소셜 미디어 및 리드 육성은 당사 디지털 도구의 일부입니다.
www.xpert.digital - www.xpert.solar - www.xpert.plus 에서 확인할 수 있습니다.