Publikováno dne: 19. května 2025 / Aktualizace od: 19. května 2025 - Autor: Konrad Wolfenstein
Takto se AI učí jako mozek: naučit se nový přístup pro systémy AI s AI AI AI a nepřetržitý strojový obraz: xpert.digitální
Human Thinking New: Inovativní CTM od Sakana AI
Strojové myšlení 2.0: Proč je CTM milníkem
Nový „kontinuální myšlenkový stroj“ (CTM) japonského začínajícího AI AI znamená posun paradigmatu ve výzkumu AI tím, že stanoví časovou dynamiku neuronální aktivity jako centrálního mechanismu pro strojové myšlení. Na rozdíl od konvenčních modelů AI, které zpracovávají informace v jednom kole, CTM simuluje vícestupňový proces myšlení, který je více založen na fungování lidského mozku.
Vhodné pro:
Revoluce času založeného na
Zatímco tradiční modely AI, jako jsou GPT-4 nebo Llama 3, fungují postupně-přicházejí vstup, výstup se s tímto principem zlomí. Systém pracuje s interním konceptem času, tak -svolněné „klíšťata“ nebo diskrétním načasováním, prostřednictvím kterého se interní stav modelu vyvíjí postupně. Tento přístup umožňuje iterační adaptaci a vytváří proces, který je spíše jako proces přirozeného myšlení než pouhá reakce.
„CTM pracuje s interním konceptem času, svolnými„ vnitřními klíšťaty “, které jsou odděleny datovým vstupem,“ vysvětluje Sakana AI. „To umožňuje modelu„ myslet “několik kroků při řešení úkolů místo toho, aby se rozhodlo v jednom běhu okamžitě.“
Jádro tohoto přístupu spočívá v použití synchronizace neuronů jako základního mechanismu reprezentace. Sakana AI byla inspirována funkčností biologických mozků, kdy koordinace mezi neurony hraje klíčovou roli. Tato biologická inspirace přesahuje pouhou metaforu a tvoří základ své filozofie rozvoje AI.
Modely na úrovni neuronů: Technické nadace
CTM představuje komplexní nervovou architekturu, která se označuje jako „modely na úrovni neuronů“ (NLM). Každý neuron má své vlastní hmotnostní parametry a sleduje historii minulých aktivací. Tyto historiky ovlivňují chování neuronů v čase a umožňují dynamičtější zpracování než u konvenčních umělých neuronálních sítí.
Proces myšlení probíhá v několika vnitřních krocích. Nejprve „model synapse“ zpracovává současné stavy neuronů a externí vstupní data, aby vytvořila první signály-tzv. Preaktivace. Následně jednotlivé „neuronové modely“ používají historiky těchto signálů k výpočtu jejich příštích států.
Neuroningové stavy jsou v průběhu času zaznamenány k analýze synchronizační síly mezi neurony. Tato synchronizace tvoří ústřední vnitřní reprezentaci modelu. Další mechanismus pozornosti umožňuje systému vybírat a zpracovat relevantní části vstupních dat.
Výkon a praktické testy
V řadě experimentů porovnávala Sakana AI výkon CTM se zavedenými architekturami. Výsledky ukazují slibný pokrok v různých oblastech aplikace:
Klasifikace postav a vizuální zpracování
Na známé sadě dat ImageNet-1K dosahuje CTM nejvyšší 1 přesnost 72,47% a přesnost 5,89%. Ačkoli tyto hodnoty pro dnešní standardy nepředstavují nejvyšší hodnoty, Sakana AI zdůrazňuje, že se nejedná o primární cíl projektu. Je pozoruhodné, že se jedná o první pokus použít neurální dynamiku jako formu reprezentace pro klasifikaci Imagenet.
Při testech se sadou dat CIFAR 10 CTM také o něco lepší než konvenční modely, přičemž jejich předpovědi jsou více podobné chování lidského rozhodování. Při CIFAR-10H dosahuje CTM kalibrační chybu pouze 0,15, a proto překračuje jak lidi (0,22), tak LSTM (0,28).
Složité řešení problémů
V případě paritních úkolů s délkou 64 dosáhne CTM působivou přesnost 100% s více než 75 bary, zatímco LSTMS uvízne s maximálně 10 účinnými tyčemi při méně než 60%. V experimentu labyrintu model prokázal chování, které se podobá postupnému plánování trasy, s úspěšností 80%, ve srovnání se 45% u LSTM a pouze 20% v sítě dopředu.
Model modelu je obzvláště zajímavý pro dynamicky přizpůsobení jeho hloubky zpracování: zastavuje se dříve v případě jednoduchých úkolů, přičemž složitější to počítá déle. Funguje to bez dalších funkcí ztráty a je to vlastní vlastnictví architektury.
Interpretovatelnost a transparentnost
Vynikajícím rysem CTM je jeho interpretovatelnost. Během zpracování obrazu Systematicky relevantní funkce naskenují pozornost, které umožňují vhled do „procesu myšlení“ modelu. V experimentech labyrintu systém ukázal chování, které se podobá postupnému plánování chování trasy-, které se podle vývojářů objevuje a nebyl výslovně naprogramován.
Sakana AI dokonce poskytuje interaktivní demo, ve kterém systém CTM v prohlížeči najde cestu ven z labyrintu až do 150 kroků. Tato transparentnost je důležitou výhodou oproti mnoha moderním systémům AI, jejichž rozhodovací proces je často vnímán jako „černá skříňka“.
Vhodné pro:
Výzvy a omezení
Navzdory slibným výsledkům CTM stále čelí značným výzvám:
- Výpočetní úsilí: Každé vnitřní hodiny vyžadují kompletní dopředné běhy, což zvyšuje náklady na školení ve srovnání s LSTMS asi třikrát.
- Škálovatelnost: Současné implementace zpracovávají maximálně 1 000 neuronů a škálování na velikost transformátoru (≥1 miliard parametrů) dosud nebylo testováno.
- Oblasti aplikace: Zatímco CTM ukazuje dobré výsledky ve specifických testech, zbývá vidět, zda jsou tyto výhody také používány v širokých praktických aplikacích.
Vědci také experimentovali s různými velikostmi modelu a zjistili, že více neuronů vedlo k rozmanitějším vzorcům aktivity, ale výsledky automaticky nezlepšily. To ukazuje na složité vztahy mezi architekturou modelu, velikostí a výkonem.
Sakana AI: Nový přístup k umělé inteligenci
Sakana AI byla založena v červenci 2023 vizionářem AI Davidem Ha a Llionem Jonesem, oba bývalými výzkumníky Google, spolu s Ren Ito, bývalým zaměstnancem Mercari a úředníky v japonském ministerstvu zahraničí. Společnost sleduje základní přístup než mnoho zavedených vývojářů AI.
Namísto procházky po konvenční cestě masivnější a náročnější modely AI náročné na zdroje je Sakana AI inspirována přírodou, zejména kolektivní inteligencí roje ryb a roje ptáků. Na rozdíl od společností, jako je OpenAAI, které vyvíjejí rozsáhlé, výkonné modely, jako je Chatgpt, Sakana AI se spoléhá na decentralizovaný přístup s menšími, spolupracujícími modely AI, které efektivně fungují společně.
Tato filozofie se také odráží v CTM. Namísto jednoduše vytváření větších modelů s více parametry se Sakana AI zaměřuje na základní architektonické inovace, které by mohly zásadně změnit způsob, jakým by systémy AI mohly zpracovávat informace.
Posun paradigmatu ve vývoji AI?
Stroj s kontinuálním myšlením by mohl znamenat významný krok ve vývoji umělé inteligence. Reintroducitou časové dynamiky jako ústředního prvku umělých neuronových sítí rozšiřuje repertoár nástrojů a konceptů pro výzkum AI.
Biologická inspirace, interpretovatelnost a adaptivní hloubka výpočtu CTM by mohla být obzvláště cenná v oblastech aplikací, které vyžadují složité závěry a řešení problémů. Kromě toho by tento přístup mohl vést k efektivnějším systémům AI, které mohou dělat s méně výpočetními zdroji.
Je třeba vidět, zda CTM skutečně představuje průlom. Největší výzvou bude převést slibné výsledky z laboratorních testů na praktické aplikace a rozšířit architekturu na větší modely.
Bez ohledu na to představuje CTM statečný a inovativní přístup, který ukazuje, že navzdory působivým úspěchům současných systémů AI stále existuje mnoho prostoru pro základní inovace v architektuře umělých neuronových sítí. Stroj s kontinuálním myšlením Sakana AIS nám připomíná, že můžeme být pouze na začátku dlouhé cesty k rozvoji skutečně člověka podobné umělé inteligenci.
Vhodné pro:
Vaše transformace AI, integrace AI a odborník na platformu AI
☑️ Naším obchodním jazykem je angličtina nebo němčina
☑️ NOVINKA: Korespondence ve vašem národním jazyce!
Rád vám a mému týmu posloužím jako osobní poradce.
Kontaktovat mě můžete vyplněním kontaktního formuláře nebo mi jednoduše zavolejte na číslo +49 89 89 674 804 (Mnichov) . Moje e-mailová adresa je: wolfenstein ∂ xpert.digital
Těším se na náš společný projekt.