Web sitesi simgesi Xpert.Dijital

Yapay zekâ beyin gibi nasıl öğreniyor: Yapay zekâ sistemlerinin zaman içinde öğrenmesi için yeni bir yaklaşım – Sakana AI ve Sürekli Düşünce Makinesi

Yapay zekâ beyin gibi nasıl öğreniyor: Yapay zekâ sistemlerinin zaman içinde öğrenmesi için yeni bir yaklaşım – Sakana AI ve Sürekli Düşünce Makinesi

Yapay zekâ beyin gibi nasıl öğreniyor: Yapay zekâ sistemlerinin zaman içinde öğrenmesi için yeni bir yaklaşım – Sakana AI ve Sürekli Düşünce Makinesi – Görsel: Xpert.Digital

İnsan düşüncesini yeniden tasarlamak: Sakana AI'nin yenilikçi CTM'si

Makine Düşüncesi 2.0: CTM Neden Bir Dönüm Noktası?

Japon girişim şirketi Sakana AI'nin yeni "Sürekli Düşünme Makinesi" (CTM), sinirsel aktivitenin zamansal dinamiklerini makine düşüncesinin merkezi bir mekanizması olarak kurarak yapay zeka araştırmalarında bir paradigma değişimini işaret ediyor. Bilgiyi tek bir aşamada işleyen geleneksel yapay zeka modellerinin aksine, CTM, insan beyninin işleyişine daha çok benzeyen çok aşamalı bir düşünme sürecini simüle ediyor.

İçin uygun:

Zamana dayalı düşüncenin devrimi

GPT-4 veya Llama 3 gibi geleneksel yapay zeka modelleri sıralı olarak çalışırken (girdi girer, çıktı çıkar), CTM bu prensipten ayrılır. Sistem, "tik" veya ayrık zaman adımları olarak adlandırılan içsel bir zaman kavramıyla çalışır ve bu sayede modelin içsel durumu kademeli olarak gelişir. Bu yaklaşım, yinelemeli adaptasyona olanak tanır ve basit bir tepkiden ziyade doğal bir düşünme sürecine daha çok benzeyen bir süreç yaratır.

Sakana AI, “CTM, veri girişinden bağımsız olan ‘dahili zaman işaretleri’ olarak adlandırılan dahili bir zaman kavramıyla çalışır,” diye açıklıyor. “Bu, modelin görevleri çözerken tek seferde anında karar vermek yerine, birkaç adımı ‘düşünmesine’ olanak tanır.”

Bu yaklaşımın özü, temel bir temsil mekanizması olarak sinirsel senkronizasyonun kullanılmasında yatmaktadır. Sakana AI, nöronlar arasındaki zamansal koordinasyonun çok önemli bir rol oynadığı biyolojik beyinlerin işleyişinden ilham almıştır. Bu biyolojik ilham, salt bir metaforun ötesine geçerek yapay zeka geliştirme felsefelerinin temelini oluşturmaktadır.

Nöron Düzeyindeki Modeller: Teknik Temeller

CTM, "Nöron Düzey Modelleri" (NLM'ler) olarak bilinen karmaşık bir sinir mimarisi sunar. Her nöronun kendi ağırlık parametreleri vardır ve geçmiş aktivasyonların kaydını tutar. Bu kayıtlar, nöronların zaman içindeki davranışlarını etkileyerek, geleneksel yapay sinir ağlarına göre daha dinamik işlemeyi mümkün kılar.

Düşünme süreci birkaç içsel adımda gerçekleşir. İlk olarak, bir "sinaptik model" mevcut nöronal durumları ve dış girdi verilerini işleyerek başlangıç ​​sinyallerini (ön aktivasyonlar olarak adlandırılır) üretir. Daha sonra, bireysel "nöron modelleri" bu sinyallerin geçmişine erişerek sonraki durumlarını hesaplar.

Nöronal durumlar zaman içinde kaydedilerek nöronlar arasındaki senkronizasyonun gücü analiz edilir. Bu senkronizasyon, modelin merkezi içsel temsilini oluşturur. Ek bir dikkat mekanizması, sistemin girdi verilerinin ilgili kısımlarını seçici olarak seçmesine ve işlemesine olanak tanır.

Performans ve pratik testler

Sakana AI, bir dizi deneyde CTM'nin performansını yerleşik mimarilerle karşılaştırdı. Sonuçlar, çeşitli uygulama alanlarında umut verici ilerlemeler gösteriyor:

Görüntü sınıflandırma ve görsel işleme

Tanınmış ImageNet 1K veri setinde, CTM %72,47'lik bir Top 1 doğruluğu ve %89,89'luk bir Top 5 doğruluğu elde etmiştir. Bu değerler günümüz standartlarına göre en üst düzeyde olmasa da, Sakana AI projenin birincil amacının bu olmadığını vurgulamaktadır. Bu, ImageNet sınıflandırması için sinirsel dinamikleri bir temsil yöntemi olarak kullanan ilk girişim olması açısından dikkat çekicidir.

CIFAR-10 veri kümesi kullanılarak yapılan testlerde, CTM geleneksel modellere göre biraz daha iyi performans gösterdi ve tahminleri insan karar verme süreçlerine daha yakın oldu. CIFAR-10H'de CTM, yalnızca 0,15'lik bir kalibrasyon hatası elde ederek hem insanları (0,22) hem de LSTM'leri (0,28) geride bıraktı.

Karmaşık problem çözme

64 uzunluğundaki eşlik görevlerinde, CTM 75'ten fazla saat döngüsüyle etkileyici bir şekilde %100 doğruluk elde ederken, LSTM'ler en fazla 10 etkili saat döngüsüyle %60'ın altında doğrulukta takılıp kalmaktadır. Bir labirent deneyinde, model adım adım rota planlamasına benzer bir davranış sergileyerek %80'lik bir başarı oranı elde etmiştir; bu oran LSTM'ler için %45 ve ileri beslemeli ağlar için sadece %20'dir.

Özellikle ilgi çekici olan, modelin işlem derinliğini dinamik olarak ayarlama yeteneğidir: basit görevler için daha erken durur ve daha karmaşık görevler için daha uzun süre hesaplama yapar. Bu, ek kayıplı fonksiyonlar olmadan çalışır ve mimarinin doğal bir özelliğidir.

Yorumlanabilirlik ve şeffaflık

CTM'nin temel özelliklerinden biri yorumlanabilirliğidir. Görüntü işleme sırasında, dikkat başlıkları ilgili özellikleri sistematik olarak tarayarak modelin "düşünme süreci" hakkında bilgi sağlar. Labirent deneylerinde, sistem bir rotanın adım adım planlanmasına benzer bir davranış sergiledi; geliştiricilere göre bu davranış ortaya çıkan bir durumdur ve açıkça programlanmamıştır.

Sakana AI, bir CTM sisteminin tarayıcı içinde 150 adıma kadar bir labirentten çıkış yolunu bulduğu etkileşimli bir demo bile sunuyor. Bu şeffaflık, karar verme süreçleri genellikle "kara kutu" olarak algılanan birçok modern yapay zeka sistemine göre önemli bir avantajdır.

İçin uygun:

Zorluklar ve sınırlamalar

Umut vadeden sonuçlara rağmen, CTM hâlâ önemli zorluklarla karşı karşıya:

  1. Hesaplama yükü: Her dahili saat döngüsü, tam ileri geçişler gerektirir; bu da eğitim maliyetlerini LSTM'lere kıyasla yaklaşık üç kat artırır.
  2. Ölçeklenebilirlik: Mevcut uygulamalar en fazla 1.000 nöronu işleyebilir ve transformatör boyutuna (≥1 milyar parametre) ölçeklendirme henüz test edilmemiştir.
  3. Uygulama alanları: CTM belirli testlerde iyi sonuçlar gösterse de, bu avantajların geniş pratik uygulamalara da yansıyıp yansımayacağı henüz belli değil.

Araştırmacılar ayrıca farklı model boyutlarıyla da deneyler yaptılar ve daha fazla nöronun daha çeşitli aktivite modellerine yol açtığını, ancak sonuçları otomatik olarak iyileştirmediğini buldular. Bu, model mimarisi, boyutu ve performansı arasında karmaşık ilişkiler olduğunu göstermektedir.

Sakana AI: Yapay zekaya yeni bir yaklaşım

Sakana AI, Temmuz 2023'te eski Google araştırmacıları olan yapay zeka vizyonerleri David Ha ve Lion Jones ile eski Mercari çalışanı ve Japonya Dışişleri Bakanlığı yetkilisi Ren Ito tarafından kuruldu. Şirket, birçok köklü yapay zeka geliştiricisinden temelde farklı bir yaklaşım benimsiyor.

Sakana AI, geleneksel, büyük ve kaynak yoğun yapay zeka modelleri yolunu izlemek yerine, doğadan, özellikle de balık sürüleri ve kuş sürülerinin kolektif zekasından ilham alıyor. OpenAI gibi büyük ve güçlü modeller geliştiren şirketlerin aksine, Sakana AI, verimli bir şekilde birlikte çalışan daha küçük, işbirlikçi yapay zeka modellerine dayanan merkezi olmayan bir yaklaşım benimsiyor.

Bu felsefe CTM'de de kendini gösteriyor. Sakana AI, daha fazla parametreye sahip daha büyük modeller oluşturmak yerine, yapay zeka sistemlerinin bilgiyi işleme biçimini temelden değiştirebilecek temel mimari yeniliklere odaklanıyor.

Yapay zeka gelişiminde bir paradigma değişimi mi?

Sürekli Düşünce Makinesi, yapay zeka gelişiminde önemli bir adım olabilir. Sakana AI, yapay sinir ağlarının merkezi bir unsuru olarak zamansal dinamikleri yeniden ele alarak, yapay zeka araştırmaları için araç ve kavram yelpazesini genişletiyor.

CTM'nin biyolojik ilham kaynağı, yorumlanabilirliği ve uyarlanabilir hesaplama derinliği, özellikle karmaşık akıl yürütme ve problem çözme gerektiren uygulamalarda son derece değerli olabilir. Dahası, bu yaklaşım daha az hesaplama kaynağı gerektiren daha verimli yapay zeka sistemlerine yol açabilir.

CTM'nin gerçekten bir atılım olup olmadığı henüz belli değil. En büyük zorluk, laboratuvar testlerinden elde edilen umut verici sonuçları pratik uygulamalara dönüştürmek ve mimariyi daha büyük modellere ölçeklendirmek olacaktır.

Bununla birlikte, CTM, mevcut yapay zeka sistemlerinin etkileyici başarılarına rağmen, yapay sinir ağlarının mimarisinde temel yenilikler için hala önemli bir alan olduğunu gösteren cesur ve yenilikçi bir yaklaşımı temsil etmektedir. Sakana AI'nin Sürekli Düşünce Makinesi, gerçekten insan benzeri yapay zeka geliştirmeye yönelik uzun bir yolculuğun henüz başında olabileceğimizi bize hatırlatıyor.

İçin uygun:

 

Yapay zeka dönüşümü, yapay zeka entegrasyonu ve yapay zeka platformu sektöründeki uzmanınız

☑️İş dilimiz İngilizce veya Almancadır

☑️ YENİ: Ulusal dilinizde yazışmalar!

 

Konrad Wolfenstein

Size ve ekibime kişisel danışman olarak hizmet etmekten mutluluk duyarım.

iletişim formunu doldurarak benimle iletişime geçebilir +49 89 89 674 804 (Münih) numaralı telefondan beni arayabilirsiniz . E-posta adresim: wolfenstein xpert.digital

Ortak projemizi sabırsızlıkla bekliyorum.

 

 

☑️ Strateji, danışmanlık, planlama ve uygulama konularında KOBİ desteği

AI stratejisinin yaratılması veya yeniden düzenlenmesi

☑️ Öncü İş Geliştirme

Mobil versiyondan çık