Yapay zekâ sistemlerinin karmaşık görevlerdeki yetenekleri uzun süredir mercek altında. Ancak son olarak gerçekleştirilen bir deney, teknolojinin hâlâ gelişime açık yönleri olduğunu ortaya koydu. Citrix mühendisi Robert Jr. Caruso, OpenAI tarafından geliştirilen ChatGPT ile 1977 yapımı Atari 2600’ün emüle edilmiş bir versiyonundaki “Video Chess” oyun motorunu karşı karşıya getirdi. Deney sonucunda, milyonlarca parametreye sahip modern yapay zekâ, neredeyse yarım asırlık basit bir yazılım tarafından mağlup edildi.

Satranç maçı sırasında ChatGPT’nin yaşadığı zorluklar dikkat çekiciydi. Model, tahtadaki taşları doğru tanımlamakta güçlük çekti. Kaleleri fillerle karıştırdı, piyonların yerini unuttu ve oyunun gidişatını değerlendirmekte zorlandı. Caruso, her hamlede pozisyonu yapay zekâya açıklamak zorunda kaldı. Bu süreçte “taş farkındalığı yokluğu” gibi temel eksiklikler kendini gösterdi.

Bazı durumlarda, oyun sıfırdan başlatılmak zorunda kaldı. Modelin değerlendirme hataları, satranç gibi strateji temelli oyunlarda henüz yüksek performans sergileyemediğini ortaya koydu.

Atari 2600’un 1 MHz’lik Motoru Galip Geldi

ChatGPT’nin karşısında yer alan satranç motoru, 1 MHz işlemci hızıyla çalışan ve sınırlı grafik kapasitesine sahip “Video Chess” isimli klasik bir Atari oyunu. Ancak bu basit yapı, dil modelinin algı ve strateji temelli kararlar karşısında ne kadar savunmasız olduğunu gözler önüne serdi.

ChatGPT ise başarısızlığını oyunun düşük çözünürlüklü ve sembolik arayüzüne bağladı. Ancak bu mazeret, tarihi bir oyun motoruna karşı alınan mağlubiyeti açıklamakta yetersiz kaldı.

Deneyin ardından Caruso, yeni bir test hazırlığında olduğunu açıkladı. Bir sonraki aşamada, 16 MHz hızında çalışan emüle edilmiş bir Intel 80286 işlemcide, 1990’ların klasiklerinden biri olan “Battle Chess” oyununda ChatGPT’ye yeniden meydan okunacak. Bu testin, büyük dil modellerinin etkileşimli oyunlardaki yeterlilik düzeylerine dair daha fazla veri sunması bekleniyor.