Yapay zeka, artık insan seviyesinde Minecraft da oynamayı başarıyor

OpenAI uzmanları, Minecraft’ı insan oyuncular kadar yüksek standartta oynayan bir hudut ağını eğitti. Sinir ağı, klavye ve fare girişlerinin de kaydedildiği, yüklenicilerin muhakkak oyun içi vazifeleri gerçekleştirdiği küçük bir görüntü veritabanıyla desteklenen 70.000 saatlik çeşitli oyun içi manzaralar ile eğitildi.

İnce ayardan sonra OpenAI, modelin yüzmeden hayvan avlamaya ve etlerini tüketmeye kadar her türlü karmaşık beceriyi gerçekleştirebildiği gördü. Birebir vakitte, oyuncunun yükselmek için sıçrarken altına bir materyal bloğu yerleştirdiği bir hareket olan “sütun tırmanmayı” da kavradı.

Belki de en etkileyici olanı, yapay zeka, OpenAI’nin bir bilgisayar ortacısı için gibisi görülmemiş bir muvaffakiyet olarak tanımladığı, sırayla yürütülmesi gereken uzun bir dizi aksiyonu gerektiren elmas araçları üretebildi.

Minecraft projesi, şirketin Görüntü PreTraining (VPT) olarak isimlendirilen AI modellerinin eğitiminde OpenAI tarafından kullanılan yeni bir tekniğin işe yaradığını kanıtladığından ötürü büyük ehemmiyet taşıyor.

Geçmişe bakıldığında, yapay zeka modellerini eğitmek için bir kaynak olarak ham görüntüyü kullanmanın en büyük zorluğu, olanların anlaşılması için gereğince kolay olmasıydı, lakin bu görüntü eğitimleri sonuçların nasılını öğretmiyor. Gerçekte, AI modeli istenen sonuçları emiyor, lakin bunlara ulaşmak için gereken girdi kombinasyonlarını kavrayamıyor.

Ancak VPT ile OpenAI, temel modeli oluşturmak için ilgili klavye ve fare hareketleriyle etiketlenmiş, itinayla seçilmiş bir imaj havuzuyla halka açık web kaynaklarından alınan büyük bir görüntü bilgi kümesini eşleştiriyor.

Ekip, temel modelde ince ayar yapmak maksadıyla makul misyonları öğretmek için tasarlanmış daha küçük bilgi kümelerini ekler. Bu manada, OpenAI, ağaçların kesilmesi ve üretim istasyonları inşa edilmesi üzere erken oyun hareketlerini gerçekleştiren oyuncuların manzaralarını kullandı. Bunun, modelin bu vazifeleri yerine getirebildiği güvenilirlikte “büyük bir gelişme” sağladığı söyleniyor.

Bir öteki teknik, pekiştirmeli öğrenme olarak bilinen bir uygulama olan bir dizi vazifedeki her adımı başarmak için AI modelini “ödüllendirmeyi” içeriyor. Bu süreç, hudut ağının insan seviyesinde bir muvaffakiyet oranına sahip olarak bir elmas kazma üretebilmek için tüm materyalleri toplamasını sağladı.

OpenAI tarafından gönderilen bir blog yazısında “VPT, sadece lisandan daha fazla alanda direkt büyük ölçekli davranışsal öncelikleri öğrenmenin heyecan verici mümkünlüğünü sunuyor. Sadece Minecraft’ta deneyler yapsak da, oyunun ucu çok açık ve lokal insan arayüzü (fare ve klavye) çok genel, bu nedenle sonuçlarımızın öbür benzeri alanlar, örneğin bilgisayar kullanımı için güzele işaret ettiğine inanıyoruz.