Yapay zekâ sektörünün bir numarası OpenAI, "SWE-Lancer" olarak isimlendirdiği yeni bir yapay zekâ test mekanizması duyurdu. Şirketin açıklamasına göre 1.400’den fazla yazılım mühendisliği görevini içeren SWE-Lancer’ın toplam ödül büyüklüğü ise 1 milyon dolar.
OpenAI’ın açıklamasına göre SWE-Lancer, 50 dolarlık basit hata düzeltmelerinden 32 bin dolarlık geniş kapsamlı mühendislik görevlerini içeriyor. Ancak SWE-Lancer testinin çok daha dikkat çekici bir özelliği var.
OpenAI, SWE-Lancer testi ile ilgili dikkat çeken bir bilgi verdi. Yapılan açıklamaya göre bu test içerisinde yer alan en azından bazı görevler, en gelişmiş yapay zekâ modelleri tarafından bile çözülemiyor. Bu da testin, yapay zekâ modelleri için önemli bir kıyas aracı hâline geleceği anlamına geliyor.
OpenAI, SWE-Lancer’ın "SWE-Lancer Diamond" isimli bir versiyonunu açık kaynak kodlu olacak şekilde paylaştı. Şirket, bu test ile yapay zekâ modellerinin sağlayacağı ekonomik kazançlar hakkında araştırmalar yapılabileceğini ve nispeten somut verilere ulaşılacağını söylüyor.
Yorumlar (0)