OpenAI’dan Yapay Zekâ Modelleri İçin 1 Milyon Dolarlık Performans Testi: SWE-Lancer

Sektörel

OpenAI, yapay zekâ modellerinin test edilmesini sağlayan "SWE-Lancer"ı duyurdu. OpenAI’a göre bu testte yer alan bazı görevler, en gelişmiş yapay zekâ modelleri tarafından bile tamamlanamıyor.

Yapay zekâ sektörünün bir numarası OpenAI, "SWE-Lancer" olarak isimlendirdiği yeni bir yapay zekâ test mekanizması duyurdu. Şirketin açıklamasına göre 1.400’den fazla yazılım mühendisliği görevini içeren SWE-Lancer’ın toplam ödül büyüklüğü ise 1 milyon dolar.

OpenAI’ın açıklamasına göre SWE-Lancer, 50 dolarlık basit hata düzeltmelerinden 32 bin dolarlık geniş kapsamlı mühendislik görevlerini içeriyor. Ancak SWE-Lancer testinin çok daha dikkat çekici bir özelliği var.

SWE-Lancer görevleri, en gelişmiş yapay zekâ modellerini bile zorluyor

Open AI SWE-Lancer duyurdu

OpenAI, SWE-Lancer testi ile ilgili dikkat çeken bir bilgi verdi. Yapılan açıklamaya göre bu test içerisinde yer alan en azından bazı görevler, en gelişmiş yapay zekâ modelleri tarafından bile çözülemiyor. Bu da testin, yapay zekâ modelleri için önemli bir kıyas aracı hâline geleceği anlamına geliyor.

OpenAI, SWE-Lancer’ın "SWE-Lancer Diamond" isimli bir versiyonunu açık kaynak kodlu olacak şekilde paylaştı. Şirket, bu test ile yapay zekâ modellerinin sağlayacağı ekonomik kazançlar hakkında araştırmalar yapılabileceğini ve nispeten somut verilere ulaşılacağını söylüyor.

Etiketler:

#OpenAI’dan Yapay Zekâ Modelleri İçin 1 Milyon Dolarlık Performans Testi: SWE-Lancer

Kaynak:

https://www.webtekno.com/openai-yapay-zeka-performans-testi-swe-lancer-h155896.html