Google, yeni yapay zekâ modeli PaliGemma 2’yi duyurdu. Modelin en dikkat çekici özelliği, görsellerdeki kişilerin duygularını tanıyabilme yeteneği. Ancak bu özellik henüz işlevsel olarak kullanılabilir durumda değil.
PaliGemma 2, görüntüleri analiz edebiliyor ve gördüğü kişilerle ilgili açıklamalar yapabiliyor. PaliGemma 2, önceki sürümün geliştirilmiş hali olarak, görüntülerdeki eylemleri, duyguları ve hikayeyi daha detaylı şekilde tanımlama yeteneğine sahip.
Google, PaliGemma 2 modelinin görselleri detaylı şekilde analiz ederek, sahnelerdeki eylemleri, duyguları ve genel hikayeyi tanımladığını açıkladı. Ancak modelin duygusal tespit özelliği henüz başlangıç aşamasında ve tam anlamıyla kullanılamıyor.
PaliGemma 2, görsel içeriklere daha kapsamlı başlıklar ekleyerek basit nesne tanımalarının ötesine geçebilmeyi hedefliyor. Artık sahnedeki eylemleri, duyguları ve genel hikayeyi doğru bir şekilde tanımlayabilen model, 3B, 10B ve 28B parametre seçenekleriyle sunuluyor. Ayrıca, görüntülerin çözünürlük seçenekleri 224px, 448px ve 896px olarak belirlenmiş durumda. PaliGemma 2’nin sağladığı diğer avantajlar arasında, optik karakter tanıma (OCR) ve belgelerdeki tabloların yapısını anlama yer alıyor. PaliGemma 2 özellikle kimyasal formül tanıma, müzik notası tanıma ve göğüs röntgeni raporu üretme gibi alanlarda çözüm sunabiliyor olacak.
PaliGemma 2’nin duygu tanıma özelliği, henüz tam olarak kullanıma sunulmadan önce önemli etik tartışmaları beraberinde getiriyor. Uzmanlar, bu teknolojinin yanlış kullanımı durumunda çeşitli toplumsal sorunlara yol açabileceği konusunda uyarılarda bulunuyor. Bu tür gelişmelerin ilerleyen dönemlerde daha geniş kapsamlı etik değerlendirmelere tabi tutulması bekleniyor.
Yorumlar (0)