DALL-E 2, Midjourney ve Stable Diffusion gibi yapay zekâlar, hayatımıza istediğimiz görseli sadece yazıyla anlatarak oluşturma gibi olağanüstü bir imkânı soktu. Tabii yeni gelişen her teknolojide olduğu gibi bu teknolojilerin de gelişme hızı, inanılmaz miktarda yüksek seviyede.
Bu teknolojilerin özellikle açık kaynak olarak yayınlanması halihazırda bu gelişime büyük bir katkı sunarken, bugün Stable Difusion’dan heyecanlandıran duyuru geldi. Yapay zekânın ardındaki ekip, Stable Diffusion’un ikinci versiyonunu kullanıma sundu.
CompVis tarafından geliştirilen yapay zekânın yeni sürümü Stable Diffusion 2.0, metinden görsel oluşturma imkânını yepyeni boyuta taşıyacak. LAION-5B veri seti ile eğitilen yeni model, daha yüksek çözünürlüklü görseller oluşturabilecek, düşük çözünürlüklü görselleri yüksek çözünürlüğe kavuşturabilecek ve görseller için çok daha tutarlı alternatifler sunabilecek. Gelin, tüm bunlara detaylarıyla bakalım.
Stable Diffusion 2.0 ile birlikte kullanıcılar, 512x512 veya 768x768 çözünürlüklerinde çıktılar alabilecekler. Ek olarak oluşturulan tüm fotoğraflar, LAION’un NSFW filtresinden geçerek yetişkin içeriklerden arındırılacak.
Yeni sürüm, artık 2048x2048 piksel ve daha yüksek çözünürlükte ‘upscale’ imkânı da sunacak. Oluşturduğunuz görsellerden beğendiğiniz örneği alıp, 512x512 pikselden çok daha yüksek çözünürlüklere taşıyabileceksiniz.
‘depth2img’ adlı yeni model ile birlikte 2.0 sürümü, görselleri çok daha iyi bir şekilde analiz edebilecek. Bu sayede yapay zekâ, sunduğunuz bir görselin farklı alternatiflerini daha yüksek anlam bağıyla oluşturabilecek.
Görselden görsele çıktının yanı sıra kullanıcılar, artık sundukları bir görselde istedikleri değişiklikleri yazıyla belirtebilecekler. Yapay zekâ, önce görseli analiz edecek, sonrasında metinle sunduğunuz değişiklikleri görsel üzerinde uygulayacak.
Stable Diffusion 2.0’a erişmek için bu bağlantıya tıklayarak yapay zekânın GitHub sayfasına ulaşabilirsiniz.
Yorumlar (0)