Tıpkı OpenAI üzere yapay zekâ dayanaklı teknolojiler üreten firmaların başında gelen Stability AI, bugün çok değerli bir duyuru gerçekleştirdi. Bu duyuruda, şirketin yeni yapay zekâ modeli “Stable Görüntü Diffusion” tanıtıldı. Şirketin metinden görsel üretmeye yarayan yapay zekâ modeli “Stable Diffusion” üzerine inşa edilen yeni model, metinleri evvel imajlara, akabinde da görüntülere dönüştürüyor.
Stable Görüntü Diffusion, şimdi erken basamakta olan bir yapay zekâ modeli. Hâl bu türlü olunca herkesin kullanımına açık değil. Ancak Stability AI’ın şanslı kişisel ve ticari lisans sahibi kullanıcıları, şirketin yeni yapay zekâ modelini şimdiden deneyebiliyorlar. Bu ortada; Stable Görüntü Diffusion için paylaşılan örnekler, teknolojinin hiç de fena olmadığını gözler önüne seriyor.
İşte Stable Görüntü Diffusion ile üretilen kimi örnek görüntüler:
Stability AI tarafından yapılan açıklamalara nazaran yeni yapay zekâ modeli, SVD ve SVD-XT halinde iki farklı çıktı formatı üretebiliyor. SVD formatı, 14 kareyi 576×1024 piksel çözünürlükte görüntü hâline getiriyor. SVD-XT ise bir içerik için 24 kare kullanabiliyor. Her iki formatta da 3 ila 30 fps arasında manzara alınabiliyor.
Stable Görüntü Diffusion, milyonlarca görüntünün eğitim için kullanıldığı bir model. Şirket, bu türlü devasa bir bilgi seti ile eğittiği modeli, ikinci kademede yaklaşık bir milyon görüntü kullanarak tekrar eğitti. İkinci eğitim, Stable Görüntü Diffusion tarafından üretilen imgelere ince ayar yapılmasını sağladı. Lakin şirket, bilgi setlerinde kullandığı görüntüleri nereden temin ettiğine ait bir açıklama yapmadı. Aslında şirket, eğitim datalarının telifsiz ve kamuya açık bilgi tabanlarından alındığını söylüyor lakin bunun nasıl yapıldığını bilen yok.
Stability AI’ın açıklamasına nazaran yeni yapay zekâ modeli, aslında ticari kullanım için tasarlandı. Şirket, geliştirdiği teknolojinin reklamcılık, eğitim ve cümbüş üzere birtakım kesimlerde işleri kolaylaştıracağını söylüyor. Lakin bunun ferdi açıdan kullanımının yol açabileceği kimi meseleler olduğunu atlamamak gerek. Sonuçta deepfake teknolojisinin sonuçlarını hepimiz biliyoruz…
İşte Stable Görüntü Diffusion, ferdi kullanım risklerini ortadan kaldırmak için kimi kısıtlamalar içeriyor. Yapılan açıklamalara nazaran bu yapay zekâ modeli, yine düzenlemeye müsaade vermiyor. Ayrıyeten bir kişinin yüzü, metindekiyle uyumlu olmayabiliyor. Tüm bunlara ek olarak yeni yapay zekâ modeli, büyük oranda hareketsiz yahut yavaş kamera efektleri içeren imajlar de üretmiyor. Takımın bu metotlarla tüketicileri koruyup koruyamayacakları şimdilik bilinmeyen.