Yapay zeka sayesinde video üretme dönemi başladı: Sonuçlar etkileyici

Şimdiye kadar video üretimi yapan yapay zeka modelleri gördük ancak Stable Diffusion‘ın arkasındaki yapay zeka girişimi Stability AI, bu alana girerek kaliteyi oldukça yukarlara çekiyor. Benzerlerinden kalite ve gerçekçilik olarak ayrılan yeni Stable Video Diffusion modeli, kullanıcıların tek bir görüntüden video oluşturmalarına olanak tanıyor.

Yapay zeka artık videolar da üretiyor

Stable Video Diffusion aslında iki model şeklinde geliyor: SVD ve SVD-XT. İlki olan SVD, hareketsiz görüntüleri 14 karede 576×1024 videolara dönüştürüyor. SVD-XT aynı mimariyi kullanıyor, ancak kareleri 24’e çıkarıyor. Her ikisi de saniyede üç ila 30 kare arasında videolar üretebiliyor. Bu video çıktıkları Meta’nın son video oluşturma modelinden elde edilen çıktıların yanı sıra Google ve yapay zeka girişimleri Runway ve Pika Labs’in çıktılarıyla ya kafa kafaya ya da daha kaliteli görünüyor.

Bu gelişmelerin yanında Stable Video Diffusion şimdilik sadece araştırma amaçlı kullanılabiliyor, gerçek dünya ya da ticari uygulamalar için değil. Stability AI, potansiyel kullanıcıların erişim için bir bekleme listesine kaydolabileceğini belirtirken araç, reklamcılık, eğitim, eğlence ve daha birçok sektördeki potansiyel uygulamalarda kullanılabilecek.

Eksikler var

Yukarıdaki videoda gösterilen örneklerin nispeten yüksek kalitede olduğu ve rakip üretici sistemlerle eşleştiği görülüyor. Bununla birlikte, şirketin yazdığına göre bazı eksikler var: nispeten kısa video üretiyor (4 saniyeden az), mükemmel fotogerçekçilikten yoksun, yavaş kaydırmalar dışında kamera hareketi yapamıyor, metin kontrolü yok, okunaklı metin üretemiyor ve insanları ve yüzleri düzgün bir şekilde oluşturamayabiliyor.

Eğitim tarafındaysa Stability AI, aracın milyonlarca videodan oluşan bir veri seti üzerinde eğitildiğini ve ardından birkaç yüz bin ila bir milyon videodan oluşan daha küçük bir veri seti üzerinden ince ayarlamalardan geçtiğini söylüyor. Stability AI yalnızca araştırma amacıyla kamuya açık olan videoları kullandığının altını çiziyor.

Tıpkı metinden görüntüye yapay zeka araçlarının hızla gelişerek fotogerçekçi seviyeye ulaşması gibi video üreten yapay zekalar da hızlı bir şekilde çok daha gerçekçi içerikler üretebilecek. Tüm bunlar deepfake, telif hakkı ve bir takım kötüye kullanım riskiyle birlikte geliyor. Dolayısıyla geliştirmelerin sınırlamalar içerisinde yapılması elzem.

Related Posts

Bir yanıt yazın Yanıtı iptal et