Marka programları

Google Veo 3 algoritması, senkronize sesle üretilen video üretiyor

Google Veo 3, haftanın ortasında video oluşturma algoritmasının üçüncü neslini duyurdu. Bu kez rakiplerinden önemli ölçüde farklılaşan algoritma, hareketli görüntülere uygun şekilde oluşturulmuş ses parçası ekleyebiliyor.

2023 baharında, bilgisayar destekli Will Smith karakterinin spagettiyi yuttuğu grotesk görüntülere tanık olduğumuzdan beri , video oluşturma algoritmaları büyük ilerleme kaydetti. Yaklaşık iki yıl içinde, alay konusu olabilecek ürünlerden , ortalama bir web kullanıcısının bunları gerçekten doğru bir şekilde tespit edip edemeyeceğini ciddi olarak sorgulamamız gereken ürünlere geçtik . Google’ın Veo algoritmasının son üçüncü versiyonunda ise , kullanıcının metin komutuyla isteğine göre kayda konuşma veya ses eklenebilmesi nedeniyle zorluk daha da karmaşık bir hal aldı.

Örneğin, Will Smith’in komik spagetti yeme testinde çıtır çıtır olduğu için başarısız oluyor . Ama biraz deneme-yanılma ve şansla, sosyal medyayı dolduran korkutucu derecede gerçekçi görüntüler yaratmak mümkün. Yaratıcıları ayrıca Google‘ın geçen hafta duyurduğu bir başka yeni özelliği daha kullanıyor: Daha kısa oluşturulmuş klipleri biraz daha uzun filmlere birleştirmenize olanak tanıyan Flow aracı . Her ikisi de Google’ın en pahalı üretim hizmeti olan AI Ultra abonelerine sunuluyor .

Böyle bir teknolojinin ortaya çıkması çok da şaşırtıcı değil, zira şirket geçen yıl konuşma ve fon müziği oluşturmak için ayrı bir araç tanıtmıştı . Veo 3 böylece daha önceki buluşları tek bir çatı altında topladı. Mühendisler algoritmalarına tam olarak nerede konuşmayı öğrettiklerini henüz açıkça söylemediler

Ancak YouTube‘un onların himayesinde olduğu düşünüldüğünde, bu çok da zor bir bulmaca değil.

Yorumlar

0 Yorumlar

İlgili Yazılar

1 of 12

Bir Yanıt Yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

This site uses Akismet to reduce spam. Learn how your comment data is processed.