Son birkaç yıldır yapay zekanın gelişmekte olduğunu önceki yazılarımızda örnekleriyle açıklamıştık. Yapay zeka yaratıcılığınızı arttırabilir, sıradan görevleri yerine getirebilir ya da çalışma hızınızı arttırabilir. Bize bu kadar kolaylık sağlayan yapay zeka eklentilerine ve programlarına META tarafından bir yenisi eklendi. Kısa bir süre önce insanlara tanıtılan MusicGen, yapay zeka ile müzik oluşturmanızı sağlıyor. Oldukça yüksek potansiyeli olduğu konuşulan program sayesinde basit yazılı bir açıklama ile yüksek kaliteli, telifsiz müzikler yaratabilir ve projenizde kullanabilirsiniz.
Özellikle sinema sektöründe yapay zeka, düşük bütçeli işler için bir nimet. Bazı alanlara bütçe ayıramıyorsanız oldukça işe yarar yazılımlar mevcut. Ve bu yazılımlar sayesinde detaylı cümlelerinizle “çoğunlukla” ihtiyacınız olana ulaşabiliyorsunuz. MusicGen de bu yazılımlardan bir tanesi ve rakibi Google’ın MusicLM yazılımını geride bırakabileceği konuşuluyor.
MusicGen ve Rakipleri
META, rakiplerinden biri olan Google’ın tersine MusicGen’i açık kaynak proje olarak sundu, ki topluluk tarafından doğru ve iyi bir hareket olduğu düşünülüyor. İlgili kişiler sadece test etmekle kalmayıp programı geliştirmeye katkıda bulunabilir ayrıca bilgisi olanlar sinir ağına bağlı kalarak kendi varyasyonlarını oluşturabilir.
MusicGen, hem yazı hem de melodi ile uzun müzikler oluşturuyor. İster detaylı cümlelerle ne istediğinizi belirtin, isterseniz melodi ekleyin ve sizin için devamını getirsin.
META araştırma yazısında MusicGen, MusicLM, Riffusion ve Mousai yazılımlarının müzik oluşturma performansları karşılaştırılıyor. Sonuç: “MusicGen, hem ses kalitesi hem de sağlanan metin açıklamasına bağlılık açısından insan dinleyiciler tarafından değerlendirilmiş ve diğer yazılımlara göre daha iyi performans göstermiştir.”
MusicGen Nasıl Çalışıyor?
Yüzeysel bir incelemede gözlemlediğimizde program oldukça basit. Sisteme temel, açıklamalı bir cümle girip isterseniz referans melodi ekleyebilirsiniz. “Generate” tuşuna bastığınızda birkaç saniye içerisinde size 15 saniyelik bir ses dosyası sunulacaktır. Eğer bir melodi ekleyerek bunu denerseniz program size uygun müziği oluşturmaya çalışacaktır. Bu, “Friends” dizi müziğinin metal versiyonunu oluşturup kullanabilirsiniz demek oluyor.
MusicGen, kendisinden istediğiniz bpm (beats per minute) değerini doğru bir şekilde verebiliyor ki bu loop oluşturmak için doğru yapılması gereken bir tercih. Aynı zamanda film müziği için 15 saniye iyi sayılabilir bir süre. Daha uzun süreli bir müzik istiyorsanız Hugging Face’e üye olmanız gerekiyor. Üye girişiyle, projelerinizi kaydedebilir ve 120 saniyelik müzikler oluşturabilirsiniz.
Etik Soru
Yapay zeka programlarını deneyimlemek çok eğlenceli olabilir ama bazı yasal durumlar mevcut. Programları oluşturma aşamasında yaratıcılar, var olan görüntüleri kullanarak kendi modellerini oluşturuyor ve kullanım haklarını göz önünde bulundurmadan birçok veriyi izinsiz kullanabiliyor. Bu konu son zamanlarda yapım şirketleri ve oyuncular arasındaki tartışmayı da tetiklemiş durumda ki SAG-AFTRA ve WGA eylemleri devam ediyor. Zamanında kişisel verileri koruma konusunda sorunlar yaşayan ve davalık olan Mark Zuckerberg, sütten ağzı yanmış olsa ki META ekibiyle birlikte lisans konularına önem veriyor. Şirketin açıklamalarına göre MusicGen yaklaşık 10.000 saatlik yüksek kaliteli, izinleri alınmış şarkıları ve 390.000 enstrümanı kullanarak öğrenimini sağladı. Aynı zamanda araştıramalara göre bu veriler MIT ile yapılan legal anlaşmalar ile kullanılmış.
META: “Daha profesyonel kullanımlar sağlayan geliştirici, umuyoruz ki amatör ve profesyonel fark etmeksizin tüm müzisyenlere yararlı olur.”
Looplar ve Kaçınmanız Gereken Yerler
MusicGen’in kullanıma sunulması sonrası kısa müzikler oluşturmak çok kolay bir hale geldi. Herkes kısa bir melodisi ya da cümleleri bir araya getirerek programa eklediğinde “loop”lara ulaşabiliyor. Fakat gözden kaçırılmaması gereken bir konu var. Looplar nerede ve nasıl kullanılmalı kısmında iyi bir kulağa ve bilgiye sahip olmanız gerekir. MZed’in “Sinema Sesi” kursunun eğitmeni Mark Edward Lewis’in değindiği önemli bir nokta var.
-Yanlış seçilmiş ve yerleştirilmiş bir melodi oyuncunun performansını mahvedebilir.
Looplar, duyguların inişleri ve çıkışları arasındaki yumuşak geçişi sağlar. Seyircilere zamanda sıkışmayı ve gerginliği yaşatır. Müzik kendi tekrar eder, tekrar eder ve dönüşümü beklerken bir şey olacağını hissettirir. Diyaloglu bir sahnede aksiyonun altını çizmek istediğin zaman, dinamik olmayan bir anda heyecanı arttıran ya da komedi etkisini arttıran bir elementtir loop. Ama dramatik anlarda kullanılmaması gerekir. Oyuncunun performansını yok eder, duyguların önemini yok eder.
Bu temel bilgiler ışığında MusicGen’i test etmek isterseniz the Hugging Face üzerinden ya da model kodunu indirerek manuel olarak kurulumunu sağlayabilir ve denemeler yapabilirsiniz.
Yapay zekanın çoğu şeyi kolaylaştırırken insan emeğini hiçe sayılabileceğini, sırf bütçeden kısmak için tam anlamıyla iyi sonuçlar çıkaramayan programları kullanmanın doğru olmadığını savunsam da hayatta her şeyde olduğu gibi bu konuda da denge kurulduğu zaman çok büyük fayda sağlanabilir.
Kaynak: CineD