İtalya'dan yapılan yeni yapay zeka araştırması, hem müzik sentezi hem de kaynak ayırma yeteneğine sahip, yayılmaya dayalı üretken bir model sunuyor - İnternette İstediğiniz Gibi Çevrimiçi Para Kazanma!

Yazıyı okuyorsunuz: İtalya’dan yapılan yeni yapay zeka araştırması, hem müzikal sentez hem de kaynak ayırma yeteneğine sahip, yayılmaya dayalı bir üretken model sunuyor

İnsanoğlu hem müzikal kompozisyon hem de sentez ve analiz yani kaynak ayırma açısından birden fazla ses kaynağını aynı anda işleyebilme yeteneğine sahiptir. Başka bir deyişle, insan beyni bireysel ses kaynaklarını bir karışımdan ayırabilir veya tam tersini yapabilir, yani tutarlı bir kombinasyon oluşturmak için çeşitli ses kaynaklarını sentezleyebilir. Bu bilginin matematiksel olarak ifade edilmesi söz konusu olduğunda araştırmacılar kaynakların ortak olasılık yoğunluğunu kullanırlar. Örneğin, müzikal mikslerin bir özelliği vardır. bağlam öyle ki kaynakların ortak olasılık yoğunluğu, bireysel kaynakların çarpımını etkilemez.

Şu anda birçok kaynağı tutarlı bir karışım halinde sentezleyebilecek ve bireysel kaynakları bir karışımdan ayırabilecek bir derin öğrenme modeli mevcut değildir. Kompozisyon veya müzik oluşturma görevleri söz konusu olduğunda modeller, miksler üzerindeki dağıtımı doğrudan öğrenir, miksajın doğru modellemesini sunar ancak bireysel kaynaklara ilişkin tüm bilgileri kaybeder. Kaynak ayırma modelleri ise her kaynak dağıtımı ve çıkarım zamanındaki koşul karışımı için tek bir model öğrenir. Böylece kaynakların karşılıklı bağımlılığına ilişkin tüm önemli ayrıntılar kayboluyor. Her iki senaryoda da karışımlar oluşturmak zordur.

Hem kaynak ayırmayı hem de müzik üretmeyi gerçekleştirebilen bir derin öğrenme modeli oluşturmaya yönelik bir adım atan Roma Üniversitesi GLADIA Araştırma Laboratuvarı’ndaki araştırmacılar, Çok Kaynaklı Yayılım Modelini (MSDM) geliştirdiler. Model, önceki dağılım adı verilen bir bağlamı paylaşan kaynakların ortak olasılık yoğunluğu kullanılarak eğitilir. Oluşturma görevi öncekinden örnekleme yoluyla gerçekleştirilir, ayırma görevi ise karışımdaki önceki dağılımın koşullandırılması ve ardından elde edilen son dağılımdan örnekleme yapılmasıyla gerçekleştirilir. Bu yaklaşım, evrensel ses modellerine doğru atılan önemli bir ilk adımdır çünkü bu, oluşturma ve ayırma görevlerini yerine getirebilen türünün ilk modelidir.

Araştırmacılar deneyleri için Slakh2100 veri setini kullandılar. 2100’den fazla parça Slakh2100 veri setini oluşturur ve bu da onu kaynak ayrımı için standart bir veri seti haline getirir. Slakh2100, ekibin veri kümesi olarak seçildi çünkü diğer çok kaynaklı veri kümelerinden çok daha büyük miktarda veriye sahip; bu da üretken bir modelin kalibresini oluşturmak için çok önemli. Modelin temeli, ön dağılım olan kaynakların ortak dağılımının tahmin edilmesine dayanmaktadır. Daha sonra, yukarıdakiler kullanılarak çıkarım zamanında farklı görevler çözülür. Kaynakların bir alt kümesinin diğerlerinden oluşturulduğu kaynak atama gibi kısmi çıkarım görevleri (örneğin, davulları tamamlayan bir piyano parçası kullanılarak), klasik çıkarım görevlerinin yanı sıra bazı ek görevlerdir.

Araştırmacılar yukarıdakileri öğrenmek için puanları karşılaştırarak eğitilmiş yayılmaya dayalı üretken bir model kullandılar. Bu tekniğe genellikle “skor eşleştirme” adı verilir. Puan eşleştirmenin temel fikri, dağıtımın kendisinden ziyade hedef dağıtımın “puan” fonksiyonuna yaklaşık değer vermektir. Araştırmacılar tarafından yapılan bir diğer önemli ekleme, kaynak ayırma görevlerinde dikkate değer sonuçlar elde etmek için Dirac delta fonksiyonlarına dayalı yeni bir örnekleme yönteminin tanıtılmasıydı.

Araştırmacılar, ayırma, kısmi ve toplam üretim modellerini değerlendirmek için bir dizi test gerçekleştirdi. Modelin ayırma görevlerindeki performansı diğer son teknoloji regresör modelleriyle aynı seviyedeydi. Araştırmacılar ayrıca şu anda erişilebilen bağlamsal veri miktarının algoritmalarının performansını sınırladığını da açıkladı. Ekip, sorunu çözmek için karışımları önceden ayırmayı ve bunları bir veri seti olarak kullanmayı düşündü. Özetle, GLADIA Araştırma Laboratuvarı tarafından sağlanan müzik alanında tam ve kısmi ayırma ve üretim için çok kaynaklı yayılma modeli yeni bir paradigmadır. Grup, çalışmalarının diğer akademisyenleri müzik alanında daha derin araştırmalar yapmaya teşvik edeceğini umuyor.

İtalya’dan yapılan yeni yapay zeka araştırması, hem müzik sentezi hem de kaynak ayırma yeteneğine sahip, yayılmaya dayalı üretken bir model sunuyor

Size şunları öneriyoruz: