30 saniyelik bir ses akışından müzik türünü CNN kullanarak sınıflandırın.
Günümüzde, yapay zekâ teknolojilerinin ve verinin işlenebilirliğinin artmasıyla birlikte müzik endüstrisi dünya ekonomisi içinde önemli paya sahip olmaya başlamıştır. Bugün dünyaca ünlü birçok şirket (Spotify YouTube), hızlı bir şekilde çalma listeleri oluşturuyor ve dinleme modellerimize göre bir sonraki şarkıyı öneriyor. Bu kalıplar, dinlediğimiz şarkıların tonundan, ruh halinden veya türünden etkilenir. Birkaç değişken kararı etkiler. Bu değişkenlerin çoğu şarkının "kulağa nasıl geldiği" ile ilgilidir. Örneğin, bir pop şarkısı romantik bir şarkıdan daha hızlı ve daha eğlenceli olabilir. Müzik akışı hizmetleri, bu özellikleri tanımlayan belirli parametrelere dayalı olarak benzer sese veya duyguya sahip şarkıları aynı tür içinde kümeler. Bunlardan yola çıkarak müziği türlere göre sınıflandırmak, ilgili hizmetlerin müşterilerini memnun etmesi açısından önemlidir.
Bu projede, derin öğrenme tekniklerinden evrişimsel sinir ağları (CNN) kullanılarak müzik türü sınıflandırma üzerine bir çalışma gerçekleştirilmiştir. Bu amaç doğrultusunda, 2D CNN mimarisi tercih edilmiştir. Çalışma kapsamında, her biri 30 saniye uzunluğunda olan 200 müzik parçasından oluşan bir veri seti oluşturulmuştur. Veri seti; Türk Sanat Müziği, Pop, Rap ve Arabesk olmak üzere en çok tercih edilen dört müzik türünden her birine ait 50 parça içermektedir. Bu veri seti üzerinde gerçekleştirilen analizlerde, 2D CNN mimarisinin müzik türlerini sınıflandırmadaki performansı değerlendirilmiştir. Modelin başarısı %78 doğruluk oranı ile ölçülmüştür.