DSpace@İHÜ

Akustik ve prosodik özniteliklere dayalı olarak konuşmacıların yaş ve cinsiyet grubuna göre sınıflandırılması

Basit öğe kaydını göster

dc.contributor.author Yücesoy, Ergün
dc.date.accessioned 2022-05-09T12:07:24Z
dc.date.available 2022-05-09T12:07:24Z
dc.date.issued 2017-06
dc.identifier.uri http://acikerisim.ktu.edu.tr/jspui/handle/123456789/3372
dc.description.abstract Bu çalışmada konuşmacının yaş ve cinsiyet grubunun otomatik olarak belirlenmesi konusu ele alınmıştır. Başta ticari, medikal ve adli olmak üzere geniş bir uygulama alanına sahip olan otomatik yaş ve cinsiyet tanıma sistemleri doğrudan bir servisin seçiminde kullanılabileceği gibi farklı tanıma sistemlerinde ön işlem olarak da kullanılır. Ancak konuşma sinyali oldukça değişkendir ve başarılı bir sistemin gerçekleştirilmesi için konuşmayı etkileyen tüm faktörlerin değerlendirilmesi gerekir. Bu çalışmada ses işleme alanında kullanılan çeşitli öznitelik çıkarma ve sınıflandırma yöntemleri incelenerek bu yöntemlerle geliştirilen yaş ve cinsiyet sınıflandırma sistemlerinin performans değerlendirmeleri yapılmıştır. Her bir sistemin avantaj ve dezavantajları ortaya koyularak bu sistemler için en uygun model büyüklüğü, konuşma süresi, öznitelik boyutu gibi parametreler belirlenmiştir. Çalışmada, yaygın olarak kullanılan akustik ve prosodik özniteliklerin yanı sıra ses kaynağından çıkarılan parametrelerde incelenmiştir. Sınıflandırma yöntemi olarak dinamik zaman bükme, vektör nicemleme, Gauss karışım modeli (GMM), Destek Vektör Makineleri ve GMM süpervektörler kullanılmıştır. Çalışmada ayrıca 7 farklı alt sistemin skor seviyeli birleşimine dayanan yeni bir sistem önerilerek %5 civarında başarı artışı sağlanmıştır. Sıkıntı öznitelik projeksiyonu (NAP) yöntemi ile gerçekleştirilen kanal dengelemenin başarı üzerindeki etkisi ise %1.5 olmuştur. tr_TR
dc.language.iso tr tr_TR
dc.publisher Karadeniz Teknik Üniversitesi / Fen Bilimleri Enstitüsü tr_TR
dc.subject Yaş ve cinsiyet tanıma, Akustik ve Prosodik öznitelik, Gauss karışım modeli, Ses kaynağı, Skor seviyeli birleşim, Süpervektör, Destek vektör makinesi tr_TR
dc.subject Age and gender recognition, Acoustic and prosodic features, Gaussian mixture model, Voice source, Score-level fusion, GMM supervector, Support vector machine tr_TR
dc.title Akustik ve prosodik özniteliklere dayalı olarak konuşmacıların yaş ve cinsiyet grubuna göre sınıflandırılması tr_TR
dc.title.alternative Classification of speakers based on acoustic and prosodic features according to age and gender groups tr_TR
dc.type Thesis tr_TR


Bu öğenin dosyaları:

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Basit öğe kaydını göster