Bu öğeden alıntı yapmak, öğeye bağlanmak için bu tanımlayıcıyı kullanınız:
http://acikerisim.ktu.edu.tr/jspui/handle/123456789/446
Başlık: | Sesbirim tabanlı konuşulan dilin tanınması |
Diğer Başlıklar: | Speaker independent phoneme based spoken language recognition system |
Yazarlar: | Şen, Kamil Öncü |
Anahtar kelimeler: | Ses Analizi, Ses Tanıma, Sesbirim Tanıma, Kelime Belirleme, Hızlı Fourier Dönüşümü, Çapraz Korelâsyon, Dinamik Zaman Çarpıtma;Speech Analysis, Speech Recognition, Phoneme Recognition, Fast Fourier Transform, Haar Wavelet Transform, Word Detection |
Yayın Tarihi: | 2007 |
Yayıncı: | Karadeniz Teknik Üniversitesi |
Özet: | İlkel çağlardan günümüze kadar geçen zaman zarfı içerisinde, insanlar arası iletişim aracı hiç şüphe yoktur ki ses’dir. İnsanlar duygu, düşünce ve hareketlerini ifade etmede gerçekleştirdikleri seslerle insanlara ifade etmektedir. Benzer bir ilişki insanla bilgisayar arasında da kurulabileceği düşünülmüş ve bu aşamada çalışmalar başlamıştır. Ses tanıma sistemlerinin gelişimine bakıldığı zaman yurt dışında kayda değer çalışmalara rastlamak mümkündür. Ancak yurdumuzda aynı düzeyde olduğu pek söylenemez. Bu çalışmada bu açığı belirli bir düzeyde kapatmaya yönelik olmuştur. Amaç Türkçede sesbirim tabanlı bir tanıma sistemi gerçekleşmektir. Bu amaç doğrultusunda bir ses editörü yapılarak önce sesin alınması ve incelenerek sesbirimlerin kaydedilen kelimelerin içerisinden alınarak sesbirim veri tabanı oluşturulması gerçekleştirilmiştir. Bu veri tabanı oluşturulurken on farklı kadından ve on farklı erkekten ses kayıt örnekleri alınarak bu kayıtlar hem sesbirim veri tabanı oluşturmada hem de sesbirimlerin kayıtlar içerisinde aranmasında kullanılmıştır. Aynı zamanda radyodan alınan kayıtlardan sesbirim araştırması yapabilmek amaçlı 5 farklı kayıt alınmıştır. Çalışmada Kelime belirleme yöntemi, Hızlı Fourier dönüşüm yöntemi ve Saç Dalgacık Dönüşümü yöntemi kullanılarak Türkçedeki kelimelerin ve sesbirimlerin spektral analizi gerçeklenmiştir. Çapraz Korelâsyon yöntemi ve Dinamik Zaman Çarpıtma yöntemi kullanılarak kelimelerin içerisinde sesbirimlerin aranması yapabilecek bir sistem gerçekleştirilmiştir. Bu sistem sayesinde kelimelerin içinde belirlenen sesbirimin varlığı araştırılır ve eğer sesbirim bu kelimenin içerisinde var ise bulunduğu yer veya yerler belirlenir. Bu şekilde sistemin denetimi de yapılabilmektedir ve sesbirimler yazıya dönüştürülebilirler. Türkçe kayıtlarda İngilizce sesbirimler ve İngilizce kayıtlarda Türkçe sesbirimler aranarak dillerin birbirlerinin sesbirimlerine olan duyarlılığı test edilerek konuşulan dil belirlenebilirliği araştırılmıştır. Speech is the most important means for the communication between the human beings since primitive ages. Mankind transmits their feeling, thoughts and desires to the others by using speech. People thought that there could be make a communication between a human and a computer like communication between human being and started to work to carry out this imagination. When you look the improvement on this topic, there are many considerable researches made in developed countries, especially in western countries. However, we could not say the same for the researches made for Turkish. In this study, our most important aim is aid to cover this gap. This study’s aim is making a phoneme based speech recognition and language identification system. Through the aim, a sound editor is firstly implemented to make sound records, investigate these records, extract the phonemes in these speech records and create our own phoneme database. To build the database, ten speech records (male and female) for each phoneme are taken from ten different persons. In addition to this, five Turkish and five English speech samples are also taken from the radio for the investigation the phonemes if they are exist or not in these records. In this study, we have used Word Detection, Fast Fourier Transform and Wavelet Transform for the spectral analysis of words and phonemes. Then, these spectral analysis results are examined by employing Cross Correlation technique and Dynamic Time Warping technique. Hence, the system could search the phonemes in the words and if the phoneme exists in the word, then it finds where it is and how many times the phone exist in this word. Finally, the obtained results are discussed in various respects. |
URI: | http://acikerisim.ktu.edu.tr/jspui/handle/123456789/446 |
Koleksiyonlarda Görünür: | Bilgisayar Mühendisliği |
DSpace'deki bütün öğeler, aksi belirtilmedikçe, tüm hakları saklı tutulmak şartıyla telif hakkı ile korunmaktadır.