Bu öğeden alıntı yapmak, öğeye bağlanmak için bu tanımlayıcıyı kullanınız:
http://acikerisim.ktu.edu.tr/jspui/handle/123456789/420
Başlık: | Metinsel veri madenciliğinde bilgisayarlı çeviriciler |
Diğer Başlıklar: | Machine translator in the textual data mining |
Yazarlar: | Rouka, Leila |
Anahtar kelimeler: | Metin sınıflandırma;Vektör uzayları ;Veri analizi ;Veri madenciliği; Veriler; Çeviriciler ; Örüntü tanıma; Öznitelik ;Öznitelik vektörü ; Öznitelik çıkarma;Text categorization ; Vector spaces ; Data analysis ; Data mining ; Data ; Converters ; Pattern recognition ; Feature extraction ; Feature vector ; Feature |
Yayın Tarihi: | 2012 |
Yayıncı: | Karadeniz Teknik Üniversitesi |
Özet: | Bu çalışmada, metinsel veri sınıflandırmada bilgisayarlı çeviricilerin etkisi değişik sınıflandırma yöntemleri kullanılarak incelenmiştir. Geliştirilen sistem ilk olarak orijinal dildeki metini analiz edip sınıflandırmakta ve daha sonra aynı metini bilgisayarlı çeviriciler kullanarak hedef dile çevirmekte ve çevrilen metini orijinal dildeki gibi aynen analiz ederek sınıflandırmaktadır. Daha sonra, metinsel veri sınıflandırmada bilgisayarlı çeviricilerin etkisini ölçmek için elde edilen sonuçlar karşılaştırılmıştır.Bu çalışmada, kullanılan sınıflandırma yöntemi performansları da ölçülmüş ve karşılaştırılmıştır. Elde edilen sonuçlara göre Multinomial Naive Bayes yöntemi en başarılı yöntemdir. Yine, aynı belgenin farklı dillere çevrilmiş sınıflandırma sonuçları dikkate alındığında, bilgisayarlı çeviricilerin metinsel veri sınıflandırmada oldukça az bir etkisi olduğu görülmüştür. Bu sonuçlar bilgisayarlı çeviricilerin bir dil temel alınarak farklı dillerde veri madenciliğinin oldukça etkin bir şekilde yapılabileceğini göstermektedir. In this study, we evaluate the efficiency of Machine Translators on the Web-based texts classification, by classification Original texts into predefined categories and then translating them into other language with machine translator for accomplish classification operation with the same categories and assess the results in two situations. In addition to this, the effect of machine translators in the textual data classification is examined by using supervised classification methods. The developed system first analyzes and classifies an input text in one language, and then analyzes and classifies the same text in another language generated by machine translators from the input text. The obtained results are compared to measure the effect of the translators in textual data classification. The performances of the classification method used in this study are also measured and compared. The obtained results show that Multinomial Naïve Bayes method is the most successful method, and that the machine translation has quite a small effect on the attained classification accuracy. |
URI: | http://acikerisim.ktu.edu.tr/jspui/handle/123456789/420 |
Koleksiyonlarda Görünür: | Bilgisayar Mühendisliği |
DSpace'deki bütün öğeler, aksi belirtilmedikçe, tüm hakları saklı tutulmak şartıyla telif hakkı ile korunmaktadır.