Tezin Türü: Yüksek Lisans
Tezin Yürütüldüğü Kurum: Eskişehir Osmangazi Üniversitesi, Fen Bilimleri Enstitüsü, Fen Bil.Enst.Md.Lüğü, Türkiye
Tezin Onay Tarihi: 2019
Tezin Dili: Türkçe
Öğrenci: EMRE ATEŞ
Danışman: Rifat Edizkan
Özet:
Sesli komut tanıma sistemleri, insan-makine etkileşimde yaygın olarak kullanılmaktadır. Ses tanımada akustik ve dil modelleri kullanılmaktadır. Ses tanımadaki başarım bu iki modele bağlıdır. Veritabanı dile ait özellikleri ne kadar iyi kapsarsa modelleme de o kadar iyi olmaktadır. Akustik ve dil modellemesi için çok disiplinli bir çalışma yapılması gereklidir. Bu tez çalışmasında, ses tanıma sistemlerinin daha kolay geliştirilmesi için derin öğrenme tabanlı yöntemin uçtan uca ses tanımada kullanılması ve sesli komut tanıma başarımlarının elde edilmesi üzerinde çalışılmıştır. Bu çalışmada, RNN yapısı ile Speech Commands Dataset içerisindeki temel komut kelimelerinin sınıflandırma başarımları elde edilmiştir. Deneysel çalışma sonunda %70,63 dogru sınıflandırma başarımı elde edilmiştir.
Anahtar kelimeler: Uçtan Uca, Ses Tanıma, Komut Tanıma, Derin Öğrenme, RNN.