Otel yorumları üzerinde konu modelleme algoritmalarının uygulanması


Creative Commons License

Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Eskişehir Osmangazi Üniversitesi, Fen Bilimleri Enstitüsü, Fen Bil.Enst.Md.Lüğü, Türkiye

Tezin Onay Tarihi: 2022

Tezin Dili: Türkçe

Öğrenci: AHMET KAYA

Danışman: Eyyüp Gülbandılar

Açık Arşiv Koleksiyonu: AVESİS Açık Erişim Koleksiyonu

Özet:

İnternet üzerinde üretilen veriler her geçen gün artmaktadır. Bu verilerin çoğunluğunu metinler oluşturmaktadır. Metinlerin çoğunlukta olması, bilim insanlarını bu alandaki problemler üzerinde daha fazla çalışma yapmaya yönlendirmiştir. Metinler üzerinde yapılan çalışmaların son zamanlarda en popüler yöntemi konu modelleme yöntemleridir. Konu modelleme yöntemlerinin amacı metinlerin içerisindeki gizli veya açık geçen konuları tespit etmektir. Bu çalışma kapsamında elde edilen metin veri kümeleri üzerinde gizli dirichlet ayrımı (GDA), ilişkili konu modeli (İKM) ve yapısal konu modeli (YKM) yöntemleri uygulanmıştır. Çalışmada konu modelleme yöntemlerinin sonuçlarını karşılaştırabilmek için konu tutarlılığı ve çapraşıklık değerleri kullanılmıştır. YKM yöntemini anlatan makalede kullanılan veri ve bu verinin ham hali, internet kaynaklı elde edilen İngilizce otel müşteri yorumları ve Türkçe otel müşteri yorumları olmak üzere 4 farklı veri üzerinde çalışmalar yapılmıştır. Yapılan tüm çalışmalar tutarlılık ve çapraşıklık değeri hesaplanıp sonuçları karşılaştırılmıştır. İngilizce veri üzerinde yapılan çalışmaların sonuçlarına bakıldığında YKM tip 1 yönteminin diğer yöntemlere göre daha başarılı olduğu görülmüştür. Türkçe veri üzerinde İKM tip 2 yöntemi daha başarılı olmuştur. Sonuçlar genel olarak incelendiğinde c_v tutarlılık ölçümünün çapraşıklık değeri ile tutarlı olduğu gözlenmiştir. İngilizce veriler için tutarlılık ve çapraşıklık değer karşılaştırmaları uyumluyken Türkçe veri üzerindeki sonuçlarda uyum gözlenmemiştir.