Tezin Türü: Doktora
Tezin Yürütüldüğü Kurum: Eskişehir Osmangazi Üniversitesi, Fen Bilimleri Enstitüsü, Telekomünikasyon - Sinyal İşleme Bilim Dalı, Türkiye
Tezin Onay Tarihi: 2022
Tezin Dili: Türkçe
Öğrenci: SALİH BAL
Danışman: Efnan Şora Günal
Özet:
Otomatik metin özetleme, manuel müdahale olmaksızın bir metnin kısa ve öz bir versiyonunu elde etmeyi amaçlar. Günümüz dijital ortamlarında ve internette karşılaşılan büyük miktarda metin verisi göz önüne alındığında, bu verilerin doğru ve hızlı bir şekilde yorumlanabilmesi için otomatik metin özetleme sistemlerinin performansı hayati önem taşımaktadır. Otomatik metin özetleme, orijinal metnin en alakalı tümcelerinin seçildiği çıkarıcı türde veya orijinal metnin kısaltılmış ve başka sözcüklerle ifade edilmiş bir versiyonunun elde edildiği özetleyici türde olabilir. Bu tez, özellikle çıkarıcı Türkçe metin özetleme performansını geliştirmeyi amaçlamaktadır. Bu amaçla, ortak özniteliklerin ve ön işleme tekniklerinin otomatik metin özetleme performansı üzerindeki etkisi, çeşitli öznitelik seçme yöntemleri ve geleneksel makine öğrenimi algoritmaları kullanılarak kapsamlı bir şekilde analiz edilmiştir. Ayrıca, gizli anlamsal analize dayalı yeni bir ayırt edici öznitelik önerilmiştir. İlave olarak, farklı derin öğrenme modellerinin özetleme performansları analiz edilmiştir. Deneysel çalışmada toplam 120 belge ve 1.466 cümleden oluşan iki farklı veri seti kullanılmıştır. Özetleme performansını değerlendirmek için çeşitli başarı ölçütleri kullanılmıştır. Deneysel çalışmanın sonuçları, özetleme performansını iyileştiren optimal öznitelik alt kümesi ve en kullanışlı ön işleme yöntemleri ile en başarılı derin öğrenme modellerini ortaya çıkarmıştır. Ayrıca, önerilen özniteliğin özetleme performansını daha da iyileştirdiği doğrulanmıştır.