Çıkarıcı Türkçe metin özetleme performansını iyileştirmek için yeni yöntemler


Tezin Türü: Doktora

Tezin Yürütüldüğü Kurum: Eskişehir Osmangazi Üniversitesi, Fen Bilimleri Enstitüsü, Telekomünikasyon - Sinyal İşleme Bilim Dalı, Türkiye

Tezin Onay Tarihi: 2022

Tezin Dili: Türkçe

Öğrenci: SALİH BAL

Danışman: Efnan Şora Günal

Özet:

Otomatik metin özetleme, manuel müdahale olmaksızın bir metnin kısa ve öz bir versiyonunu elde etmeyi amaçlar. Günümüz dijital ortamlarında ve internette karşılaşılan büyük miktarda metin verisi göz önüne alındığında, bu verilerin doğru ve hızlı bir şekilde yorumlanabilmesi için otomatik metin özetleme sistemlerinin performansı hayati önem taşımaktadır. Otomatik metin özetleme, orijinal metnin en alakalı tümcelerinin seçildiği çıkarıcı türde veya orijinal metnin kısaltılmış ve başka sözcüklerle ifade edilmiş bir versiyonunun elde edildiği özetleyici türde olabilir. Bu tez, özellikle çıkarıcı Türkçe metin özetleme performansını geliştirmeyi amaçlamaktadır. Bu amaçla, ortak özniteliklerin ve ön işleme tekniklerinin otomatik metin özetleme performansı üzerindeki etkisi, çeşitli öznitelik seçme yöntemleri ve geleneksel makine öğrenimi algoritmaları kullanılarak kapsamlı bir şekilde analiz edilmiştir. Ayrıca, gizli anlamsal analize dayalı yeni bir ayırt edici öznitelik önerilmiştir. İlave olarak, farklı derin öğrenme modellerinin özetleme performansları analiz edilmiştir. Deneysel çalışmada toplam 120 belge ve 1.466 cümleden oluşan iki farklı veri seti kullanılmıştır. Özetleme performansını değerlendirmek için çeşitli başarı ölçütleri kullanılmıştır. Deneysel çalışmanın sonuçları, özetleme performansını iyileştiren optimal öznitelik alt kümesi ve en kullanışlı ön işleme yöntemleri ile en başarılı derin öğrenme modellerini ortaya çıkarmıştır. Ayrıca, önerilen özniteliğin özetleme performansını daha da iyileştirdiği doğrulanmıştır.