Tezin Türü: Doktora
Tezin Yürütüldüğü Kurum: Eskişehir Osmangazi Üniversitesi, SAĞLIK BİLİMLERİ ENSTİTÜSÜ, Biyoistatistik Bilim Dalı, Türkiye
Tezin Onay Tarihi: 2022
Tezin Dili: Türkçe
Öğrenci: ALİ VASFİ AĞLARCI
Danışman: Cengiz Bal
Özet:
Başlık: Kronik Hepatit C Hastalığı Risk Belirlenmesinde Sıralı Lojistik Regresyon ve Makine Öğrenme Algoritmalarının Sınıflama Performansının Karşılaştırılması. Amaç: Günümüzde sağlık verilerindeki büyümeyle birlikte bu verilerden elde edilecek anlamlı çıktı ihtiyacı makine öğrenmesi algoritmalarının kullanımını artırmıştır. Yapılan çalışmalarda sınıflama amaçlı hastalık var-yok, hasta-sağlıklı, ölü-sağ vb. şekilde ikili sınıflandırma çalışmaları yapılmakla birlikte bu çalışmalarda kullanılan yöntemlerin sınıflama performansları hakkında karşılaştırmalar verilmiştir. Bu çalışmanın amacı ise cevap değişkeninin ordinal yapıda ve 2 kategoriden çok olduğu durumda Sıralı Lojistik Regresyon analizi ile makine öğrenme algoritmalarının sınıflama performanslarını hem simülasyon çalışması ile hem de gerçek veri seti ile karşılaştırarak literatüre sunmaktır. Yöntem: Sınıflandırma işlemlerinde cevap değişkeni her zaman iki kategorili olmamakta ve cevap değişkeninin kategorileri farklı veri yapısında olabilmektedir. Bu çalışmada cevap değişkeninin ordinal yapıda olduğu durumda kategori sayısı, korelasyon yapısı, örnek hacmi, cevap değişkeni kategorilerinin eşit dağılım gösterdiği ve göstermediği durumlar dikkate alınarak farklı senaryolar oluşturulmuş ve istatistiksel öğrenme yöntemi olan Sıralı Lojistik Regresyon yöntemi ve makine öğrenme yöntemlerinin sınıflandırma performansları karşılaştırılmıştır. Oluşturulan 90 farklı senaryo altında R programı aracılığıyla binary, ordinal ve sürekli tipte veriler türetilmiştir. Sınıflandırma işleminde Destek Vektör Makineleri, Yapay Sinir Ağları, K-En Yakın Komşu, Rasgele Orman, Sınıflandırma ve Regresyon Ağaçları ve Sıralı Lojistik Regresyon yöntemleri kullanılmıştır. Çalışmamızda kullanılan gerçek veri seti ise Hepatit C tedavisi gören hastalar hakkında bilgiler içermektedir. Bulgular: Simülasyonla ve gerçek veri seti ile sınıflama sonucu yöntemler karşılaştırıldığında Destek Vektör Makineleri yönteminin tüm senaryolarda en iyi sınıflama performansını gösterdiği, Sınıflandırma ve Regresyon Ağaçları yönteminin ise sınıflandırma performansının diğer yöntemlere göre düşük kaldığı görülmüştür. ii Sonuç: Hem kronik Hepatit C hastalığında hem de çeşitli diğer hastalık türlerinde makine öğrenme algoritmalarının özellikle de Destek Vektör Makinelerinin tedavi süreçlerinin iyileştirilmesine katkı sağlayacağı düşünülmektedir.