Keylogger ve Gizlilik: Makine Öğrenimi Modellerinin Karşılaştırması


KIZILTEPE S., GÜLBANDILAR E.

Afyon Kocatepe Üniversitesi Fen ve Mühendislik Bilimleri Dergisi, cilt.24, sa.5, ss.1189-1197, 2024 (Hakemli Dergi) identifier

Özet

Keylogger yazılımları, kullanıcının klavye kullanarak girdiği verileri günlüğe kaydederek yakalayıp, tutan ve bunları saldırgan'a gönderen casus yazılımlardır. Kişisel bilgilerin ve gizliliğin tehlikeye girmesine neden olabileceği için bu konuda yapılan çalışmalar gizlilik ve güvenliği sağlamak açısından büyük önem taşımaktadır. Makine Öğrenimi (ML) yöntemleri, anormallikleri analiz ederek tespit edebilir ve keylogger'ları tanımlayabilir. Bu çalışmanın amacı, keylogger'ları tespit edebilen ve en yaygın kullanılan ML yöntemlerini belirleyerek bu yöntemler arasında performans karşılaştırması yapmaktır. Bu amaç doğrultusunda, bir veri seti üzerinde LightGBM, kNN, Decision Tree ve Random Forest modellerinin keylogger tespitindeki doğruluk oranlarını hesaplayarak performans karşılaştırmaları yapılmıştır. Yapılan çalışmada AUC skoru sonuçlarına göre Random Forest modelinin diğer modellere kıyasla daha iyi sınıflandırma performansı sergilemektedir. Doğruluk skoru sonuçlarına göre ise Decision Tree ve Random Forest modellerinin diğer modellere göre daha iyi doğruluk sağladığını gösterirken, kNN ve LightGBM modellerinin daha düşük performans gösterdiğini göstermektedir. Sonuç olarak, AUC skoru ve doğruluk skoru kullanılarak yapılan değerlendirmeler farklı sonuçlar ortaya koymaktadır. AUC skoru, sınıflandırma performansını daha geniş bir perspektiften değerlendirirken, doğruluk skoru doğru sınıflandırma oranına odaklanır. Random Forest modeli, hem AUC skoru hem de doğruluk skoru açısından diğer modellere göre daha iyi performans göstermektedir.
Keylogger software is spyware that records, captures, keeps and sends the data entered by users using the keyboard to the Attacker. Great importance is attached to ensuring the confidentiality and security of the work carried out in this regard, as it may endanger personal information and confidentiality. Machine learning methods can detect anomalies by analyzing them and identify keyloggers. The aim of this study is to detect keyloggers and to determine the most commonly used machine solutions and to compare the performance between these rates. For this purpose, a data set was created on performance comparisons by calculating the accuracy rates of LightGBM, kNN, Decision Tree and Random Forest models in keylogger detection. According to the activities AUC score show, the Random Forest model shows better performance compared to other models. When providing the accuracy score, it shows that Decision Tree and Random Forest models show better accuracy than other models, while kNN and LightGBM models perform lower. As a result, evaluations using the AUC score and accuracy score reveal different results. While the AUC score evaluates their growth from a broader perspective, the accuracy score focuses on accurate results. The Random Forest model performs better than other models in terms of both AUC score and accuracy score.