Çizge Kümeleme Algoritmalarının Benchmark Veri Setleri üzerinde Karşılaştırmalı Performans Analizi


Creative Commons License

Erdinç Y., Gülbandılar E.

Eskişehir Türk Dünyası Uygulama ve Araştırma Merkezi Bilişim Dergisi, cilt.6, sa.2, ss.37-45, 2025 (Hakemli Dergi)

Özet

Bu çalışmada, farklı çizge kümeleme algoritmalarının performansları küçük ve orta ölçekli dört farklı veri seti üzerinde analiz edilmiştir. Veri setlerinden üçü (Karate Club, Dolphin Ağı ve PolBooks) gerçek dünya ağlarından alınırken, LFR Benchmark veri seti sentetik bir ağ olarak kullanılmıştır. Çalışmada MinCut, Kernighan-Lin, Girvan-Newman, Spektral Kümeleme, Clique Percolation, Louvain, Leiden ve Spektral Gömme tabanlı k-means olmak üzere sekiz farklı algoritma karşılaştırılmıştır. Algoritmaların başarımı, Düzeltilmiş Rand İndeksi ve Normalize Edilmiş Karşılıklı Bilgi gibi dışsal metriklerin yanı sıra Kapsama ve Geçirgenlik gibi içsel metrikler aracılığıyla değerlendirilmiştir. Referans etiket bilgisinin mevcut olduğu veri setlerinde, Spektral tabanlı yöntemlerin ağ yapısını en iyi temsil ettiği görülmüştür. Gerçek etiketlerin bulunmadığı Dolphin Ağı veri setinde ise içsel metriklere odaklanılmış; Girvan-Newman ve modülerite tabanlı algoritmaların tutarlı topluluk yapıları sunduğu belirlenmiştir. Ayrıca, LFR Benchmark veri setinde Louvain algoritması yüksek dışsal uyum sağlarken, algoritma seçiminde ağın topolojik yapısının ve gürültü seviyesinin belirleyici olduğu gözlemlenmiştir. Bu çalışma, algoritmaların farklı karakteristiklere sahip ağlardaki davranışlarını karşılaştırarak, araştırmacılara veri seti yapısına uygun yöntem seçimi konusunda rehberlik etmeyi amaçlamaktadır.