25. Ulusal Anatomi Kongresi, Ordu, Türkiye, 25 - 28 Ağustos 2025, ss.1, (Özet Bildiri)
Amaç: Bu çalışmada FreeSurfer (FS), FastSurfer (FaS), BrainSuite (BS) ve volBrain (volB) olmak üzere dört otomatik beyin segmentasyon yazılımının farklı beyin bölgelerindeki kortikal kalınlık ölçümleri açısından tutarlılığının ve ölçüm farklılıklarının değerlendirilmesi amaçlanmıştır.
Gereç ve Yöntemler: Çalışmaya 40 sağlıklı birey (20 kadın, 20 erkek) dahil edilmiştir (yaş ortalaması 24,35±3,66; kadın 23,7±2,35, erkek 25±4,52). Beyin MRG’leri dört program ile işlenerek 32 bölgede kortikal kalınlık ölçümü yapılmıştır. Ölçümler arası fark Friedman testi ile, anlamlı bulunan bölgelerde ikili Wilcoxon testi ile analiz edilmiştir. Programlar arası tutarlılık intraclass korelasyon katsayısı (ICC), cinsiyet farkları ise Mann-Whitney U testi ile değerlendirilmiştir.
Bulgular: Tüm bölgelerde programlar arasında anlamlı fark saptanmıştır (p<0.001). İkili karşılaştırmalarda FS/FaS için 22; FS/BS, FS/volB, FaS/volB, volB/BS için 28’er ve FaS/BS için 29 bölgede anlamlı fark bulunmuştur. ICC analizlerinde FS diğer üç program ile tüm bölgelerde tutarsızdır. FaS/volB 11 (ICC: 0.441–0.603), FaS/BS 20 (0.428–0.843), volB/BS ise 9 bölgede (0.421–0.570) tutarlılık göstermektedir. Cinsiyet açısından genel olarak anlamlı fark bulunmamıştır; yalnızca sağ insula bölgesinde dört programda anlamlı fark gözlenmiştir.
Sonuç: Dört segmentasyon programı arasında ölçüm farklılıkları belirgindir; program sonuçları birbirinin yerine kullanılabilir değildir. FS, diğer yazılımlara göre düşük tutarlılık göstermekte; diğerleri ise bazı bölgelerde orta-iyi düzeyde tutarlılık sergilemektedir. Bununla birlikte, üç program arasında da tam ve istikrarlı bir uyum tüm bölgelerde sağlanamamakta; tutarlılıklar bölgesel olarak değişiklik göstermektedir. Klinik veya araştırma amaçlı çalışmalar için, kullanılan segmentasyon yazılımına göre farklılıkların göz önünde bulundurulması ve yazılımlar arası karşılaştırmalarda dikkatli olunması gerekmektedir.
Objective: This study aims to evaluate the consistency and measurement differences of four automated brain segmentation methods — FreeSurfer (FS), FastSurfer (FaS), BrainVolume (BS), and volBrain (volB) — in cortical thickness measurements across different brain regions.
Materials and Methods: Forty healthy individuals (20 females; mean age 24.35±3.66; females 23.7±2.35, males 25±4.52) were included. Cortical thickness was measured in 32 regions using the four segmentation programs. Differences between measurements were analyzed using the Friedman test, with pairwise comparisons conducted via the Wilcoxon test. Inter-method consistency was assessed using the intraclass correlation coefficient (ICC), and sex differences with the Mann-Whitney U test.
Results: Significant differences were found among the programs in all regions (p<0.001). Pairwise comparisons showed significant differences in 22 regions for FS/FaS; in 28 regions each for FS/BS, FS/volB, FaS/volB, and volB/B; in 29 regions for FaS/BS. ICC analysis indicated that FS was inconsistent with the other programs across all regions. FaS/volB showed consistency in 11 (ICC: 0.441–0.603), FaS/BS in 20 (0.428–0.843), and volB/BS in 9 regions (0.421–0.570). No significant sex differences were generally observed (except the right insula).
Conclusion: Measurement differences among the four segmentation programs are evident; their results are not directly interchangeable. FS demonstrates lower consistency, while the others show moderate-to-good consistency in certain regions. However, full agreement across all regions is not achieved. Differences among methods should be considered in clinical and research applications, and caution is warranted in inter-method comparisons.