3. Genç ORAD Sempozyumu, Nevşehir, Türkiye, 5 - 08 Kasım 2025, ss.46-47, (Özet Bildiri)
Giriş-Amaç
Bu çalışmanın amacı, dental radyoloji alanına özgü sorulara GPT-5, GPT-4o, Gemini 2.5 Flash, Sonnet4.5 ve DeepSeekV2 modellerinin performansını karşılaştırmaktır.
Gereç-Yöntem
Modellerin teorik başarı düzeylerinin değerlendirilmesi için farklı yıllarda deneyime sahip 2 uzman tarafından doğru-yanlış, boşluk doldurma ve çoktan seçmeli sorudan oluşan toplam 30 soru hazırlanmıştır. Sınav değerlendirmesi 100’lük sistem olarak belirlenmiş, test soruları 5 puan, diğer sorular 2,5 puan, üzerinden değerlendirilmişti. Sorular, on gün boyunca her gün aynı saatte ve aynı anda modellere yönlendirilmiş, her deneme yeni oturumda başlatılmıştır. İlk olarak modellerin günlük puanlarına ilişkin tanımlayıcı istatistikleri analizi yapılmış, ardından her modelin günler arası performans kararlılığı, Kendall’s W tutarlılık katsayısı ile analiz edilmiştir. Modeller arasındaki ortalama puan farkı Friedman testi ile Dunn–Bonferroni post-hoc testi ile değerlendirilmiştir.
Bulgular
En yüksek ortalama Gemini 2.5 Flash (94.00 ± 4.44) ve DeepSeek V2 (93.25 ± 3.34) modellerinde, en düşük ortalama ise GPT-4o (89.75 ± 0.79) modelinde saptanmıştır. Her modelin günler arası performansı istatistiksel anlamlı olmayan orta düzeyde kararlılığa sahip olduğu görüldü. Farklı yapay zekâ modellerinin ortalama puanları arasındaki farkın orta düzeyde bir etkiye sahip olduğu (Kendall’sW = 0.338) ve istatistiksel olarak anlamlı bulunduğu belirlenirken (χ² = 13.53, p = 0.009), hiçbir ikili karşılaştırma düzeyinde modeller arasında anlamlı performans farklılıkları saptanmadı. (p > 0.05)Tartışma-SonuçBulgular, büyük dil modellerinin dental radyoloji eğitiminde kullanılabileceğini göstermektedir. Ancak, performansın soru tipi ve oturum tekrarıyla değişmesi, yanıt kararlılığının sınırlı olduğunu ortaya koymaktadır. Günler arası benzer doğruluk oranlarına rağmen farklı sorularda yapılan hatalar, sınav güvenilirliği ve eğitim materyali standardizasyonu açısından önem taşımaktadır.
Anahtar Kelimeler: Büyük dil modeli, dental radyoloji, yapay zekâ