Klinik Kayıtların Değerlendirmesinde Yapay Zekâ Modellerinin Öğretim Üyesi Değerlendiricilerle Uyumunun İncelenmesi


Emekli E., Coşkun Ö.

XV. Ulusal I. Uluslararası Tıp Eğitimi Kongresi, İstanbul, Türkiye, 26 - 29 Kasım 2025, ss.1, (Özet Bildiri)

  • Yayın Türü: Bildiri / Özet Bildiri
  • Basıldığı Şehir: İstanbul
  • Basıldığı Ülke: Türkiye
  • Sayfa Sayıları: ss.1
  • Eskişehir Osmangazi Üniversitesi Adresli: Evet

Özet

  1. Giriş: Klinik kayıt tutma becerileri, sağlık hizmetlerinde iletişim, hasta güvenliği ve yasal sorumluluk açısından temel bir yere sahiptir. Yapay zekâ temelli modellerin klinik eğitimde değerlendirme sürecine katkısı ise henüz sınırlı olarak araştırılmıştır.
  2. Amaç: Öğrencilerin klinik kayıtlarının değerlendirilmesinde ChatGPT-5 ve Gemini-2,5 Pro’nun öğretim üyelerinin değerlendirilmesi ile uyumunun incelenmesi amaçlanmıştır.
  3. Yöntem: 27 öğrencinin hasta-hekim görüşmesini içeren video kaydını izleyerek tuttukları anamnez ve konsültasyon notları iki değerlendirici tarafından puanlandı. Bu değerlendirmeler altın standart olarak kabul edilerek, kayıtlar yapay zekâ modellerine dört farklı koşulda sunuldu: (1) yalnızca kayıt, (2) kayıt + değerlendirme formu, (3) kayıt + değerlendirme formu + senaryo, (4) video + kayıt + değerlendirme formu. İnsan gözlemciler ile yapay zekâ modelleri arasındaki uyum intraclass korelasyon katsayısı ile değerlendirildi.
  4. Bulgular: Durum 1’de her iki yapay zeka modelinin uyumu istatistiksel olarak anlamlı değildi (ChatGPT-5: ICC=0,152; GA −0,235–0,498; p=0,220, Gemini 2.5 Pro: ICC=0,210; GA −0,178–0,541; p=0,142). ChatGPT-5 ikinci durumda yüksek (ICC=0,782; GA 0,577–0,895; p<0,001), üçüncü durumda ise orta düzeyde (ICC=0,416; GA 0,049–0,683; p=0,014) istatiksel anlamlı uyum göstermekteydi. Durum 4 için ise video değerlendirmesini yapamadığı için bir sonuç vermedi. Gemini 2,5 ise ikinci (ICC=0,190; GA −0,198–0,527; p=0,166) ve üçüncü durumda istatistiksel anlamlı uyum göstermedi (ICC=0,280; GA −0,105–0,592; p=0,075). Durum 4’te ise Gemini 2.5, yüksek düzey uyum gösterdi (ICC=0,653; GA 0,369–0,825; p<0,001).
  5. Tartışma ve Sonuç: Yapay zekâ modellerinin performansı sunulan veri türüne göre değişmektedir. ChatGPT-5 metinsel verilerle yüksek uyum sağlarken, Gemini 2.5 video verisinin bulunduğu durumda güçlü uyum sergilemiştir. Bulgular, tıp eğitiminde yapay zekâ destekli değerlendirmenin yapılandırılmış formlar veya multimodal veriler ile desteklenmesi halinde insan gözlemcilerle anlamlı düzeyde örtüşebileceğini göstermektedir.
  6. Anahtar Sözcükler: Klinik Kayıt Tutma, Anamnez, Yapay Zekâ, Büyük Dil Modelleri