Diz kıkırdak MR’ında yapay zekâ %99,7 doğrulukla 5 seviye hasar sınıflaması yapabiliyor. Klinik iş akışına etkisini ve uygulama adımlarını ele aldık.

Diz Kıkırdak MR’ında Yapay Zekâ ile 5 Seviye Tanı
Diz kıkırdak yaralanmalarında en büyük sorun “görmek” değil; erken evrede doğru sınıflamak. Çünkü kıkırdak dokusu damar ve sinir açısından fakir olduğu için kendi kendini onarma kapasitesi sınırlı ve ilerleyen hasar, zamanla osteoartrit gibi daha zor yönetilen tablolara kapı aralıyor. Bu yüzden ortopedide iyi bir MR raporu çoğu zaman tedavi planının pusulası.
17.12.2025 tarihinde yayımlanan bir çalışmada, gerçek hastane verileriyle eğitilmiş yapay zekâ tabanlı bir modelin diz kıkırdak yaralanmalarını 5 seviyede sınıflarken %99,7 doğruluk yakaladığı bildirildi. Bu rakam tek başına etkileyici; ama asıl mesele şu: Bu tip modeller, hekimlerin işini elinden almak için değil, değişkenliği azaltmak ve erken tanıda kaçan detayları yakalamak için var. “Sağlık Sektöründe Yapay Zekâ ve Dijital Sağlık” serimizin bu yazısında, bu çalışmayı bir örnek olay gibi ele alıp Türkiye’deki sağlık kurumları açısından ne anlama geldiğini konuşacağız.
Diz kıkırdak yaralanmasında erken tanı neden bu kadar zor?
Kısa cevap: MR görüntüsünde kıkırdak lezyonları çoğu zaman düşük kontrastlı, küçük ve çevre dokuların (kemik, kas, menisküs) gölgesinde kalıyor.
Klinikte diz MR’ı genellikle üç düzlemde (sagittal, koronal, aksiyel/transvers) çekilir ve farklı sekanslar birlikte yorumlanır:
- T1 ağırlıklı (T1WI): anatomik yapı
- T2 ağırlıklı (T2WI): sıvı artışı/ödem gibi değişiklikler
- T2 mapping: kıkırdak biyokimyası ve su içeriği gibi daha hassas ipuçları
Uluslararası derecelendirmelerde kıkırdak hasarı Grade 0–IV aralığında değerlendirilir. Ancak özellikle Grade I–II gibi erken evrelerde (yüzey yumuşaması, hafif pürüzlenme, kısmi derinlikte defekt) yorum farkı artar. Aynı MR’a iki farklı uzmanın baktığında farklı dereceler vermesi şaşırtıcı değil.
Benim net görüşüm şu: Erken evreyi kaçırmak, daha sonra en iyi tedaviyi bile gecikmeli hale getiriyor. Yapay zekânın klinik değeri tam burada başlıyor.
Çalışmadaki yaklaşım neyi farklı yaptı?
Kısa cevap: Model, tek bir kesit/düzlem yerine MR’ın çok boyutlu bilgisini kullanıp, küçük lezyon ayrıntılarını “kaybetmeden” sınıflandırmaya odaklanıyor.
Araştırmada önerilen yöntem; YOLOv8 tabanlı bir sınıflandırma omurgası üzerine iki kritik fikir ekliyor:
1) Çok boyutlu ve “çapraz seviye” özellik birleştirme
MR görüntülerinde erken lezyonlar küçük olduğu için model, derin katmanlara indikçe ayrıntı kaybı yaşayabiliyor. Çalışmada bunu azaltmak için:
- Yüzeysel (shallow) yüksek çözünürlüklü özellikler
- Derin (deep) semantik özelliklerle
aynı ağ içinde çapraz seviyede birleştiriliyor. Böylece hem “kenar/tekstür” hem de “lezyon paternleri” birlikte değerlendiriliyor.
2) Büyük Ayrılabilir Çekirdek Dikkati (LSKA) ile bağlam yakalama
Klasik konvolüsyonlar genellikle daha “yerel” görür. Kıkırdak hasarında ise bazen lezyonun anlamı, çevresindeki uzun mesafeli doku ilişkisiyle netleşir. LSKA modülü burada devreye giriyor:
- Büyük çekirdeği daha verimli parçalara bölerek hesap yükünü kontrol ediyor
- Kanallar arası bilgiyi birleştirip önemli bölgeleri ağırlıklandırıyor
Sonuç: Model arka plandaki kemik/kas karmaşası içinde, kıkırdak çatlağı gibi ince ayrıntılara daha iyi odaklanabiliyor.
“Tanıda hız kadar tutarlılık da önemli. Yapay zekânın ilk katkısı, yorum değişkenliğini azaltmak.”
Sonuçlar: %99,7 doğruluk ne demek, ne demek değil?
Kısa cevap: Bu sonuç, doğru veri kurgusu ve güçlü mimariyle çok yüksek performansın mümkün olduğunu gösteriyor; ama genellenebilirlik için çok merkezli doğrulama şart.
Çalışmada modelin performansı şöyle raporlandı:
- Doğruluk (Accuracy): %99,7
- Kappa: %99,6 (rastgele uyumdan arındırılmış tutarlılık)
- F1: %99,7
- Duyarlılık (Sensitivity): %99,7
- Özgüllük (Specificity): %99,9
Veri seti gerçek hastane verisi: 134 KCI hastası + 26 sağlıklı birey; her sınıftan yüzlerce görüntü (Grade 0: 548, Grade I: 674, Grade II: 582, Grade III: 539, Grade IV: 579). Eğitim/test ayrımı hasta bazında 8:2 yapılmış.
Ayrıca pratik açıdan önemli bir detay var: Modelin çıkarım hızı yaklaşık 2,5 ms/görüntü olarak verilmiş. Bu, doğru entegrasyonla PACS/RIS iş akışında “bekleme oluşturmadan” çalışabilecek bir seviyeye işaret ediyor.
Yine de şu çizgiyi net çekmek gerekiyor:
- Bu kadar yüksek skorlar, tek merkezli ve homojen görüntüleme koşullarında daha kolay yakalanır.
- Farklı MR cihazları, farklı protokoller ve farklı popülasyonlar geldiğinde performans düşebilir.
Çalışma da zaten bunu dürüstçe söylüyor ve gelecekte federated learning gibi yaklaşımlarla çok merkezli veriyle güçlendirmeyi hedefliyor.
Klinik ve operasyon açısından gerçek fayda nerede?
Kısa cevap: Yapay zekâ, ortopedi ve radyolojide “ikinci göz” gibi çalışarak erken tanı, triyaj ve izlem standardizasyonu sağlar.
Erken tanıda hata payını düşürmek
Grade I–II ayrımı, tedavi yaklaşımını etkileyebilir: yük azaltma, fizik tedavi planı, enjeksiyon seçenekleri, cerrahi düşünme eşiği… Yapay zekâ burada:
- Subjektif farkları azaltır
- Aynı hastanın farklı zamanlardaki MR’larını daha tutarlı kıyaslamaya yardımcı olur
Radyoloji iş yükünde akıllı triyaj
Kış aylarında (Aralık–Ocak) düşme/çarpma kaynaklı ortopedik başvuruların arttığı dönemlerde görüntüleme birimlerinde yoğunluk yükselir. Böyle zamanlarda sistem:
- “Acil öncelik” şüphesi olan vakaları işaretleyip önceliklendirme sağlayabilir
- Rutin raporlama kuyruğunda kritik vakaların gecikmesini azaltabilir
Uzaktan sağlık ve dijital izlemle birleşince değer artıyor
Bu çalışma doğrudan tele-sağlık ürünü değil; ama çok net bir köprü kuruyor: Çok düzlemli ve çok sekanslı veriyle çalışan modeller, doğru kurgulanırsa:
- Farklı lokasyonlardan gelen görüntüleri ortak bir standarda yaklaştırabilir
- Takip hastalarında “kötüleşme sinyali” yakalayıp hekimi uyarabilir
Sağlık kurumları bu tip bir modeli devreye almak isterse ne yapmalı?
Kısa cevap: Modeli satın almak/kurmak kadar, veri yönetişimi ve klinik doğrulama tasarımı kritik.
Aşağıdaki yaklaşım pratikte işe yarıyor:
- Kullanım senaryosunu netleştirin
- Triyaj mı? İkinci görüş mü? Otomatik derecelendirme mi?
- Yerel veriyle pilot doğrulama yapın
- Kendi MR protokolünüz, cihazlarınız ve popülasyonunuz farklı olabilir.
- Hekim geri bildirim döngüsü kurun
- Hatalar “ayıp” değil, eğitim verisidir. Süreç tasarımı bunu kabul etmeli.
- Regülasyon ve KVKK uyumunu en başa koyun
- Anonimleştirme, erişim logları, rol bazlı yetki şart.
- Entegrasyonu iş akışına gömün
- Ayrı bir ekran/ekstra tıklama, benim gördüğüm en büyük başarısızlık nedeni.
“Yapay zekâ araçları, klinik iş akışına ek yük bindirirse değil; yük alırsa benimsenir.”
Sık sorulan sorular (kısa ve net)
Bu sistem hekimi tamamen değiştirir mi?
Hayır. En iyi senaryoda bile hekim kararını destekler. Özellikle atipik vakalarda nihai sorumluluk klinisyendedir.
Neden üç düzlem (sagittal-koronal-aksiyel) önemli?
Çünkü her düzlem farklı anatomik ayrıntıyı daha net gösterir. Çalışmada tek düzlemde en iyi sonuç sagittal olsa da üç düzlemin birleşimi en yüksek doğruluğu vermiş.
Türkiye’de uygulanabilir mi?
Teknik olarak evet; ama performansı korumak için çok merkezli veriyle yerel doğrulama ve güçlü entegrasyon gerekir.
Bu çalışmanın serimiz açısından mesajı
“Sağlık Sektöründe Yapay Zekâ ve Dijital Sağlık” serisinde sık vurguladığımız bir nokta var: Yapay zekâ en çok, yüksek hacimli ve yorum değişkenliği olan alanlarda değer üretir. Diz MR’ında kıkırdak derecelendirmesi bunun tam karşılığı.
Bu çalışma, tıbbi görüntülemede yapay zekânın yalnızca “güzel bir demo” olmadığını; doğru veri (çok düzlem/çok sekans), doğru mimari (dikkat mekanizması + çok ölçekli füzyon) ve doğru ölçümleme (Kappa, duyarlılık, özgüllük) ile klinik ölçekli sonuçlar üretilebildiğini gösteriyor.
Bundan sonrası daha zor ama daha değerli: Bu modellerin Türkiye’de de güvenle kullanılabilmesi için çok merkezli doğrulama, KVKK uyumu, PACS entegrasyonu ve hekim geri bildirim döngüsü birlikte tasarlanmalı. Sizce ortopedide yapay zekânın ilk yaygınlaşacağı yer triyaj mı olur, yoksa rapor standardizasyonu mu?