BT görüntülerinden mide kanserinde T evreleme için açıklanabilir yapay zekâ yaklaşımını, hastane ve tele-tıp kullanım senaryolarıyla ele alıyoruz.

Mide Kanserinde BT ile T Evreleme: Açıklanabilir Yapay Zekâ
Mide kanserinde tedavi planını belirleyen kritik dönemeçlerden biri T evrelemesi: Tümörün mide duvarına ne kadar yayıldığını doğru bilmezseniz, “gereğinden agresif” ya da “yetersiz” bir tedaviye kaymak şaşırtıcı derecede kolay. 20.12.2025’te yayımlanan yeni bir çok merkezli çalışma, BT görüntülerinden T evrelemesi yapan ve aynı zamanda “neden böyle dediğini” gösteren açıklanabilir bir derin öğrenme yaklaşımı sunuyor. Benim açımdan asıl değerli nokta şu: Yapay zekâ, sadece sonuç üretmiyor; klinisyenin güvenini kazanmak için kanıt gibi okunabilir ipuçları da üretiyor.
Bu yazı, “Sağlık Sektöründe Yapay Zekâ ve Dijital Sağlık” serisinin bir parçası. Odağımız pratik: Hastanelerde radyoloji akışına nasıl entegre edilir, tele-tıp senaryolarında nasıl işe yarar, bilgi güvenliği ve etik sınırlar nereden geçer, ekipler bu tür bir modeli satın alırken ya da geliştirirken nelere bakmalı?
T evrelemesi neden bu kadar zor (ve neden BT tek başına yetmeyebiliyor)?
Kısa cevap: Mide duvarı katmanları ince, kontrastlanma paternleri değişken ve çekim protokolü merkezden merkeze farklı; bu da BT ile invazyon derinliği okumasını zorlaştırıyor.
Mide kanserinde T evresi; endoskopi, patoloji, bazen endoskopik ultrason gibi yöntemlerle birlikte değerlendirilse de, birçok kurumda karar sürecinin omurgasında kontrastlı BT yer alır. Sorun şu: BT’de invazyon derinliği değerlendirmesi, görüntü kalitesi ve yorumlayıcının deneyiminden çok etkilenir.
Pratikte zorluk çıkaran tipik durumlar:
- Mide distansiyonu yetersizse duvar kalınlığı olduğundan farklı görünür.
- Perigastrik yağ dokusu zayıf hastalarda serozal tutulum işaretleri silikleşebilir.
- Farklı BT cihazları / farklı protokoller (kesit kalınlığı, fazlar, kontrast enjeksiyon zamanı) modeli de insanı da zorlar.
- T1–T2 ya da T3–T4 sınırında “gri alan” fazladır; klinik karar tam bu gri alanda sıkışır.
Bu nedenle yapay zekâ tarafında hedef sadece “yüksek doğruluk” değil; kurumlar arası genellenebilirlik ve klinik olarak açıklanabilirlik olmalı.
Çok merkezli ve açıklanabilir derin öğrenme yaklaşımı ne getiriyor?
Kısa cevap: Çok merkezli eğitim/validasyon, modelin farklı hastane gerçekliğine dayanmasını; açıklanabilirlik (ör. ısı haritaları) ise radyolog için “kontrol edilebilir” bir karar sürecini sağlar.
Söz konusu çalışma, mide kanserinde BT’den T evre sınıflandırması yapan bir derin öğrenme modeli geliştiriyor ve “black box” kalmaması için görsel açıklama mekanizmaları (pratikte sık kullanılan Grad-CAM benzeri yaklaşımlar) ile modelin hangi alanlara bakarak karar verdiğini görünür kılıyor.
Buradaki iki kritik vurgu, sağlıkta yapay zekâ projelerinin büyük kısmının tökezlediği yer:
1) Çok merkezli tasarım: “Bizde çalışıyor” tuzağını azaltır
Tek merkezli başarı, gerçek dünyada hızla dağılabilir. Çünkü veri dağılımı değişir: farklı cihaz, farklı çekim alışkanlığı, farklı hasta profili. Çok merkezli yaklaşım, modeli daha sert bir sınava sokar.
Hastane yöneticisi gözüyle okursak: Çok merkezli kanıt, satın alma ya da pilot kararlarında “ilk bariyer”dir. Yine de tek başına yeterli değil; sizin kurumunuzda lokal doğrulama şart.
2) Açıklanabilirlik: Güvenin operasyonel karşılığı
Açıklanabilir yapay zekâ denince bazen “güzel bir görselleştirme” gibi algılanıyor. Ben buna katılmıyorum. Klinik akışta açıklanabilirlik, üç şey sağlar:
- Hata yakalama: Modelin tümör dışı alana (ör. artefakt, mide içeriği, kemik) odaklandığını görürseniz sonucu ciddiye almazsınız.
- Eğitim etkisi: Asistan hekimler için “modelin baktığı yer” bir tür ikinci görüş gibi çalışabilir.
- Hukuki/etik savunulabilirlik: Kararın izah edilebilir olması, en azından “rastgele çıktı” algısını kırar.
Açıklanabilirlik, yapay zekânın hekimin yerini alması değil; hekime denetlenebilir bir yardımcı sunmasıdır.
Hastane ve tele-tıp akışında gerçek kullanım senaryoları
Kısa cevap: En doğru senaryo “otomatik rapor yazan sistem” değil; radyoloğun işini hızlandıran, riskli olguları öne çeken ve tutarlılığı artıran karar destek katmanıdır.
Yapay zekâ ile T evreleme, kâğıt üzerinde etkileyici görünür; sahada ise süreç tasarımı her şeydir. Benim gördüğüm en sürdürülebilir kullanım, aşağıdaki üçlü model:
Hızlandırma: Ön-analiz ve odak önerisi
Model, BT serisini analiz eder ve:
- T evresi için olasılık dağılımı üretir (ör. T2 %55, T3 %40).
- Radyoloğa odak bölgeleri gösterir (ısı haritası ile).
Bu yaklaşım, “tek bir etiket” dayatmak yerine radyoloğun klinik şüphe düzeyiyle uyumludur.
Tutarlılık: Çoklu okuyucu farkını azaltma
Özellikle yoğun merkezlerde aynı olgu, farklı günlerde farklı yorumlara gidebilir. Yapay zekâ burada bir “standartlaştırma çıpası” gibi çalışır: kararı dikte etmez ama sapmayı görünür kılar.
Tele-radyoloji: Merkez dışı kaliteyi yukarı çekme
Türkiye’de tele-radyoloji ve ikinci görüş hizmetleri büyürken, periferde çekilen görüntülerin heterojenliği daha da belirginleşiyor. Açıklanabilir bir model:
- düşük deneyimli ekiplerde triage (önceliklendirme) sağlayabilir,
- referans merkeze gönderilecek olguları daha erken seçebilir,
- uzaktan tümör konseylerinde “ortak görsel dil” oluşturabilir.
Bu noktada önemli bir sınır var: Model çıktısı, özellikle tele-tıp ortamında, tek başına klinik karar olmamalı. Birinci amaç “hız + tutarlılık”, ikinci amaç “kalite kontrol” olmalı.
“Bu modeli hastaneye alırsak” sorusuna net bir kontrol listesi
Kısa cevap: Performans kadar veri yönetişimi, entegrasyon ve izleme planı da satın alma kriteri olmalı.
Bu tip bir çözümü değerlendiren kurumlar için pratik bir kontrol listesi:
-
Yerel doğrulama planı var mı?
- Kendi BT protokolünüzde, kendi hasta popülasyonunuzda en az birkaç yüz olguda performans ölçümü.
-
Açıklanabilirlik çıktısı klinik olarak anlamlı mı?
- Isı haritası “güzel” değil, “doğru yere bakan” olmalı.
-
DICOM/PACS entegrasyonu nasıl yapılacak?
- Radyoloğun ayrı bir ekrana gitmesini gerektiren sistemler genelde kullanılmıyor.
-
Sürüm yönetimi ve izlenebilirlik var mı?
- Hangi model sürümü hangi hastada kullanıldı? Geriye dönük denetim şart.
-
Drift (performans kayması) izleme var mı?
- Protokol değişince, yeni cihaz gelince veya vaka karması değişince performans düşebilir.
-
Veri gizliliği ve etik uyum nasıl sağlanıyor?
- Çalışmada da vurgulandığı gibi, ham BT verisi çoğu zaman paylaşılmaz; de-identification, onay süreçleri ve veri paylaşım sözleşmeleri net olmalı.
-
İnsan-makine iş bölümü tanımlı mı?
- Son karar kimde? Hangi durumda model çıktısı görmezden gelinecek? Bu kurallar yazılı olmalı.
Bu listeye bir madde daha ekliyorum: Başarı metriğini doğru seçin. Sadece “genel doğruluk” yerine T3–T4 ayrımı gibi klinik etkisi yüksek eşiklerde duyarlılık/özgüllük dengesi izlenmeli.
Klinik değer: Tedavi kararını gerçekten etkileyen yer neresi?
Kısa cevap: T evrelemedeki hata, doğrudan “cerrahi mi, neoadjuvan tedavi mi?” gibi kararları etkileyebilir; açıklanabilir yapay zekâ bu hatayı azaltmaya odaklanmalı.
Mide kanserinde evreleme; cerrahi yaklaşım, perioperatif tedavi planı ve takip stratejisini belirler. Burada iki risk var:
- Aşağı evreleme: T3–T4 olguyu T2 sanmak, yetersiz hazırlık ve yetersiz tedavi planı doğurabilir.
- Yukarı evreleme: Erken evreyi ileri evre sanmak, hastayı gereksiz yoğun tedaviye sürükleyebilir.
Açıklanabilir modelin klinik değeri, “ortalama doğruluk”tan çok şu soruda yatar: Kararın gerekçesi, klinisyenin akıl yürütmesiyle uyumlu mu?
Benim sahada faydalı bulduğum yaklaşım şu: Model, olguyu T3’e yakın görüyorsa, aynı anda perigastrik yağ planında şüpheli alanları işaretleyebilmeli. Radyolog da buna bakıp “evet, burada serozal düzensizlik var” ya da “hayır, bu sadece artefakt” diyebilmeli.
“Sık sorulanlar”: Açıklanabilir yapay zekâ hakkında net cevaplar
Bu sistemler radyoloğun yerine geçer mi?
Hayır. Doğru kullanım, karar destek. Model; hız, tutarlılık ve riskli olguları öne çıkarma işinde güçlüdür.
Açıklanabilirlik her zaman güvenilir mi?
Tek başına değil. Isı haritası bir “kanıt” değil, ipuçları setidir. Kurum içi validasyon ve hata analiziyle birlikte anlam kazanır.
Veri paylaşımı olmadan bu işler nasıl gelişecek?
Çalışmalar genellikle ham veriyi paylaşmadan ilerliyor: kodun açık olması, örnek veri setleri, federated learning gibi yaklaşımlar ve etik kurul onaylı veri erişim süreçleri yaygınlaşıyor.
2026’ya girerken hastaneler için en gerçekçi yol haritası ne?
Önce küçük bir pilot: tek endikasyon (ör. mide kanserinde T evreleme), net KPI’lar (rapor süresi, interobserver uyum, yeniden değerlendirme oranı), ardından ölçekleme.
Dijital sağlık stratejisinde bu araştırma nereye oturuyor?
Bu çalışma, “Sağlık Sektöründe Yapay Zekâ ve Dijital Sağlık” başlığının tam merkezinde duruyor çünkü üç temel ihtiyaca aynı anda cevap veriyor:
- Tanıda yapay zekâ: Görüntüden klinik karar desteği.
- Hastane ölçeği: Çok merkezli bakış, gerçek dünya uyumuna daha yakın.
- Güven ve şeffaflık: Açıklanabilirlik, klinik kabulün ön koşulu.
Benim net görüşüm şu: 2026’da sağlıkta yapay zekâ projelerinin kazananları, en yüksek AUC’ye sahip olanlar değil; PACS’e düzgün entegre olan, performansı izlenen ve klinisyen güvenini günlük pratikte kazanan sistemler olacak.
Tedavi kararlarını etkileyen alanlarda (kanser evreleme gibi) yapay zekâ kullanacaksak, “sonucu ver” yaklaşımı yetmez. Modelin gerekçesini gösterebilmesi, kurumun kendi verisinde doğrulanması ve tele-tıp dahil uçtan uca süreçte izlenmesi gerekir.
Sizce kendi kurumunuzda en hızlı değer üretecek ilk adım hangisi: radyoloji rapor süresini kısaltmak mı, ikinci görüş/tele-radyoloji kalite kontrolünü güçlendirmek mi, yoksa tümör konseylerinde ortak karar dilini standardize etmek mi?