MAFLD Fenotip Tahmini: Yapay Zekâ ile Erken Risk

Sağlık Sektöründe Yapay Zekâ ve Dijital SağlıkBy 3L3C

MAFLD fenotiplerini 1 yıl içinde tahmin eden 2 aşamalı kontrastif öğrenme yaklaşımı, erken tarama ve kişiselleştirilmiş takipte daha doğru risk stratifikasyonu sağlıyor.

MAFLDKaraciğer YağlanmasıKontrastif ÖğrenmeGraf ÖğrenmeKlinik Karar DestekRisk Stratifikasyonu
Share:

Featured image for MAFLD Fenotip Tahmini: Yapay Zekâ ile Erken Risk

MAFLD Fenotip Tahmini: Yapay Zekâ ile Erken Risk

Karaciğer yağlanması pek çok kişide “sessizce” ilerliyor; belirtiler belirginleştiğinde iş daha pahalı, daha zor ve bazen de geri dönüşü daha sınırlı hâle geliyor. Buradaki kritik ayrıntı şu: Karaciğer yağlanması tek bir hastalık gibi görünse de, metabolik kökleri ve risk profili kişiden kişiye ciddi biçimde değişiyor. Bu yüzden erken dönemde “kim gerçekten riskli?” sorusuna doğru cevap vermek, hem klinik sonuçları hem de sağlık sistemi maliyetlerini doğrudan etkiliyor.

12.12.2025’te yayımlanan bir çalışma, bu soruna sağlık bilişimi cephesinden net bir yanıt veriyor: MAFLD (metabolik disfonksiyonla ilişkili yağlı karaciğer hastalığı) fenotiplerini 1 yıl içinde tahmin etmek için 2 aşamalı, kontrastif öğrenme tabanlı bir yöntem geliştirildi. Sonuçlar iddialı: Yaygın kullanılan 8 farklı yönteme kıyasla, özellikle daha az görülen ama klinik olarak çok önemli MAFLD fenotiplerinde belirgin performans artışı var.

Bu yazı, “Sağlık Sektöründe Yapay Zekâ ve Dijital Sağlık” serimizin bir parçası olarak şunu hedefliyor: Bu yöntemi anlaşılır hâle getirmek, Türkiye’deki sağlık kurumları ve dijital sağlık ekipleri için uygulanabilir çıkarımlara çevirmek ve erken teşhis odaklı yapay zekâ kullanımının neyi değiştirdiğini somutlaştırmak.

MAFLD’de asıl sorun: Fenotipler aynı değil, risk de aynı değil

MAFLD, tek başına “yağlı karaciğer” demek değil; çoğu zaman obezite, tip 2 diyabet, dislipidemi ve kardiyovasküler risklerle aynı zeminde ilerleyen çok sistemli bir tablo. Çalışmanın da altını çizdiği gibi dünyada her 3 kişiden 1’inden fazlasını etkileyebiliyor.

Fenotip ayrımı klinikte neden hayat kurtarıyor?

Çalışma, MAFLD fenotiplerini pratik bir sınıflamaya indiriyor:

  • Non-MAFLD (gelişmeyenler)
  • Diyabetik olmayan MAFLD (obez + “lean” MAFLD birlikte değerlendirilmiş)
  • Diyabetik MAFLD

Bu ayrım basit gibi dursa da klinik etkisi büyük. Çünkü:

  • Diyabetik MAFLD, en yüksek mortalite ve komplikasyon riskleriyle ilişkilendiriliyor.
  • Diyabetik olmayan MAFLD’de yaşam tarzı, uyku, sigara gibi davranışsal sinyaller daha görünür olabiliyor.
  • “Lean” MAFLD (zayıf görünen ama metabolik olarak riskli bireyler) klasik tarama sezgilerini bozuyor.

Benim sahada en çok gördüğüm hata şu: Karaciğer yağlanması riskini yalnızca kiloya bakarak yorumlamak. Oysa metabolik risk, “beden görünümü” ile bire bir örtüşmüyor.

Neden klasik analitik modeller sık sık tökezliyor?

Sağlıkta yapay zekâ projelerinin önemli bir kısmı, tek bir veri kaynağına yaslanıyor: E-nabız benzeri ESK (elektronik sağlık kaydı) verileri, laboratuvar sonuçları, ICD kodları… Bunlar kıymetli, ama MAFLD gibi çok faktörlü bir tabloda yeterli değil.

Çalışma üç temel probleme işaret ediyor:

  1. Çok kaynaklı veri: Klinik ölçümler (ALT/AST, HbA1c vb.) + anket/saha verileri (yaşam tarzı, aile öyküsü) aynı “dil”i konuşmuyor.
  2. Eksik veri gerçeği: Yaşam tarzı ve aile öyküsü anketleri çoğu zaman eksik, düzensiz ve heterojen.
  3. Sınıf dengesizliği: Örneklemde sınıflar çok dengesiz: %85 non-MAFLD, %11,5 diyabetik olmayan MAFLD, %3,5 diyabetik MAFLD. Bu dağılım, “az görülen ama önemli” sınıflarda modeli doğal olarak zorlar.

Bu yüzden yalnızca lojistik regresyon, karar ağacı veya hatta standart derin öğrenme modelleri, nadir fenotipleri yakalamada çoğu kez “temkinli” kalır: Yanlış alarmı azaltırken gerçek risklileri kaçırır.

Çalışmanın çözümü: 2 aşamalı kontrastif öğrenme ile fenotip tahmini

Bu yöntemin güçlü yanı tek bir numara yapması değil; üç fikri iyi bir mimaride birleştirmesi:

  1. Graf temsili öğrenme (GraphSAGE ile)
  2. Çoklu-görünüm (multiview) kontrastif ön eğitim
  3. 2 aşamalı risk kestirimi (hiyerarşik sınıflama)

1) Yaşam tarzı ve genetik öyküyü “graf”a çevirmek

Anket verisi dağınık ve eksik olabilir. Çalışma bunu avantaja çevirip şu yaklaşımı kullanıyor:

  • Kişi–yaşam tarzı ilişkilerinden bir bipartit graf
  • Kişi–genetik/aile öyküsü ilişkilerinden ayrı bir bipartit graf

Böylece “benzer yaşam tarzı örüntüsüne sahip kişiler” veya “benzer aile öyküsü sinyalleri taşıyan kişiler” birbirine daha yakın temsillere dönüşüyor.

Bu kısmın pratik karşılığı şu: Eksik anket verisi, ‘boşluk’ olmaktan çıkıp ağ yapısı içinde dolaylı sinyal üretebiliyor.

2) Kontrastif öğrenme: “Benzer hastalar benzer temsil alsın”

Kontrastif öğrenme genelde görüntü dünyasından bilinir; ama sağlıkta tabular veriye uyarlamak zor kısım. Çalışma, “veri artırma” yerine çoklu görünüm fikrini kullanıyor:

  • Klinik veriler “öğretmen görünüm”
  • Yaşam tarzı ve genetik temsiller “öğrenci görünüm”

Amaç: Aynı kişinin farklı veri kaynaklarından gelen temsilleri birbirine yaklaştırmak; farklı kişileri ayırmak.

Ek olarak, heterojen veri dağılımı için “sabit sıcaklık” yerine adaptif sıcaklık ağı (ATN) ile her batch’e dinamik ayar yapılmış. Bu teknik detay, sağlık verisindeki farklı alt grupların “aynı sertlikte” itilip çekilmesini engelleyip daha dengeli bir temsil alanı oluşturuyor.

3) 2 aşamalı kestirim: Önce MAFLD var mı, sonra fenotip ne?

Klinik akışa en yakın kısım burası. Model:

  • Aşama 1: “1 yıl içinde MAFLD gelişecek mi?” (ikili)
  • Aşama 2: “Gelişecekse hangi fenotip?” (çok sınıflı)

Bu, gerçek hayatta hekim aklının işleyişine benziyor: Önce tarama, sonra ayrıntı.

Sonuçlar ne diyor? (Sayılara bakalım)

Çalışma 4408 yetişkinin 2 yıllık verisiyle test edilmiş. 10 farklı rastgele bölme ile sağlamlık kontrolü yapılmış.

Genel performans: AUC ve F1 iyileşiyor

  • Önerilen yöntem (Aşama 2) AUC: 0,898
  • En iyi kıyas yöntemlerinden biri (GraphSAGE) AUC: 0,838
  • Aradaki fark: %7,2 AUC artışı

F1 tarafında da tablo benzer:

  • Önerilen yöntem (Aşama 2) F1: 0,652
  • En iyi kıyas yöntemi F1: 0,559
  • Aradaki fark: %16,6 F1 artışı

Asıl kritik yer: Nadir fenotiplerde kazanç

Klinik değeri yüksek olan sınıflar diyabetik/diyabetik olmayan MAFLD. Burada iyileşmeler daha belirgin:

  • Diyabetik olmayan MAFLD: F1 0,531 (en iyi kıyasta 0,400) → %32,8 artış
  • Diyabetik MAFLD: F1 0,519 (en iyi kıyasta 0,398) → %30,4 artış

Bu sayılar şunu söylüyor: Model, “az görülen ama önemli” grupları yakalamada daha iyi. Sağlık sisteminde gerçek kazanım tam da burada başlar.

Yorumlanabilirlik: “Model böyle dedi” değil, “neden dedi?”

Sağlıkta yapay zekânın kabul görmesi için açıklanabilirlik şart. Çalışma bunu SHAP ile destekliyor ve bazı bulgular doğrudan klinik sezgiyle örtüşüyor:

  • BMI ve bel çevresi en güçlü belirleyiciler arasında.
  • Diyabetik olmayan MAFLD tahmininde metabolik göstergelerin yanında sigara ve uyku bozukluğu gibi yaşam tarzı sinyalleri öne çıkıyor.
  • Diyabetik MAFLD tahmininde HbA1c ve diyabet göstergeleri beklediğimiz gibi güçlü; ayrıca öz bakım durumu ve beslenme durumu (MNA) gibi “sonuç ve yönetim” işaretleri de etkili.

Benim bu bulgudan çıkardığım net ders: Dijital sağlık ürünleri yalnızca lab sonuçlarını değil, davranış ve yaşam tarzı verisini de “ölçülebilir” kılmak zorunda.

Türkiye’de dijital sağlık ekipleri bu yaklaşımdan nasıl faydalanır?

Bu çalışma Tayvan verisiyle yapılmış olsa da, Türkiye’deki hastane grupları, özel klinikler, check-up merkezleri ve dijital sağlık girişimleri için çok uygulanabilir dersler var.

1) Erken uyarı ve tarama akışını iki aşamalı tasarlayın

2 aşamalı mimariyi yalnızca modelde değil, ürün akışında da kullanmak işe yarar:

  1. Tarama ekranı: “MAFLD riski yüksek mi?”
  2. Yönlendirme ekranı: “Hangi fenotip olası? Hangi takip planı?”

Bu, hekimin iş yükünü azaltır ve yanlış alarmları yönetilebilir seviyede tutar.

2) Veri stratejisi: ESK + anket + yaşam tarzı sensörleri

MAFLD gibi tablolar için “dijital sağlık” demek çoğu zaman şunları bir araya getirmek demek:

  • Laboratuvar ve vital veriler
  • İlaç kullanımı ve tanılar
  • Yaşam tarzı anketi (uyku, aktivite, beslenme, sigara)
  • Mümkünse giyilebilir cihaz verileri (adım, uyku süresi vb.)

Burada önemli olan mükemmel veri değil; çok görünüm oluşturacak kadar tamamlayıcı veri.

3) Klinik eşikler: Hassasiyet–kesinlik dengesini bilinçli yönetin

Çalışmada örnek bir eşik tartışması var: Aşama 1’de olasılık eşiğini 0,60 yaptığınızda kesinlik (precision) artıyor; 0,70 yaptığınızda daha da artıyor ama duyarlılık düşüyor.

Ürün tarafında bu şu anlama gelir:

  • Check-up merkezinde yanlış alarm maliyeti düşükse daha düşük eşik seçilebilir.
  • Hepatoloji polikliniğinde kaynak kısıtlıysa daha yüksek eşik seçmek mantıklı olabilir.

Sahada sık sorulan sorular (kısa yanıtlarla)

Bu yaklaşım ultrason veya biyopsinin yerine geçer mi?

Hayır. Bu tip modellerin doğru konumu: risk stratifikasyonu ve erken uyarı. Kimin görüntüleme/ileri testlere öncelikli gideceğini daha iyi seçmeye yarar.

Neden “kontrastif öğrenme” bu kadar işe yarıyor?

Çünkü etiketli veri az, sınıflar dengesiz ve veri kaynakları parçalı. Kontrastif öğrenme, “sadece etiket” yerine temsil kalitesini güçlendirerek nadir sınıflarda daha iyi ayrışma sağlar.

Bu yöntem başka hastalıklara da uyarlanır mı?

Evet. Çok kaynaklı veri + heterojenlik + zamansallık olan her yerde (diyabet riski, kardiyovasküler risk, KOAH atak riski gibi) benzer mimari yaklaşım değer üretir.

Dijital sağlıkta MAFLD için bir sonraki adım ne olmalı?

MAFLD fenotip tahmini, erken teşhis odaklı yapay zekânın “gösterişli demo”dan çıkıp klinik karar desteğine dönüşebileceğini kanıtlayan iyi bir örnek. Bu çalışma, tek başına bir model performansından daha fazlasını söylüyor: Doğru veriyi doğru biçimde birleştirirseniz, kronik hastalıklarda erken yakalama oranı anlamlı şekilde artar.

Serimizin genel temasıyla bağlayayım: Sağlık sektöründe yapay zekâdan gerçek fayda, çoğu zaman “en yeni algoritma”dan değil, çok kaynaklı veri mimarisi + klinik akışa uygun tasarım + yorumlanabilirlik üçlüsünden geliyor.

Eğer kurumunuzda MAFLD/karaciğer yağlanması için dijital tarama, risk skorlaması veya hasta takip programı düşünüyorsanız, başlangıç sorusu basit olmalı: “Hangi verilerle, hangi klinik eşiklerle, kimi hangi aksiyona yönlendireceğiz?”