Yapay Zekâ ile Sağlık İçeriği Etiketleme: 90 Bin Etiket

Sağlık Sektöründe Yapay Zekâ ve Dijital SağlıkBy 3L3C

Yapay zekâ ile sağlık içeriklerini 3 katmanlı taksonomiyle etiketlemek, arama ve kişiselleştirmeyi güçlendirir. Gerçek saha sonuçlarıyla yaklaşımı öğrenin.

LLMDijital SağlıkSağlık İçerik YönetimiOtomatik EtiketlemeSağlık OkuryazarlığıKişiselleştirme
Share:

Featured image for Yapay Zekâ ile Sağlık İçeriği Etiketleme: 90 Bin Etiket

Yapay Zekâ ile Sağlık İçeriği Etiketleme: 90 Bin Etiket

Sağlıkta dijital dönüşüm konuşulurken çoğu ekip aynı yere takılıyor: içerik var ama bulunamıyor. Kurumun elinde yüzlerce broşür, binlerce web yazısı, onlarca video, podcast ve sunum… Hepsi “sağlık eğitimi içeriği” ama kullanıcı doğru içeriğe ulaşana kadar kayboluyor. Bunun ana nedeni genelde basit: etiketleme (tagging) zayıf, tutarsız ve ölçeklenemiyor.

17.12.2025’te yayımlanan kapsamlı bir çalışma, bu soruna çok pratik bir yerden yaklaştı: büyük dil modeli (LLM) ile otomatik, çok katmanlı etiketleme. Üstelik sadece “otomasyon” değil; insanın kaçırdığı konuları yakalayan, uzman tarafından da doğrulanan bir yaklaşım.

Bu yazı, “Sağlık Sektöründe Yapay Zekâ ve Dijital Sağlık” serimizin bir parçası. Amacım akademik detayları boğmadan şu soruya net cevap vermek: Sağlık eğitim içeriklerini yapay zekâ ile etiketlemek, dijital sağlık platformlarında erişilebilirliği ve kişiselleştirmeyi nasıl hızlandırır?

Sağlık içeriklerinde asıl darboğaz: “bulunabilirlik”

Doğru içerik yokluğu değil, doğru içeriğin doğru kişiye gidememesi bugün sağlık iletişiminin en büyük verimsizlik kaynaklarından biri. Kurumlar sürekli yeni içerik üretiyor; fakat içerik kütüphanesi büyüdükçe şu problemler katlanıyor:

  • Aynı konu farklı isimlerle etiketleniyor (ör. “hipertansiyon”, “yüksek tansiyon”, “tansiyon yüksekliği”).
  • Videoların metni az olduğu için etiket kalitesi düşüyor.
  • Manüel etiketleme ekipten ekibe değişiyor (tutarsızlık).
  • Arama ve öneri sistemleri “anahtar kelime” düzeyinde kalıyor.

Bu noktada dijital sağlık platformlarının (hasta portalları, belediye/il sağlık müdürlüğü sağlık bilgilendirme sayfaları, kurumsal sağlık uygulamaları) kaderini belirleyen şey şu oluyor: metadata kalitesi.

Etiketleme kalitesi, kişiselleştirilmiş sağlık iletişiminin altyapısıdır. Altyapı yoksa “kişiye özel” söylemde kalır.

Çalışma ne yaptı? 3 katmanlı dev bir etiket taksonomisi ve hibrit yapay zekâ hattı

Bu araştırma, Şanghay’daki bir sağlık tanıtım merkezinin 10.000 adet dijital sağlık eğitimi içeriğiyle çalışıyor (metin, kısa video, ses, sunum gibi). Ekip önce “etiket listesi” değil, 3 seviyeli bir taksonomi kuruyor:

  • 1. seviye (L1): 10 ana alan
  • 2. seviye (L2): 34 alt alan
  • 3. seviye (L3): 90.562 ayrıntılı etiket

Bu ölçek önemli. Çünkü çoğu kurum ya çok sığ etiketlerle yetiniyor (10–50 etiket) ya da “Excel’de büyüyen liste” ile kontrolü kaybediyor. Burada ise hem standartlara dayalı hem de saha içeriğinden beslenen bir yapı var.

Hibrit yaklaşım: Tek bir model değil, “boru hattı”

En kritik tasarım kararı şu: LLM tek başına bırakılmıyor.

Sistem 3 adımda çalışıyor:

  1. LLM (Baichuan2-7B) etiket öneriyor (özetleyip aday etiketler çıkarıyor)
  2. Alan-özel NER modeli (isim varlık tanıma) adayları temizliyor
  3. Vektör veritabanı üzerinden taksonomideki “kanonik” etiketlere eşleştiriliyor (standartlaştırma)

Bu mimari, Türkiye’deki ekiplerin sık yaptığı bir hatayı engelliyor: “Model önerdi, aynen bastık.” Sağlıkta böyle bir refleks risklidir. Doğru yöntem, öneri → filtre → standartlaştırma şeklinde ilerlemek.

Neden LoRA gibi verimli ince ayar (PEFT) önemli?

Model, LoRA ile ince ayar görüyor. Bunun pratik karşılığı şu:

  • Tam modeli baştan eğitmeden, çok daha düşük kaynakla uyarlama
  • Kurumsal ekiplerin “GPU bütçesi” gerçeklerine daha uygun
  • Model güncelleme döngüsü daha sürdürülebilir

Türkiye’de belediyeler, kamu kurumları ve orta ölçekli sağlık grupları için bu detay kritik: “Bu sistem sadece dev bütçelerle mi olur?” sorusuna daha gerçekçi bir yanıt veriyor.

Sonuçlar ne diyor? Yapay zekâ, insandan daha tutarlı çıkabiliyor

Bu çalışma “altın standart yok” gerçeğini ciddiye alıyor. Sağlık içeriği etiketleme gibi alanlarda yüzde yüz doğru etiket seti diye bir şey çoğu zaman yoktur; iki insan bile tam anlaşamaz.

Araştırma bu yüzden iki karşılaştırma yapıyor:

  • İnsan–İnsan (H-H) uyumu: İki insanın aynı içeriğe benzer etiket verip vermediği
  • Yapay zekâ–İnsan (A-H) uyumu: Yapay zekânın insanla ne kadar örtüştüğü

Öne çıkan sayılar:

  • A-H Cohen κ = 0,54 (orta düzey uyum)
  • H-H Cohen κ = 0,32 (daha düşük uyum)

Yani sistem, “ortalama insan etiketleyici” tutarlılığının üzerine çıkıyor. Bu bence şu anlama geliyor: LLM tabanlı etiketleme, insanı kopyalamaktan çok süreç standardizasyonu sağlayabiliyor.

En değerli bulgu: “AI Additive” (insanın kaçırdığını yakalama)

1.000 içerikte şuna bakıyorlar: Yapay zekâ insanın etiketlerini içeriyor mu, üstüne ekliyor mu?

  • %15,9 vakada yapay zekâ, insanın etiketlerine ek olarak yeni ve ilgili etiketler ekliyor.
  • Bu “ek” etiketlerin uzman doğrulamalı isabeti %90 (seçilen örneklemde).

Bu, otomasyon tartışmasını başka yere taşıyor:

Sağlıkta iyi tasarlanmış yapay zekâ sistemi, sadece iş yükünü azaltmaz; kapsamı da artırır.

Dijital sağlık platformları için pratik karşılık: Arama, öneri ve kişiselleştirme

Bu çalışma Çin’de yapılmış olabilir; fakat sorun evrensel. Türkiye’de de hastane web siteleri, kurumsal bloglar, e-Nabız dışındaki hasta eğitim portalları, belediye sağlık sayfaları ve işyeri sağlığı uygulamaları aynı problemle boğuşuyor.

Aşağıdaki üç kullanım alanında otomatik etiketleme doğrudan değer üretir.

1) Daha iyi arama: “anahtar kelime” yerine “konu”

Arama motoru, “şeker” yazan kullanıcıya sadece “şeker” geçen içerikleri getiriyorsa yetersiz kalır. Çünkü kullanıcı bazen ne aradığını doğru kelimeyle söyleyemez.

İyi bir etiket taksonomisiyle şunlar mümkün olur:

  • “Prediyabet” ile “kan şekeri düzensizliği” aynı kümeye bağlanır
  • “İlaç uyumu” ile “doz atlama” ilişkilenir
  • “Gebelik” içerikleri trimester gibi alt seviyelerde ayrıştırılır

Sonuç: bulma süresi düşer, içerik tüketimi artar, yanlış içerik tıklaması azalır.

2) Kişiselleştirilmiş sağlık iletişimi: doğru kişiye doğru paket

Kişiselleştirme çoğu kurumda “segment = yaş + cinsiyet” düzeyinde kalıyor. Oysa hassas sağlık iletişimi şunu ister: risk profili, davranış, ilgi alanı, yaşam evresi.

Çok katmanlı etiketleme şunu sağlar:

  • “65+”, “inme rehabilitasyonu”, “tansiyon takibi” etiketlerinin kesişimi
  • “hamilelik”, “aşı”, “beslenme” etiketlerinin senaryoya göre paketlenmesi

Benim gözlemim şu: kişiselleştirme motorunun yakıtı etiketlerdir. Veri yoksa algoritma da aç kalır.

3) Sağlık okuryazarlığı ve bilgi eşitliği

Aynı içerik farklı seviyelerde sunulabilir: kısa özet, adım adım rehber, uzman düzeyi detay. Etiketleme bunu operasyonel hale getirir.

Örneğin “glisemik indeks yönetimi” gibi uzman etiketi, sistemde şu davranışı tetikleyebilir:

  • Kullanıcı profili düşük sağlık okuryazarlığındaysa “basit anlatım” etiketli içerikleri öne almak
  • Sağlık çalışanı profili için klinik ayrıntıya izin vermek

Bu, dijital sağlıkta sık konuştuğumuz “erişilebilirlik” ve “eşitlik” hedeflerini somutlaştırır.

Uygulamaya geçmek isteyenler için yol haritası (Türkiye gerçekleriyle)

Bu tür bir sistemi “model kurduk bitti” diye ele almak genelde hüsran getirir. Aşağıdaki yaklaşım daha sağlam.

Adım 1: Taksonomiyi küçük başlatın, ama hiyerarşi kurun

90 bin etiketle başlamak zorunda değilsiniz. Ama 3 seviye mantığını kurun:

  • L1: 8–15 ana alan (örn. kronik hastalıklar, anne-çocuk, ruh sağlığı)
  • L2: 30–60 alt alan
  • L3: Zamanla büyüyen ayrıntılı etiketler

Burada kritik olan “liste” değil, standart isimlendirme ve eş anlam yönetimi.

Adım 2: “Hibrit” tasarıma sadık kalın

Sadece LLM çıktısını kullanmak yerine:

  • LLM → aday etiketler
  • NER / kural tabanlı filtre → temizlik
  • vektör eşleme → standart etiketlere bağlama

Bu üçlü, hem kaliteyi hem de denetlenebilirliği artırır.

Adım 3: İnsan denetimini işin başına koyun (sonuna değil)

Sağlık kurumlarında güven sorunu genelde “sonradan kontrol” yaklaşımından doğuyor. Benim önerim:

  • Yüksek riskli içeriklerde (ilaç, acil durum, aşı takvimi) insan-onay zorunlu
  • Düşük riskli içeriklerde (genel yaşam önerileri) örneklem bazlı denetim

Adım 4: Başarı metriğini doğru seçin

Sadece “%90 otomasyon” gibi metrikler yanıltır. Daha gerçekçi KPI’lar:

  • Etiket tutarlılığı (IRR yaklaşımı)
  • Arama başarısı (kullanıcıların doğru içeriğe ulaşma oranı)
  • İçerik bulma süresi (time-to-content)
  • Kişiselleştirilmiş öneri tıklama oranı
  • Editör iş yükü (dakika/içerik)

Sağlıkta yapay zekâ ile etiketleme, “küçük” bir iş gibi görünür… ama stratejiktir

Dijital sağlıkta yapay zekâ çoğu zaman teşhis ve görüntüleme üzerinden konuşuluyor. Ben buna karşı değilim; ama sahada hızlı değer üreten alanlardan biri de içerik ve bilgi mimarisi. Çünkü hastanın, yakınının ve hatta sağlık çalışanının günlük temas ettiği şey çoğu zaman “bilgiye erişim”.

Bu çalışmanın net mesajı şu: Doğru tasarlanmış LLM tabanlı etiketleme sistemi, insan ekiplerin yaptığı işi sadece hızlandırmıyor; daha tutarlı hale getiriyor ve kaçırılan konuları yakalıyor. Üstelik gerçek bir platforma API olarak entegre edilip, saniyenin altında gecikmelerle çalıştırılabiliyor.

Serimizin geri kalanında yapay zekânın uzaktan hasta takibi, hastane operasyonları ve klinik karar destek taraflarını da konuşacağız. Ama ben şunu not düşmek istiyorum: Sağlıkta kişiselleştirme hedefleniyorsa, önce içerik “hesaplanabilir” hale gelmeli. Etiketleme bunun en temiz başlangıç noktası.

Bir sonraki adım sizde: Kurumunuzda sağlık içeriği arama/öneri performansı gerçekten iyi mi, yoksa sadece “içerik çok” diye mi kendinizi rahatlatıyorsunuz?

🇹🇷 Yapay Zekâ ile Sağlık İçeriği Etiketleme: 90 Bin Etiket - Turkey | 3L3C