NLP tabanlı iTEST, EMR’den klinik araştırma uygunluk taramasını hızlandırıp doğruluğu artırıyor. Hastaneler için uygulanabilir yol haritası.

Klinik Araştırmada NLP ile Hızlı Uygunluk Tarama Rehberi
Klinik araştırmalarda en çok zaman yutan işlerden biri, doğru hastayı doğru çalışmaya eşleştirmek. Üstelik burada “biraz gecikme” çoğu zaman “kaçan fırsat” demek. Akut iskemik inme gibi tablolar için kullanılan “zaman beyindir” ifadesi boşuna söylenmiyor: uygunluk kriterlerini dakikalar içinde doğrulayamıyorsanız, hem hasta güvenliği hem de araştırmanın kalitesi risk altına giriyor.
11.12.2025’te yayımlanan bir kullanılabilirlik çalışması, bu soruna pratik bir yanıt verdi: Elektronik tıbbi kayıtlar (EMR) içindeki yapılandırılmış (laboratuvar) ve yapılandırılmamış (klinik notlar) veriyi doğal dil işleme (NLP) ile okuyup, klinisyenlerin anlayacağı şekilde sunan ve kriterleri “sürükle-bırak” mantığıyla kural haline getirmeyi hedefleyen bir araç: iTEST.
Bu yazı, “Sağlık Sektöründe Yapay Zekâ ve Dijital Sağlık” serisinin bir parçası olarak iTEST’i yalnızca özetlemiyor; Türkiye’deki hastaneler, klinik araştırma birimleri ve dijital sağlık ekipleri için nasıl uygulanabilir, hangi riskleri yönetmek gerekir, nereden başlanmalı sorularına da net cevaplar veriyor.
Klinik araştırmada uygunluk taraması neden tıkanıyor?
Kısa cevap: EMR çok dolu, kriterler çok detaylı, zaman çok az.
Birçok kurumda uygunluk taraması hâlâ “kayıtlar arasında gezinme + manuel doğrulama + ikinci göz kontrolü” şeklinde yürüyor. Bu yaklaşımın üç temel maliyeti var:
- Zaman maliyeti: Klinik notlar yüzlerce hatta binlerce satır olabiliyor. Çalışmada bazı hastalarda 417 ile 7299 arasında klinik not olduğu raporlanıyor.
- Bilişsel yük: “Hangi notta yazıyordu?” arayışı; tarih hesapları; ilaç sınıfları; dışlama kriterleri… Bu iş insan zihnini yoruyor ve hata olasılığını artırıyor.
- Tutarsızlık riski: Aynı kriteri iki klinisyen farklı yorumlayabiliyor. Bu da seçim yanlılığına ve güvenlik hatalarına kapı aralıyor.
Buradaki asıl problem teknoloji değil; arüz ve iş akışı. EMR’ler çoğu zaman “dokümantasyon” için güçlü, “hızlı karar destek” için zayıf.
iTEST ne yapıyor, farkı nerede?
iTEST’in yaklaşımı net: Klinisyen, kriteri yazılım ekibine muhtaç olmadan kurala çevirebilsin; sistem de EMR’den ilgili kanıtı çıkarıp aynı ekranda göstersin.
Araç iki bileşenden oluşuyor:
1) Kural yazma modülü: “Blok tabanlı” mantık
Kriterler çoğu zaman metin halinde gelir: “Trombosit < 100.000” veya “Son 3 ayda internal kanama” gibi. iTEST bu kriterleri, Google Blockly benzeri bir arayüzle bloklara dönüştürmeyi hedefliyor.
Bu yaklaşımın güçlü yanı şu: Kural değişince sprint planı beklemezsiniz. Klinik araştırma protokolleri güncellenir, yeni alt analizler gelir, dışlama maddeleri revize edilir. Bloklarla kural güncellemek, yazılım geliştirmeye kıyasla daha hızlı ve sürdürülebilir bir yol.
2) Kural değerlendirme modülü: NLP + lab verisi
- Yapılandırılmış veri: Laboratuvar değerlerini tablolardan okuyor.
- Yapılandırılmamış veri: Klinik notlardan tıbbi kavram çıkarımı için MetaMap Lite kullanıyor.
Sonuç, tek bir ekranda “kriter geçti/kaldı” ve bunun dayanağı olan not/lab bağlantılarıyla birlikte gösteriliyor. Böylece klinisyen, sonuca güvenmek yerine kanıtı hızlıca doğrulayabiliyor.
Kanıt: Hız, doğruluk ve bilişsel yükte ne değişti?
Tayvan’da 1000 yataklı bir eğitim hastanesinde yapılan çapraz tasarımlı deneyde 12 klinisyen, 4 inme vakasını 2 ayrı çalışma kriter seti için değerlendirdi. Toplam 48 senaryo üretildi.
Bu testte iTEST, standart EMR arayüzü ile kıyaslandığında dört net kazanım sağladı:
- Doğruluk: 0,91’den 1,00’a çıktı (yaklaşık %9,9 artış).
- Süre: 3,18 dakikadan 2,44 dakikaya indi (yaklaşık %23 azalma).
- Bilişsel yük (NASA-TLX): 62,8’den 39,7’ye düştü.
- Kullanılabilirlik (SUS): 46,3’ten 71,3’e yükseldi.
Benim burada en kritik bulduğum metrik doğruluk. Çünkü klinik araştırmada yanlış uygunluk kararı iki uca da zarar verir:
- Uygun olmayan hastayı dahil etmek: güvenlik riski ve protokol ihlali
- Uygun hastayı dışarıda bırakmak: hasta için fırsat kaybı, araştırma için örneklem kaybı
“Uygunluk taramasında doğruluk, hızdan daha değerlidir. Çünkü hızın bedeli güvenlik olmamalı.”
En zor kriterler neden zor? (Ve NLP bunu nasıl çözüyor?)
Çalışmada standart EMR ile klinisyenlerin özellikle zorlandığı kriterler dikkat çekiyor:
- “Diyabet + daha önce inme öyküsü” gibi birden fazla kaynaktan kanıt gerektiren durumlar
- “Son 3 ayda internal kanama” gibi zaman penceresi isteyen dışlama maddeleri
- “APTT ≤ kontrolün 1,4 katı” gibi hesap/yorum gerektiren laboratuvar eşikleri
NLP’nin burada kattığı değer, “metni özetlemek” değil; ilgili kavramı bulup görünür kılmak. iTEST’in yaptığı tam olarak bu: notların içinde tıbbi kavramları çıkarıp işaretliyor, klinisyenin gözünü doğru yere götürüyor.
Yine de gerçekçi olmak lazım: Tıbbi NLP’de en büyük kırılganlık, inkâr (negasyon) ve bağlam.
Türkiye’de uygulanabilir mi? Evet, ama dört koşulla
Bu tarz bir dijital sağlık çözümünü Türkiye’de hastane ortamında hayata geçirmek için “modeli kurduk, bitti” yaklaşımı çalışmaz. Aşağıdaki dört koşul sağlanırsa sonuç alınır:
1) İş akışına gömülmeli: Triyajda başlasın
Çalışmada sistemin ilk hasta yüklemede 6–345 saniye arası “ön işleme” yaptığı belirtiliyor. Bu, acilde karar anına bırakılırsa sorun olur.
Doğru yaklaşım: Ön işleme triyajda başlar; klinisyen değerlendirmeye geçtiğinde sistem hazırdır. Türkiye’de acil servis iş yükü düşünüldüğünde bu şart.
2) Kural yaşam döngüsü yönetimi şart
Kriterler sık değişir. Bu değişiklikleri kontrolsüz bırakmak, “kural drift’i” yaratır.
Minimum yönetişim paketi:
- Versiyonlama (hangi tarihte hangi kural aktifti?)
- Onay mekanizması (klinik sorumlu + araştırma koordinatörü)
- Geri alma (yanlış güncellemede önceki sürüme dönüş)
3) Türkçe klinik not gerçekliği hesaba katılmalı
Çalışmadaki notlar ağırlıkla İngilizceydi. Türkiye’de ise pratik daha karmaşık: Türkçe, kısaltmalar, yarı İngilizce terimler, bölümden bölüme değişen jargon.
Bu nedenle iki yol var:
- Kural tabanlı + sözlük destekli NLP (kontrollü, denetlenebilir)
- Hibrit yaklaşım: Kural tabanı “karar motoru” olur, büyük dil modeli (LLM) ise yalnızca kavram çıkarımı/normalizasyon gibi sınırlı bir rolde kullanılır.
Benim duruşum net: Uygunluk taraması gibi yüksek riskli bir alanda, LLM’yi “hakem” yapmak yerine “asistan” yapmak daha doğru.
4) Güvenlik kriterleri için yerel doğrulama yapılmalı
Çalışmada “antikoagülan” kavramının çıkarımında ciddi zayıflık görülmüş ve tek tek ilaçları ekleyerek düzeltilmiş.
Türkiye’de bu daha da kritik; çünkü ilaç yazım biçimleri değişken:
- Etken madde vs ticari isim
- Kısaltmalar
- Doz/şema notları
Bu yüzden devreye almadan önce küçük ama disiplinli bir doğrulama yapılmalı:
- 20–30 hastalık örnek set
- Klinik uzmanların “altın standart” etiketlemesi
- Hassasiyet/duyarlılık ölçümü ve iteratif iyileştirme
Hastaneniz için pratik başlangıç planı (8 hafta)
Klinik araştırma uygunluk taraması için NLP tabanlı bir sistem denemek istiyorsanız, en hızlı değer üreten yol şu:
- Hafta 1: Tek bir servis + tek bir protokol seçin (ör. inme, onkoloji, kardiyoloji).
- Hafta 2: En sık hata yapılan 10 kriteri çıkarın (özellikle dışlama kriterleri).
- Hafta 3-4: EMR’de bu kriterlerin geçtiği doküman türlerini haritalayın (epikriz, acil notu, konsültasyon, reçete, lab).
- Hafta 5: Kural setini oluşturun ve versiyonlayın.
- Hafta 6: 20–30 vakada doğrulama yapın.
- Hafta 7: Pilot canlı kullanım (yalnızca “ön tarama” önerisi olarak).
- Hafta 8: Ölçün: doğruluk, tarama süresi, kullanıcı memnuniyeti, kaç hasta aday gösterildi.
Buradaki kritik nokta: İlk fazda sistemi “otomatik karar” konumuna koymayın. Ön tarama ve kanıt görünür kılma bile ekiplerin zamanını ciddi azaltır.
Dijital sağlıkta bir sonraki adım: Kriter yazımını klinisyene bırakmak
iTEST’i değerli kılan tek şey NLP değil; kural yazımını demokratikleştirme fikri. Sağlıkta yapay zekâ projeleri çoğu zaman teknik ekipte kilitlenir: Klinik değişir, sistem geride kalır. Blok tabanlı arayüzler, bu bağımlılığı azaltma potansiyeli taşıyor.
Bu yaklaşım, “Sağlık Sektöründe Yapay Zekâ ve Dijital Sağlık” serisinin ana fikriyle bire bir örtüşüyor: Yapay zekâ, yalnızca teşhis koyan bir motor değil; hastane operasyonlarını hızlandıran, klinik yükü azaltan, hasta güvenliğini artıran bir altyapı bileşeni.
Bugün çoğu kurum klinik araştırmayı “ek iş” gibi yönetiyor. Ben buna katılmıyorum. Klinik araştırma, kaliteli bakımın bir uzantısı. Eğer uygunluk taramasını doğru araçlarla sadeleştirirseniz, hem araştırma kapasitesi büyür hem de klinisyen üzerindeki baskı azalır.
Sizin kurumunuzda en çok zaman kaybettiren uygunluk kriteri hangisi: zaman pencereleri mi, ilaçlar mı, yoksa dağınık klinik notlar mı?