רשת נוירונים באקסל: סיווג סיכונים בביטוח ובריאות

בינה מלאכותית בתחום הבריאות והביוטכנולוגיהBy 3L3C

איך רשת נוירונים מסווגת באקסל עוזרת להבין סיווג סיכונים, זיהוי הונאות וניהול החלטות בביטוח ובריאות—ולבנות פרויקט AI מדיד.

רשתות נוירוניםExcelסיווגזיהוי הונאותניהול סיכוניםAI בבריאות
Share:

Featured image for רשת נוירונים באקסל: סיווג סיכונים בביטוח ובריאות

רשת נוירונים באקסל: סיווג סיכונים בביטוח ובריאות

רוב הארגונים חושבים שצריך פלטפורמה כבדה כדי להתחיל לעבוד עם מודל סיווג מבוסס רשת נוירונים. בפועל, לא מעט מההבנה (וגם מהערך העסקי הראשוני) מגיע דווקא כשבונים מודל קטן, שקוף, כזה שאפשר “לראות” אותו עובד. וזה בדיוק מה שהדגמה של רשת נוירונים ב-Excel מאפשרת: להכניס ידיים לבטן הרכה של המודל ולהבין איך הוא מקבל החלטה.

בדצמבר 2025, כשהשיח על AI בישראל נע בין רגולציה, פרטיות ויעילות תפעולית, יש משהו כמעט מרענן בלחזור לבסיס: סיווג. כי בין אם אנחנו מדברים על ביטוח (זיהוי הונאות, סגמנטציית סיכון) ובין אם על בריאות וביוטכנולוגיה (טריאז’ דיגיטלי, איתור מטופלים בסיכון, תיעדוף בדיקות) – הרבה מהיישומים המעשיים נשענים על אותה שאלה: לאיזו קטגוריה שייך המקרה הזה, ומה ההסתברות לכך?

הפוסט הזה לוקח את רעיון “רשת נוירונים מסווגת באקסל” מהעולם ההדרכתי, ומתרגם אותו לשפה של מנהלי מוצר, אנליסטים, אקטוארים, אנשי תפעול וסיכונים – עם דגש על איך לחשוב על זה נכון כדי לייצר תוצאות אמינות במצבים אמיתיים.

למה דווקא סיווג? כי זה הלב של החלטות בביטוח ובריאות

סיווג הוא מנוע החלטות. בביטוח הוא קובע תמחור, חיתום, חקירת תביעה, או סימון התנהגות חשודה. בבריאות הוא קובע דחיפות, מסלול טיפול, או איתור מוקדם של הידרדרות.

במונחים פרקטיים, מודל סיווג מחזיר לרוב ערך כמו P(הונאה)=0.83 או P(אשפוז ב-30 ימים)=0.27. ההסתברות הזו מאפשרת:

  • לקבוע ספי החלטה (למשל: מעל 0.8 שולחים לבדיקה ידנית)
  • לבצע תעדוף (מי נכנס “לתור” קודם)
  • למדוד ביצועים באופן שיטתי (דיוק, Recall, Precision, ROC-AUC)

היתרון הגדול של רשת נוירונים, גם כשהיא קטנה, הוא שהיא יודעת לבנות גבולות החלטה לא-ליניאריים. זה שימושי במיוחד כשאין “קו ישר” שמפריד בין מקרים תקינים לחריגים – תרחיש קלאסי בזיהוי הונאות, וגם בנתונים קליניים מרובי משתנים.

רשת נוירונים קטנה: שלוש שכבות שמסבירות המון

התובנה המעשית: רשת נוירונים מסווגת בסיסית יכולה להיות פשוטה: שכבת קלט → שכבה חבויה אחת → שכבת פלט. ובמקרים רבים, זה מספיק כדי להבין את המכניקה ולבנות הוכחת היתכנות.

מה קורה בשכבה החבויה?

במקום להאכיל את המודל רק בנתון המקורי (נניח משתנה אחד), השכבה החבויה יוצרת תכונות ביניים. אפשר לחשוב עליה כעל “שתי לוגיסטיות קטנות” שמייצרות שתי נקודות מבט שונות על אותו משתנה.

במונחי אינטואיציה:

  • כל נוירון חבוי לומד “חתך” אחר של המרחב
  • שני נוירונים יחד מייצרים טרנספורמציה שמאפשרת הפרדה מורכבת יותר
  • שכבת הפלט מחברת את שתי התכונות הללו להסתברות סופית

זו נקודה קריטית לאנשי ביטוח וניהול סיכונים: הרבה מהעבודה שלנו היא בעצם יצירת “תכונות” (כללים, אינדיקציות, דפוסים). רשת נוירונים עושה את זה בצורה אוטומטית – אבל רק אם נותנים לה נתונים איכותיים ומסגרת מדידה נכונה.

למה מספר הנוירונים חשוב?

כי הוא קובע את יכולת הביטוי של המודל.

  • מעט מדי נוירונים → המודל “נוקשה” ולא יתפוס דפוסים
  • יותר מדי נוירונים → סיכון מוגבר ל-Overfitting (במיוחד בדאטה קטן)

בביטוח זה מתבטא בכך שמודל עלול “ללמוד” התנהגות של תיק מסוים/סוכן מסוים במקום ללמוד תבנית כללית של הונאה. בבריאות זה עלול להוביל למודל שמצטיין במחלקה אחת ונכשל בבית חולים אחר.

משפט שאפשר להדפיס ולתלות: יכולת גבוהה בלי בקרות איכות = מתכון להפתעות בפרודקשן.

Excel כמעבדה: למה שקיפות עדיפה בשלב הראשון

הסיבה שאקסל עובד פה טוב היא לא שהוא הכלי הכי מתקדם, אלא כי הוא מאלץ שקיפות:

  1. הזנה קדימה (Forward Propagation) – רואים בדיוק איך כל משקל והטיה משפיעים על ההסתברות.
  2. פונקציית הפסד (Log Loss) – מבינים מה “כואב” למודל כשהוא טועה בביטחון גבוה.
  3. חישוב גרדיאנטים (Backpropagation) – רואים איך שינוי קטן במשקל מזיז את התוצאה.

Forward Propagation במילים פשוטות

בכל תצפית:

  • מחשבים לכל נוירון חבוי צירוף ליניארי של הקלט + הטיה
  • מעבירים דרך פונקציה לוגיסטית כדי לקבל ערך בין 0 ל-1
  • מחברים בשכבת הפלט לקבלת P(class=1)

בביטוח אפשר למפות את זה לזרימת חשיבה:

  • נוירון אחד “שם לב” לחריגה בסכום התביעה
  • נוירון שני “שם לב” לתזמון חריג ביחס לפוליסה
  • שכבת הפלט משקללת אותם להסתברות הונאה

בבריאות/ביוטכנולוגיה זה יכול להיות:

  • נוירון אחד מגיב לשילוב סימפטומים
  • נוירון שני לתוצאות בדיקה/מדד מעבדה
  • שכבת הפלט מחזירה הסתברות לאשפוז/סיבוך

למה יש כמה פתרונות “טובים” לאותו גבול החלטה?

במודלים כאלה ייתכנו מספר קונפיגורציות שונות של משקולות שמייצרות כמעט אותו סיווג. זה לא באג – זו תכונה.

המשמעות לאנשי סיכונים: כשאתם מריצים אימון פעמיים ומקבלים מודלים מעט שונים – זה טבעי. לכן צריך להעריך מודלים לפי ביצועי ולידציה, יציבות לאורך זמן, והוגנות – לא לפי “המשקולות נראות לי הגיוניות”.

Backpropagation וגרדיאנט דסנט: איפה דברים נוטים להשתבש בפרקטיקה

הנקודה הישירה: Backpropagation הוא פשוט חישוב נגזרות של פונקציה מורכבת כדי לבצע Gradient Descent. אין כאן קסם – אבל יש כאן הרבה מקום לטעויות תפעוליות.

אתחול ומשמעותו בעולם אמיתי

אם מתחילים ממשקולות “בעייתיות”, האימון עלול:

  • להתכנס לאט מאוד
  • להיתקע במינימום מקומי
  • להתכנס לפתרון שמסווג היטב חלק מהאוכלוסייה ונכשל באחרת

ביישומים ביטוחיים זה מתורגם לבעיה עסקית: המודל מפספס סוג מסוים של הונאה או מסמן יותר מדי תביעות תקינות (False Positives), מה שמעמיס על צוות חקירות.

בבריאות זה חמור יותר: False Negative עלול להיות מטופל בסיכון שלא זוהה. לכן שם הדגש עובר לעיתים ל-Recall/רגישות – ולא רק לדיוק כללי.

מדד ההפסד: למה Log Loss הוא המדד הנכון לסיווג הסתברותי

Log Loss מעניש חזק טעויות עם ביטחון גבוה. זה יתרון עצום בתחומים רגישים:

  • בביטוח: אם המודל בטוח שמדובר בהונאה אבל טועה, התהליך העסקי יכול לייצר חיכוך מול לקוח טוב.
  • בבריאות: אם המודל בטוח שאין סיכון אבל טועה, המחיר קליני.

המשמעות הפרקטית: גם כשמסתכלים על מטריקות כמו AUC, כדאי למדוד גם Calibration (כיול הסתברויות). הסתברות 0.8 אמורה להתנהג כמו 80% באמת, לא רק “גבוה”.

איך מתרגמים את זה לפרויקט AI בביטוח (ובסדרה שלנו בבריאות)

כדי שהמודל לא יישאר תרגיל נחמד באקסל, צריך לתכנן מסלול קצר וברור מהדגמה לפרודקשן. הנה מסגרת שעובדת טוב גם בביטוח וגם בארגוני בריאות.

1) הגדירו בעיית סיווג אחת, מצומצמת, עם החלטה עסקית ברורה

דוגמאות טובות:

  • ביטוח: “האם להעביר תביעה לבדיקה ידנית?”
  • בריאות: “האם להפנות מטופל לבדיקת מעבדה דחופה?”

בחרו החלטה אחת, לא עשר.

2) בנו סט תכונות שמכבד את המציאות

שאלות שחייבות להישאל:

  • האם יש Leakage? (למשל משתנה שמופיע רק אחרי שהתקבלה החלטה)
  • האם יש הטיות היסטוריות? (במיוחד בנתוני חקירות/אבחון)
  • האם הנתונים מייצגים את מי שיהיה בפרודקשן בעוד 3 חודשים?

3) קבעו מטריקות מראש וסף פעולה

המלצה פרקטית למסגרת מדידה:

  • Recall מינימלי (למניעת פספוס)
  • Precision מינימלי (כדי לא להציף תפעול)
  • בדיקת כיול הסתברויות
  • ניטור Drift חודשי

4) התחילו קטן, אבל תכננו נכון את השלב הבא

Excel הוא מעולה לשלב הבנה והוכחת היתכנות. בפרודקשן תצטרכו:

  • תיעוד מודל (Model Card)
  • ניהול גרסאות דאטה
  • בקרות רגולציה ופרטיות (במיוחד בבריאות)
  • יכולת הסבר והצדקה להחלטות

שאלות נפוצות (בדיוק אלו שעולות בישיבות)

האם “שכבה חבויה אחת מספיקה” באמת?

תיאורטית – כן, בהרבה בעיות. מעשית – לא תמיד. עומק (יותר שכבות) נותן יעילות ייצוגית ולמידה עשירה יותר, אבל גם מורכבות תפעולית. בביטוח ובריאות, אני מעדיף להתחיל ממודל קטן שמדידים אותו היטב, ואז להעמיק אם צריך.

למה לא להישאר עם רגרסיה לוגיסטית?

אם הבעיה ליניארית – רגרסיה לוגיסטית נהדרת, שקופה וקלה לבקרה. אבל הרבה בעיות אמיתיות (הונאה, קומורבידיות, דפוסים דינמיים) הן לא-ליניאריות. רשת נוירונים קטנה נותנת קפיצה ביכולת – בלי להפוך את המערכת לקופסה שחורה לגמרי.

מה הסיכון הכי גדול בפרויקט סיווג?

לא האלגוריתם. הדאטה וההחלטה העסקית. מודל מצוין שמוטמע בסף החלטה לא נכון או בלי תהליך טיפול יוצר נזק. זו הסיבה שחייבים לשלב תפעול, משפטי/רגולציה ובעלי מוצר כבר מההתחלה.

הצעד הבא: להפוך “מודל באקסל” לתהליך שמייצר לידים ותוצאות

אם אתם מנהלים מוצר, סיכונים או דאטה בארגון ביטוח – מודל סיווג קטן ושקוף הוא דרך מצוינת ליישר קו: מה אנחנו מנסים לנבא, איך נמדוד הצלחה, ואיך נכניס את זה לתהליך בלי לשבור את השירות.

ובמסגרת סדרת “בינה מלאכותית בתחום הבריאות והביוטכנולוגיה”, אותו עיקרון עובד מצוין גם בצד הקליני: לפני שמריצים מודלים עמוקים על דאטה מורכב, כדאי להבין את המכניקה של הסתברות, גבול החלטה, ו-Log Loss. כשמבינים את זה – קל יותר לבחור מודל, להסביר אותו, ולבנות אמון.

אם הייתם צריכים לבחור יישום סיווג אחד לשנת 2026 – בביטוח או בבריאות – איפה הייתם שמים את הסף הראשון, ומה הייתם עושים עם כל מקרה “גבולי” שהמודל לא בטוח לגביו?