רשת נוירונים באקסל: להבין AI בביטוח ובריאות

בינה מלאכותית בתחום הבריאות והביוטכנולוגיהBy 3L3C

רשת נוירונים באקסל חושפת איך מודלי AI מחשבים סיכון ועלות תביעה. מדריך פרקטי לאנשי ביטוח, סיכונים ובריאות.

אקסלרשתות נוירוניםחיזוי סיכוןתביעות ביטוחבריאות דיגיטליתלמידת מכונה
Share:

Featured image for רשת נוירונים באקסל: להבין AI בביטוח ובריאות

רשת נוירונים באקסל: להבין AI בביטוח ובריאות

רוב הארגונים משתמשים במודלים של בינה מלאכותית כדי לחזות סיכון, עלויות ותביעות — אבל מעט מאוד אנשים בתוך הארגון באמת מבינים מה המודל מחשב בכל שלב. ואז, כשמופיעה חריגה (קפיצה בתדירות תביעות, שינוי פרופיל מבוטחים, או הטיה בנתונים), כולם מסתכלים על התוצאה כמו על קופסה סגורה.

התרגיל הכי יעיל שמצאתי כדי “לפתוח” את הקופסה הזו הוא לבנות רגרסור של רשת נוירונים באקסל: בלי model.fit(), בלי ספריות, ובלי קוד שמסתיר את מה שקורה. הכול גלוי — חישובי הביניים, השגיאה, הגרדיאנטים, ועדכוני המשקולות.

ולמה זה קשור דווקא אליכם — אנשי ביטוח, ניהול סיכונים ובריאות? כי אותם עקרונות בדיוק מפעילים מודלים שמעריכים עלות תביעה צפויה, מזהים הונאות, מנבאים החמרה קלינית או סיכון לאשפוז חוזר. אם מבינים את המנגנון, קל יותר לשאול שאלות נכונות, לדרוש בקרה, ולהפוך AI לכלי עבודה — לא לקסם.

למה רשת נוירונים באקסל דווקא עובדת (ולא רק ללמידה)

הנקודה המרכזית: רשת נוירונים היא פונקציה מורכבת — קומפוזיציה של פונקציות פשוטות עם מספר פרמטרים. כשבונים אותה באקסל, לא “מריצים קסם”; מחשבים נוסחה.

בארגונים רבים בענפי הביטוח והבריאות יש עדיין תלות כבדה באקסל — צוותי חיתום, אנליסטים אקטואריים, כלכלני בריאות, מנהלי תביעות, מנהלי סיכונים. זה לא חיסרון; זה יתרון.

  • אקסל מאפשר שקיפות מלאה של חישוב תחזית הסיכון.
  • ניתן לבצע בקרה, ולידציה ותיעוד של כל שלב — קריטי בעבודה מול רגולציה.
  • אפשר לבנות אב-טיפוס מהיר, לחדד את הלוגיקה, ורק אחר כך להעביר לפיתוח תעשייתי.

משפט שאפשר לתלות על הקיר: הבנת המודל מתחילה בלראות מספרים זזים בתאים.

מבנה הרשת: 7 פרמטרים שמסבירים הרבה

כדי להבין רגרסיה לא-ליניארית, לא צריך עשרות שכבות. תצורה מינימלית, חזקה ומאוד “לימודית” היא:

  • קלט אחד: x (פיצ’ר יחיד)
  • שכבה נסתרת: 2 נוירונים עם אקטיבציה סיגמואידית
  • שכבת פלט: ליניארית (כמו רגרסיה ליניארית)

בסך הכול יש 7 פרמטרים:

שכבה נסתרת

  • a11: משקל מ-x לנוירון 1
  • b11: ביאס לנוירון 1
  • a12: משקל מ-x לנוירון 2
  • b12: ביאס לנוירון 2

שכבת פלט

  • a21: משקל מנוירון 1 לפלט
  • a22: משקל מנוירון 2 לפלט
  • b2: ביאס הפלט

מה מרוויחים משני נוירונים? עקמומיות. סיגמואיד היא “מדרגה חלקה”. שתי מדרגות חלקות נותנות לכם יכולת לבנות עקומה שעולה, יורדת, מתיישרת ומתעקמת — וזה בדיוק מה שצריך במודלים של:

  • תמחור ביטוח שבו הסיכון לא גדל ליניארית עם גיל/הכנסה/תדירות ביקורים.
  • בריאות דיגיטלית שבה סיכון לאשפוז קופץ אחרי סף מסוים של מדדים.
  • תביעות שבה עלות צפויה עולה לאט ואז מהר (או להפך).

Forward Propagation: איך תחזית נוצרת בפועל

Forward propagation הוא פשוט “להריץ את הנוסחה קדימה”:

  1. מחשבים לכל נוירון נסתר ערך ליניארי:
    • z1 = a11*x + b11
    • z2 = a12*x + b12
  2. מעבירים דרך סיגמואיד:
    • A1 = sigmoid(z1)
    • A2 = sigmoid(z2)
  3. מחשבים פלט:
    • y_hat = a21*A1 + a22*A2 + b2

באקסל זה נהדר כי אפשר לראות לכל תצפית:

  • מה היה z לפני האקטיבציה
  • כמה “נפתח” כל נוירון (האם הוא רווי קרוב ל-0 או 1)
  • איך שני הנוירונים “מתווכחים” על התוצאה דרך המשקולות a21, a22

אנלוגיה ביטוחית-בריאותית שעוזרת להבין

תחשבו על שני הנוירונים הנסתרים כמו על שני “ספים רכים”:

  • נוירון אחד יכול לזהות מעבר הדרגתי ל”קבוצת סיכון גבוהה” (למשל מעל מספר ביקורי מיון מסוים)
  • נוירון שני יכול לזהות תופעה אחרת (למשל שילוב תרופות מסוים)

שכבת הפלט מחברת אותם לעלות צפויה, לציון סיכון או להסתברות.

Backpropagation באקסל: אימון בלי להסתיר כלום

אם forward propagation מייצר תחזית, backpropagation מייצר כיוון תיקון.

בבעיית רגרסיה, פונקציית עלות סטנדרטית היא MSE — ממוצע ריבועי השגיאה:

  • error = y_hat - y
  • MSE = average(error^2)

היעד: למצוא את 7 הפרמטרים שממזערים את ה-MSE.

הלולאה שעושה את כל העבודה

באקסל אפשר לבנות את תהליך האימון כטבלה איטרטיבית:

  1. אתחול משקולות (ערכים התחלתיים)
  2. חישוב תחזיות לכל התצפיות (forward)
  3. חישוב שגיאות ועלות
  4. חישוב נגזרות חלקיות (gradients) לכל פרמטר
  5. עדכון פרמטרים לפי קצב למידה learning_rate
  6. חזרה עד התכנסות

זו אותה לוגיקה שמופעלת בספריות ML — רק ששם היא נסתרת.

למה אתחול חשוב במיוחד (ובביטוח זה “ביג דיל”)

ברשת קטנה פונקציית העלות עדיין לא קמורה לחלוטין. המשמעות: אפשר להיתקע במינימום מקומי.

בפרקטיקה של ביטוח ובריאות, זה מתבטא כך:

  • אתם בונים מודל שמנבא עלות תביעה צפויה
  • מקבלים תוצאות “סבירות” אבל לא יציבות
  • שינוי קטן בדאטה או בחלוקה ל-train/test משנה את המסקנות

אקסל מאפשר לראות את זה מוקדם: אם הפרמטרים “קופצים”, אם ה-MSE לא יורד בצורה עקבית, או אם נוירון נכנס לרוויה (סיגמואיד ~0 או ~1) ואז מפסיק ללמוד.

שימושים פרקטיים בביטוח וניהול סיכונים (וגם בבריאות)

המודל שבנינו באקסל הוא צעצוע חינוכי — אבל העקרונות שלו הם תשתית לעבודה אמיתית.

1) הערכת עלות תביעה צפויה (Expected Claim Cost)

כאשר הקשר בין משתנה (למשל גיל, מספר אירועים, מדד רפואי) לבין עלות אינו ליניארי, רשת קטנה מסוגלת ללכוד:

  • נקודות סף רכות
  • אפקטים של רוויה (עלות עולה עד גבול מסוים ואז מתייצבת)

2) ניהול תביעות חכם (Claims Triage)

ציון רציף (רגרסיה) יכול להיות בסיס להחלטה תפעולית:

  • לאיזה תיקים מקצים חוקר?
  • איזה תיקים עוברים בדיקה רפואית?
  • באיזה שלב מציעים פשרה?

גם אם בסוף תעברו למודל מתקדם יותר, הדיסציפלינה של בדיקת forward/backward נשארת.

3) איתור אנומליות והונאות — החיבור ללמידה מפוקחת ולא מפוקחת

במקור הוזכרו גם שיטות כמו LOF ו-GMM (למידה לא מפוקחת). בעולם הביטוח והבריאות זה משלים את התמונה:

  • רגרסיה/סיווג מפוקח: מנבא עלות/סיכון כשיש תוויות
  • אנומליות לא מפוקחות: מזהות התנהגות חריגה כשאין “תווית הונאה” איכותית

גישה בריאה (ומעשית) היא לשלב:

  • מודל מפוקח להערכת סיכון צפוי
  • סיגנל חריגות שמתריע כשמקרה “לא נראה כמו דאטה רגיל”

איך להתחיל אצלכם: תרגיל אקסל של 60–90 דקות

אם אתם רוצים להפוך את זה לכלי עבודה בארגון (ולא רק ידע תיאורטי), זה המתכון:

  1. בחרו משתנה אחד שאתם חושדים שהוא לא ליניארי (למשל: מספר תביעות בשנה, ימי אשפוז, הוצאות תרופות)
  2. בנו טבלה עם 30–200 תצפיות (גם מדגם קטן עובד להדגמה)
  3. בנו רשת עם 2 נוירונים נסתרים ו-7 פרמטרים
  4. הגדירו MSE והתחילו גרדיאנט דסנט עם learning_rate קטן (למשל 0.01)
  5. עקבו אחרי שני גרפים:
    • MSE לאורך איטרציות
    • תחזית מול ערכים אמיתיים

בדיקות איכות שחוסכות טעויות יקרות

  • אם ה-MSE לא יורד אחרי 50–100 איטרציות: קצב למידה גבוה מדי או אתחול בעייתי.
  • אם סיגמואיד “נדבקת” ל-0/1: משקולות גדולות מדי → הגרדיאנט נחלש.
  • אם המודל מתאים מדי למדגם קטן: הוסיפו תצפיות, או הגבילו מורכבות (כאן היא כבר קטנה).

למה זה חלק טבעי מסדרת הבריאות והביוטכנולוגיה

הסדרה הזו עוסקת ביישומי AI באבחון, ניהול בתי חולים, טלה-רפואה ומחקר. בפועל, האתגר המשותף לכולם הוא אמון תפעולי: קל לקנות מערכת AI, קשה לגרום לצוותים לסמוך עליה.

כאן בדיוק תרגילי “מודל באקסל” נותנים ערך. הם יוצרים שפה משותפת בין:

  • אנשי מוצר/דאטה
  • רופאים/אחיות/מנהלי שירות
  • מנהלי סיכונים/אקטוארים/תביעות

כשכולם מבינים מה זה forward propagation ומה זה gradient descent, הרבה פחות החלטות מתקבלות על בסיס “ככה המודל אמר”.

צעד הבא: להפוך שקיפות ללידים איכותיים

אם אתם שוקלים להטמיע בינה מלאכותית בביטוח או בניהול סיכונים — במיוחד בהקשרים רפואיים — התחילו משקיפות. אני בעד מודלים חזקים, אבל אני נגד תפעול עיוור.

אפשר לבנות workshop קצר לצוות (חיתום/תביעות/בריאות דיגיטלית) שבו:

  • בונים רגרסור רשת נוירונים באקסל
  • רואים התכנסות מול אי-התכנסות
  • מתרגמים את זה לשאלות בקרה למודלים “אמיתיים” בפרודקשן

בסוף נשארת שאלה אחת שמבדילה בין ארגונים שמצליחים עם AI לארגונים שמסתבכים איתו: האם אתם יודעים להסביר, במספרים, למה המודל נתן את התשובה שנתן?