Bagging באקסל: להפחית אי־ודאות במודלי סיכון ביטוחיים

בינה מלאכותית בתעשייה וייצור מתקדםBy 3L3C

Bagging באקסל מפחית שונות ומשפר יציבות במודלי סיכון ביטוחיים—תמחור, תביעות והונאות. מדריך מעשי + צעדים ליישום.

Ensemble LearningBaggingאקסלביטוחניהול סיכוניםזיהוי הונאות
Share:

Featured image for Bagging באקסל: להפחית אי־ודאות במודלי סיכון ביטוחיים

Bagging באקסל: להפחית אי־ודאות במודלי סיכון ביטוחיים

בסוף 2025, הרבה מנהלי סיכונים ומנהלי תביעות מרגישים אותו דבר: יש יותר נתונים מאי פעם, אבל הביטחון בתחזיות לא תמיד עולה בהתאם. לפעמים להפך—המודל “מתלהב” יותר מדי מהדאטה ההיסטורי, ובשבוע הבא מתנהג כאילו העולם השתנה. זה לא רק עניין טכני; זה מתרגם לפרמיות לא מדויקות, ליותר חריגות בתביעות, וליותר זמן ויכוחים בין אקטואריה, חיתום ותפעול.

הדרך היעילה ביותר להוריד את הרעש הזה היא לא לחפש עוד “מודל קסם”, אלא להבין איך מייצבים מודלים. כאן נכנס Bagging (Bootstrap Aggregating): טכניקת Ensemble Learning שמפחיתה שונות (Variance) ומייצרת תחזיות יציבות יותר. והקטע היפה? אפשר להבין אותה מהעקרונות הראשונים, אפילו באקסל, בלי להמתין לצוות הדאטה סיינס.

הפוסט הזה לוקח את הרעיון מה-RSS (“Bagging in Excel”) ומחבר אותו למקום שבו זה פוגש כסף אמיתי: ביטוח וניהול סיכונים, ובמסגרת סדרת “בינה מלאכותית בתעשייה וייצור מתקדם”—כי אותם עקרונות שמייצבים מודלי איכות ותחזוקה במפעל, מייצבים גם מודלי סיכון ותביעות.

מה זה Bagging ולמה זה עובד (במילים של ביטוח)

Bagging הוא ממוצע של הרבה מודלים “חלשים” שנבנו על דגימות שונות של אותו דאטה. במקום לבנות מודל אחד ולהתפלל שהוא לא “נופל” על מקריות, אנחנו בונים עשרות/מאות גרסאות שלו על דגימות bootstrap (דגימה עם החזרה), ואז מאחדים את התחזיות.

האפקט המרכזי: הורדת שונות.

  • מודלים מסוימים (במיוחד עצי החלטה) נוטים “להיצמד” לדאטה. שינוי קטן בנתונים יכול לשנות את העץ מקצה לקצה.
  • Bagging מייצר מגוון של מודלים עם טעויות שונות. כשממוצעים אותן, חלק מהטעויות מתבטלות.

משפט שאפשר לשים על לוח בחדר חיתום: Bagging לא עושה את המודל חכם יותר—הוא עושה אותו פחות עצבני.

איפה זה פוגש את העבודה שלכם?

בביטוח, “שונות” מתבטאת בפועל ב:

  • קפיצות בתמחור בין חודשים ללא סיבה עסקית טובה
  • חוסר יציבות בסגמנטציה (מי “מסוכן” היום ומי “בטוח” מחר)
  • יותר False Positives בזיהוי הונאות (יותר לקוחות תקינים שנעצרים לבדיקה)

Bagging מכוון בדיוק לזה: תחזית יציבה יותר, פחות רעש, יותר אמון ארגוני.

Bagging באקסל: תרגיל שמלמד יותר מאלף שקפים

אפשר לבנות הדגמה מלאה של Bagging באקסל כדי להבין את המכניקה לפני שמיישמים את זה ב-Python/R או במנועי מודלים בארגון.

המטרה כאן אינה “להחליף” את סביבת המודלים שלכם, אלא לייצר הבנה אינטואיטיבית שתעזור לכם:

  • לשאול את השאלות הנכונות מול צוות הדאטה
  • להבין מה תורם ליציבות ומה לא
  • לבחון רעיונות על דאטה קטן במהירות

שלב 1: מכינים נתונים (דוגמה ביטוחית פשוטה)

נניח שיש לכם טבלה עם שורות של פוליסות/מבוטחים ועמודות כגון:

  • גיל
  • ותק נהיגה/ותק עסק
  • סכום ביטוח/חשיפה
  • מספר תביעות ב-24 חודשים
  • אינדיקציה לחשד להונאה (0/1) או עלות תביעה צפויה

כדי להשאיר את זה פשוט באקסל, בחרו יעד:

  • רגרסיה: עלות תביעה צפויה (Severity)
  • סיווג: הסתברות לתביעה/חשד להונאה

שלב 2: יוצרים דגימות Bootstrap באקסל

Bootstrap = דגימה עם החזרה. כלומר אותה שורה יכולה להופיע כמה פעמים, וחלק מהשורות לא יופיעו בכלל.

באקסל אפשר לבצע זאת כך (ברמת העיקרון):

  1. הוסיפו עמודה Rnd עם =RAND()
  2. בנו עמודה Index שמגרילה מספר בין 1 ל-N: =RANDBETWEEN(1, N)
  3. עם INDEX / XLOOKUP משכו את השורה המתאימה לטבלת “דגימה 1”
  4. חזרו על הפעולה ליצירת 30–200 דגימות (תלוי בסבלנות ובגודל)

פרקטיקה: במקום לשכפל ידנית, אפשר לעבוד עם:

  • טבלת עזר של אינדקסים לכל ריצה
  • נוסחאות דינמיות (Office 365)
  • או Power Query (אם אתם כבר שם)

שלב 3: מאמנים “מודל בסיס” לכל דגימה

באקסל אין לכם Random Forest מובנה, אבל זו לא הנקודה. אתם רוצים מודל בסיס פשוט שמגיב לשינויים בדאטה.

אפשרויות סבירות:

  • רגרסיה לינארית עם LINEST
  • לוגיסטית (עם Solver או תוסף סטטיסטי)
  • עץ החלטה ידני קטן (פחות מומלץ באקסל, אבל אפשר לצורך הבנה)

העיקרון: לכל דגימה אתם מפיקים סט פרמטרים/חוקים, ואז מחשבים תחזית לכל רשומה.

שלב 4: מאחדים תחזיות (Aggregation)

כאן Bagging באמת קורה:

  • ברגרסיה: ממוצע של התחזיות
  • בסיווג: ממוצע הסתברויות ואז סף החלטה (למשל 0.5), או הצבעת רוב

תוצר מעשי: עמודה Pred_bagged שמחשבת ממוצע על פני K מודלים.

שלב 5: מודדים יציבות – לא רק דיוק

ארגונים רבים נופלים בזה: מסתכלים רק על AUC/דיוק, ומתעלמים מיציבות.

מה מודדים באקסל?

  • סטיית תקן של התחזית לכל לקוח/פוליסה על פני המודלים: כמה המודל “מתנדנד”
  • פער בין מודל יחיד (ללא bagging) לבין bagging: כמה ירד הרעש

יעד ניהולי חכם: לא רק לשפר דיוק—להקטין תנודתיות בהחלטות חיתום ותביעות.

איך Bagging משפר מודלי סיכון, חיתום והונאות בביטוח

Bagging מתאים במיוחד כשיש לכם מודל עם שונות גבוהה. בביטוח זה קורה הרבה, כי הדאטה רועש, יש זנבות כבדים (תביעות ענק), ותתי-אוכלוסיות קטנות.

חיתום ותמחור: פחות “הפתעות” בפרמיה

כשמודל תמחור רגיש מדי לדאטה, מספיק שינוי קטן בהרכב הפוליסות בחודש מסוים כדי להזיז מקדמים.

Bagging נותן:

  • החלקת רעש בתחזיות הסיכון
  • שיפור עקביות בין סניפים/ערוצים
  • תמחור יציב יותר שיותר קל להסביר (וזה קריטי מול רגולציה ובקרה פנימית)

תביעות: תיעדוף טוב יותר של טיפול ידני

בניהול תביעות, לעיתים המטרה היא דירוג תיקים לפי הסתברות לחריגה/מורכבות.

Bagging יכול:

  • להפחית מקרים שבהם תיק “קופץ” בדירוג בגלל מקריות
  • לאפשר ספי תיעדוף יציבים (מי נכנס לבדיקה מעמיקה)

זיהוי הונאות: פחות False Positives, פחות חיכוך עם לקוחות

בפועל, נזק תפעולי של מודל הונאות לא יציב הוא עצום: יותר בדיקות, יותר זמן טיפול, יותר חוסר שביעות רצון.

Bagging מייצר:

  • הסתברויות יציבות יותר
  • סיכון נמוך יותר ש”טרנד רגעי” בדאטה יפעיל התרעות שווא

כן, עדיין צריך פיצ’רים טובים ותהליך חקירה. Bagging לא מחליף אותם—הוא מייצב את שכבת החיזוי.

חיבור לסדרה: מה לביטוח ולייצור מתקדם?

אותה בעיה, שני עולמות: במפעל חכם מודל תחזוקה מונעת שמתרסק בגלל שונות מייצר אזעקות שווא או פספוסים; בביטוח מודל סיכון לא יציב מייצר פרמיות לא עקביות או עודף בדיקות.

ב-2025 הרבה ארגונים בישראל בונים תהליכי AI רוחביים—בייצור, בלוגיסטיקה, ובשירות. אם אתם בארגון שיש בו גם פעילות תעשייתית וגם ביטוח/ניהול סיכונים (או פשוט תרבות של Operational Excellence), Bagging הוא דוגמה מצוינת ל:

  • שיטה פשוטה
  • השפעה תפעולית גדולה
  • יכולת הסבר גבוהה יחסית

שאלות נפוצות שמגיעות מיד אחרי שמבינים Bagging

האם Bagging תמיד משפר דיוק?

לא תמיד. Bagging משפר בעיקר כשיש שונות גבוהה. אם המודל שלכם מוטה (Bias) בגלל פיצ’רים חלשים או הנחות שגויות, Bagging לא יתקן את זה.

כמה מודלים צריך?

כלל אצבע שימושי:

  • התחילו ב-30–50 וחפשו שיפור
  • לעיתים 100–300 נותן יציבות מצוינת
  • מעבר לזה, הרווחים קטנים יחסית (תלוי בבעיה)

למה לא פשוט להשתמש ב-Random Forest?

בפועל, בהרבה מקרים כן. Random Forest הוא Bagging של עצים + אקראיות בפיצ’רים. אבל אם אתם רוצים:

  • להבין עקרון יסודי
  • להסביר לבעלי עניין
  • לבחון יציבות על דאטה קטן

…תרגיל באקסל הוא דרך מצוינת לבנות אינטואיציה.

מה הסיכון בבאגינג בביטוח?

הסיכון המרכזי הוא לא טכני אלא ניהולי: להתאהב בממוצע ולשכוח לבדוק איפה המודל נכשל.

לכן כדאי לקבוע מראש בדיקות:

  • ביצועים לפי סגמנטים (גיל, אזור, ערוץ)
  • יציבות לאורך זמן (חלונות של 3–6 חודשים)
  • ניטור Drift אחרי עלייה לאוויר

מה לעשות כבר השבוע: תהליך קצר ליישום בארגון

אם המטרה שלכם היא לייצר לידים פנימיים/חיצוניים לפרויקט AI בביטוח, הנה מסלול עבודה פרקטי:

  1. בחרו Use Case אחד: תמחור, תיעדוף תביעות או הונאות
  2. הגדירו מדד יציבות: סטיית תקן של תחזית, יציבות דירוג Top-5%, עקביות החלטות
  3. בנו POC באקסל על מדגם קטן (למשל 5,000 רשומות)
  4. השוו מודל יחיד מול Bagging: לא רק דיוק—גם תנודתיות
  5. תרגמו לתהליך עסקי: מה משתנה בפועל אצל חיתום/תביעות/חקירה

אם אתם מצליחים להראות ירידה בתנודתיות בהחלטות—even בלי “נס” במדדי דיוק—יהיה לכם קל בהרבה לקבל תקציב להטמעה מלאה.

צעד הבא

Bagging הוא אחד הרעיונות הפשוטים שמייצרים תוצאות אמינות יותר—וזה בדיוק מה שמנהלי סיכונים צריכים: פחות דרמה, יותר עקביות.

אם אתם שוקלים פרויקט בינה מלאכותית בביטוח (חיתום, תביעות, הונאות) ורוצים להתחיל “קטן אבל נכון”, אני ממליץ להתחיל בניסוי יציבות: מודל בסיס + Bagging, אפילו באקסל, ואז להרים את זה לסביבת ייצור.

איזה תהליך אצלכם סובל הכי הרבה מחוסר יציבות בהחלטות—תמחור, תביעות, או הונאות—and what would it be worth to make it predictable?