בינה מלאכותית במוסדות פיננסיים ו-FinTech•21 בדצמבר 2025•By 3L3C

SVM באקסל הופך מודל סיווג סיכון לכלי שקוף. כך בונים Hinge Loss ורגולריזציה לשימוש בביטוח ופינטק—ומתחילים AI בלי מודל שחור.

SVMאקסלביטוחניהול סיכוניםלמידת מכונהזיהוי הונאות

Featured image for SVM באקסל: מודל סיכון פרקטי לביטוח ופינטק

SVM באקסל: מודל סיכון פרקטי לביטוח ופינטק

רוב מנהלי הסיכונים שאני פוגש לא “חוששים מ־AI” — הם חוששים מ־מודל שחור שאין להם דרך להסביר לוועדת אשראי, לציות או לאקטואר הראשי. וכאן מגיע טוויסט מעניין: אחד המודלים היעילים לסיווג סיכונים, SVM (Support Vector Machine), יכול להפוך מ”קסם מתמטי” לכלי שאתה ממש מרגיש בידיים — אפילו בתוך אקסל.

בדצמבר 2025, כשארגונים פיננסיים בישראל לוחצים על דוושת האוטומציה (זיהוי הונאות, טריאז’ תביעות, דירוג סיכון, שיפור חיתום), היכולת להטמיע למידת מכונה באופן מדורג היא יתרון תחרותי. לא חייבים להתחיל מפלטפורמות ענן או MLOps. לפעמים מודל קטן, שקוף ומדיד הוא בדיוק הצעד הנכון כדי לייצר אמון פנימי ולפתוח דלת לפרויקטים גדולים יותר.

הפוסט הזה מציג דרך “פשוטה אבל לא פשטנית” להבין SVM: לא מתחילים מגיאומטריה של מרווחים והיפר־מישורים, אלא בונים אותו על מה שכבר מוכר במוסדות פיננסיים — רגרסיה לוגיסטית, פונקציית הפסד, ורגולריזציה. ואז מחברים את זה ישירות לעולם הביטוח וניהול הסיכונים.

למה דווקא SVM בעולמות ביטוח וניהול סיכונים?

SVM הוא מודל סיווג שמצטיין כשצריך להפריד בין “כן/לא” בצורה יציבה ומבוקרת. בביטוח ובפינטק, זה מופיע בכל מקום:

האם תביעה חשודה להונאה או לגיטימית?
האם מבוטח נמצא בסיכון גבוה לנטישה או לחידוש?
האם בקשת פוליסה/אשראי עוברת מסלול רגיל או “בדיקה מעמיקה”?
האם אירוע הוא “חריגה תפעולית” או “אירוע סיכון מהותי”?

מה שאני אוהב ב־SVM (בגרסה הלינארית שלו) זה שהוא לא מנסה להיות חכם מדי. הוא בונה כלל החלטה ברור, עם שליטה טובה על מורכבות. בניגוד למודלים שמנסים “להתאים הכול”, SVM מתמקד באזור הקריטי באמת: גבול ההחלטה.

למה אקסל כאן הוא לא גימיק

אקסל הוא לא סביבת פרודקשן למודלים. ברור. אבל הוא כלי מצוין ל־Proof of Understanding ול־Proof of Value:

אפשר לראות כל חישוב: ציון, הפסד, תרומת כל תצפית.
אפשר להסביר את הלוגיקה למי שלא כותב קוד.
אפשר לחבר מהר לדאטה עסקי (CSV, יצוא ממערכות ליבה, דוחות BI).

ובארגונים שמרניים, “מודל ראשון באקסל” לפעמים עובר מהר יותר את מחסומי האמון מאשר מחברת פייתון נוצצת.

להבין SVM מהכיוון הנכון: מתחילים ממה שכבר יודעים

SVM לינארי הוא, בפועל, מודל לינארי + פונקציית הפסד אחרת + רגולריזציה. זה הכול. ברגע שמבינים את זה, הוא מפסיק להרגיש כמו “משהו אחר”.

ציון החלטה לינארי: אותו בסיס כמו רגרסיה לוגיסטית

נניח שיש לנו פיצ’ר אחד (כן, פיצ’ר אחד — וזה דווקא עוזר להבין):

x = מדד סיכון פשוט, למשל יחס תביעות/פרמיה או “ציון התנהגות”
f(x) = a·x + b = ציון לינארי

במקום תוויות 0/1, משתמשים בהרבה ניסוחים של SVM בתוויות -1/+1:

y = +1 (למשל: “סיכון גבוה”)
y = -1 (למשל: “סיכון נמוך”)

ואז מסתכלים על הביטוי:

y · f(x)

זו אחת השורות הכי חשובות להבנה:

אם y·f(x) > 0 — התצפית סווגה נכון.
אם y·f(x) גדול — הסיווג “בטוח”.
אם y·f(x) < 0 — יש טעות סיווג.

במילים של ניהול סיכונים: זה לא רק “נכון/לא נכון”, אלא גם כמה רחוק אנחנו מהקו שמפריד.

מה משתנה: פונקציית ההפסד (Log-Loss מול Hinge Loss)

ההבדל המרכזי בין רגרסיה לוגיסטית ל־SVM הוא איך מענישים טעויות ו”כמעט טעויות”.

Log-Loss (לוגיסטית): מענישה גם כשכבר הצלחת

בלוגיסטית, גם אם תצפית סווגה נכון, עדיין יש “קנס קטן” עד שאתה ממש בטוח. זה נותן מודל חלק ונוח הסתברותית, אבל הוא פחות “מפסיק לדאוג” כשהכול כבר בסדר.

Hinge Loss (SVM): מתעלמת מנקודות רחוקות מספיק

ב־SVM משתמשים לרוב ב־Hinge Loss, שמיישם כלל חד:

אם התצפית לא רק נכונה אלא גם רחוקה מספיק מגבול ההחלטה — אין קנס.
אם היא קרובה מדי או בצד הלא נכון — יש קנס.

זו גישה שמתאימה מאוד לתהליכים תפעוליים בביטוח:

אם התביעה “ברור לגיטימית” — תן לה לעבור בלי להתעסק. תשקיע את האנרגיה במקרים שעל הגבול.

למה לא להשתמש ב־Squared Loss כמו ברגרסיה רגילה?

כי הפסד ריבועי מעניש גם נקודות שכבר “מצוינות”. התוצאה: המודל מנסה להתאים מספרים, לא להפריד מחלקות. זה בדיוק מה שלא רוצים בסיווג סיכון.

כשאפשר להפריד את הדאטה — עדיין יש בעיה: אינסוף פתרונות

במקרים מסוימים (נניח, מדגם קטן של תביעות עם פיצ’ר אחד ברור), הדאטה נפרד לחלוטין: כל ה”טובים” בצד אחד וכל ה”בעייתיים” בצד השני.

נשמע נהדר — אבל מתמטית זה אומר שיש המון קווי הפרדה אפשריים עם אפס טעויות. אז מי מהם נבחר?

כאן נכנסת רגולריזציה.

רגולריזציה: לבחור פתרון אחד, פשוט ויציב

הוספת רכיב שמעניש מקדמים גדולים (לרוב L2) עושה שני דברים שימושיים מאוד בביטוח:

מקטינה רגישות לרעש (יציבות מול שינויי מדגם)
מעדיפה פתרון “שמרני” — מקדמים קטנים יותר

בפועל, זה מחבר אותנו לפרקטיקה מוכרת: גם במודלי חיתום קלאסיים לא רוצים “להתלהב” ממדגם קטן.

הפרמטר C: איך לשלוט בטרייד־אוף בין טעויות לפשטות

ב־SVM נהוג לכתוב את הפונקציה עם פרמטר C שמודד “כמה אכפת לנו” מהטעויות/הפרות מרווח לעומת פשטות המודל.

C גבוה: מענישים טעויות חזק → המודל יתאמץ לסווג נכון גם אם זה ייצור מקדמים גדולים (סיכון לאוברפיט).
C נמוך: נותנים יותר מקום לטעויות → המודל פשוט יותר ויציב יותר (לפעמים תחת־התאמה).

במונחי governance:

C הוא כפתור המדיניות שמגדיר האם אנחנו מעדיפים “לתפוס כל הונאה” במחיר של יותר false positives, או להקטין חיכוך תפעולי במחיר של פספוסים.

איך בונים SVM באקסל בפועל (ברמת תהליך)

לא צריך להפוך את הפוסט הזה למדריך נוסחאות, אבל הנה שלד עבודה שאפשר לבצע באקסל עם עמודות ברורות. זה גם תרגיל מצוין ליישור קו בין דאטה, עסקי וסיכונים.

שלב 1: בונים טבלה מינימלית

עמודות מומלצות:

x: פיצ’ר (אפשר להתחיל מאחד)
y: תווית -1/+1
score = a*x + b
margin = y*score
hinge = MAX(0, 1 - margin)

שלב 2: מגדירים פונקציית מטרה

פונקציה טיפוסית:

רכיב הפסד: ממוצע/סכום hinge
רכיב רגולריזציה: 0.5 * a^2 (ובמימד גבוה: 0.5 * ||w||^2)
מאחדים עם C

שלב 3: “מאמנים” את המודל

אפשר בשתי דרכים:

Solver של אקסל: נוח להדגמה מהירה.
Gradient Descent באיטרציות: יותר לימודי, רואים את התכנסות המקדמים.

היתרון הגדול של גישת האיטרציות: אפשר להראות לצוות איך שינויי a ו־b משנים את המרווח, ולזהות מיד אם הדאטה בעייתי.

שלב 4: מפרשים מי באמת משפיע — רעיון “וקטורי התמיכה”

ב־SVM, לא כל התצפיות “מעניינות” את המודל. מי שמגדיר את הגבול בפועל הן התצפיות שעל הגבול או בתוך ההפרה — Support Vectors.

בביטוח, זה תרגום נהדר לשפה עסקית:

לא צריך להתווכח על 10,000 תביעות “ברורות”.
צריך להבין לעומק את ה־200 “הגבוליות” — הן אלו שמעצבות את המדיניות.

דוגמה עסקית קצרה: טריאז’ תביעות הונאה עם SVM לינארי

נניח תהליך תביעות רכב:

רוצים לסווג תביעות ל־2 מסלולים: בדיקה רגילה מול בדיקה מורחבת.
פיצ’ר ראשון פשוט: x = מספר אירועים קודמים ב-24 חודשים (או יחס חריגות במסמכים).

מה SVM נותן כאן?

כלל החלטה שקוף: a*x + b
התמקדות במקרים הקריטיים (הקרובים לגבול)
יכולת להגדיר מדיניות דרך C: יותר תפיסה של הונאות מול פחות עומס חקירה

ואם רוצים להתקדם מעבר לפיצ’ר אחד:

מוסיפים פיצ’רים מספריים (סכום תביעה, זמן ממועד פוליסה, תדירות מוסכים)
מבצעים סטנדרטיזציה (חשוב ב־SVM)
שומרים על אותו עיקרון: Loss + Regularization

שאלות שעולות כמעט תמיד (ועוזר לענות עליהן מוקדם)

האם SVM נותן הסתברות כמו לוגיסטית?

בגרסה הבסיסית, SVM נותן ציון החלטה. אפשר לכייל להסתברויות (למשל כיול פלאַט/איזוטוני) אבל לא חייבים. בהרבה תהליכים תפעוליים, ציון + סף החלטה מספיק.

מתי SVM פחות מתאים?

כשהדאטה ענק מאוד וצריך אימון מהיר במיוחד (אז לעיתים מודלים לינאריים אחרים עם SGD יהיו יעילים יותר)
כשיש צורך מובנה בהסתברויות מוסברות רגולטורית (לוגיסטית לפעמים “נקייה” יותר)
כשלא מטפלים נכון בסקיילינג של פיצ’רים — זה מקור נפוץ לתוצאות לא יציבות

ומה עם Kernels?

Kernels מאפשרים אי־ליניאריות בלי לשנות את המסגרת. אבל בארגון פיננסי, אני בעד להתחיל מ־לינארי ושקוף, ורק אז להוסיף מורכבות כשיש הצדקה עסקית ומסגרת בקרה.

מה לקחת מכאן לצעד הבא בארגון

SVM באקסל הוא לא יעד. הוא גשר: דרך מצוינת להכניס למידת מכונה לתרבות של ביטוח וניהול סיכונים בלי לייצר אנטגוניזם.

שלושה צעדים פרקטיים שעובדים טוב:

בחרו בעיה בינארית אחת עם אימפקט מדיד (למשל, טריאז’ תביעות או סיווג לקוחות בסיכון).
התחילו ב־SVM לינארי עם פיצ’ר/ים בודדים והדגימו את רעיון margin ו־hinge loss לצוות.
הגדירו מראש מדדי הצלחה עסקיים: ירידה ב־false positives, קיצור זמני טיפול, שיעור תפיסת הונאות, או שיפור loss ratio בסגמנט.

הסדרה שלנו “בינה מלאכותית במוסדות פיננסיים ו-FinTech” חוזרת שוב ושוב לאותה נקודה: AI שמנצח בארגונים הוא לא זה שהכי מרשים — אלא זה שאפשר להסביר, למדוד, ולשפר לאורך זמן.

אם היית צריך להטמיע מודל סיווג סיכון אחד קטן כבר ברבעון הקרוב — היית מעדיף כלי שמייצר דיוק, או כלי שמייצר אמון בדרך לדיוק?