בדל הטיה והגינות של מערכות מבוססות בינה מלאכותית בתוך פשיעה פיננסית - Unite.AI
צור קשר

מנהיגי מחשבה

הטיה והגינות של מערכות מבוססות בינה מלאכותית בתוך פשיעה פיננסית

mm

יצא לאור

 on

כשזה מגיע למלחמה בפשיעה הפיננסית, קיימים אתגרים שחורגים מהטווח של עצירת רמאים או שחקנים רעים אחרים.

לחלק מהטכנולוגיות החדשות והמתקדמות שמושקות יש לעתים קרובות בעיות ספציפיות משלהן שיש לקחת בחשבון במהלך שלבי האימוץ כדי להילחם בהצלחה ברמאים ללא השלכות רגולטוריות. בזיהוי הונאה, הוגנות מודל והטיית נתונים יכולים להתרחש כאשר למערכת יש משקל רב יותר או חסר ייצוג של קבוצות או קטגוריות מסוימות של נתונים. בתיאוריה, מודל חיזוי יכול לקשר בטעות שמות משפחה מתרבויות אחרות לחשבונות הונאה, או להפחית בטעות את הסיכון בתוך פלחי אוכלוסייה עבור סוג מסוים של פעילויות פיננסיות.

מערכות בינה מלאכותית מוטות יכולות לייצג איום רציני כאשר המוניטין עלולים להיות מושפעים ומתרחשות כאשר הנתונים הזמינים אינם מייצגים את האוכלוסייה או את תופעת החקר. נתונים אלו אינם כוללים משתנים אשר לוכדים כראוי את התופעה שאנו רוצים לחזות. או לחילופין, הנתונים יכולים לכלול תוכן שהופק על ידי בני אדם שעשוי להכיל הטיה כלפי קבוצות של אנשים, שהורשתו על ידי התנסויות תרבותיות ואישיות, מה שמוביל לעיוותים בעת קבלת החלטות. למרות שבהתחלה נתונים עשויים להיראות אובייקטיביים, הם עדיין נאספים ומנתחים על ידי בני אדם, ולכן יכולים להיות מוטים.

אמנם אין כדור כסף בכל הנוגע לתיקון הסכנות של אפליה ואי-הוגנות במערכות בינה מלאכותית או תיקונים קבועים לבעיית ההגינות וההטיה בתכנון מודל למידת מכונה ושימוש, אך יש לקחת בחשבון סוגיות אלו הן מבחינת החברה והן סיבות עסקיות.

עושה את הדבר הנכון ב-AI

טיפול בהטיה במערכות מבוססות בינה מלאכותית הוא לא רק הדבר הנכון, אלא הדבר החכם לעסקים - וההימור עבור מנהיגים עסקיים הוא גבוה. מערכות בינה מלאכותית מוטות יכולות להוביל מוסדות פיננסיים לדרך הלא נכונה על ידי הקצאת הזדמנויות, משאבים, מידע או איכות שירות בצורה לא הוגנת. יש להם אפילו פוטנציאל לפגוע בחירויות האזרח, להוות פגיעה בביטחונם של אנשים, או להשפיע על רווחתו של אדם אם נתפס כמזלזל או פוגעני.

חשוב לארגונים להבין את הכוח והסיכונים של הטיית בינה מלאכותית. למרות שלעתים קרובות לא ידועה על ידי המוסד, מערכת מבוססת בינה מלאכותית עשויה להשתמש במודלים או נתונים מזיקים החושפים הטיה גזעית או מגדרית להחלטת הלוואות. מידע כגון שמות ומין יכול להיות פרוקסי לסיווג וזיהוי מועמדים בדרכים לא חוקיות. גם אם ההטיה היא לא מכוונת, היא עדיין מסכנת את הארגון על ידי אי עמידה בדרישות הרגולטוריות ועלולה להוביל לכך שקבוצות מסוימות של אנשים ימנעו באופן לא הוגן הלוואות או קווי אשראי.

נכון לעכשיו, לארגונים אין את החלקים כדי להפחית בהצלחה הטיה במערכות AI. עם זאת, כאשר בינה מלאכותית נפרסת יותר ויותר בעסקים כדי לקבל החלטות, חיוני שארגונים ישאפו לצמצם הטיה, לא רק מסיבות מוסריות, אלא כדי לעמוד בדרישות הרגולטוריות ולבנות הכנסות.

תרבות ויישום "מודע להוגנות".

לפתרונות המתמקדים בתכנון ויישום מודעים להוגנות יהיו התוצאות המועילות ביותר. לספקים צריכה להיות תרבות אנליטית המחשיבה רכישת נתונים, טיפול וניהול אחראיים כמרכיבים הכרחיים של הגינות אלגוריתמית, מכיוון שאם התוצאות של פרויקט AI יופקו על ידי מערכי נתונים מוטים, נפגעים או מוטים, הצדדים המושפעים לא יהיו מוגנים כראוי מפני פגיעה מפלה.

אלה הם המרכיבים של הוגנות נתונים שצוותי מדעי הנתונים חייבים לזכור:

  • ייצוגיות:בהתאם להקשר, תת-ייצוג או ייצוג יתר של קבוצות מוחלשות או מוגנות על פי חוק במדגם הנתונים עלולים להוביל לקיפוח שיטתי של הצדדים הפגיעים בתוצאות המודל המאומן. כדי להימנע מסוגים כאלה של הטיית דגימה, מומחיות תחום תהיה חיונית כדי להעריך את ההתאמה בין הנתונים שנאספו או נרכשים לבין האוכלוסייה הבסיסית שיש לדגמן. חברי הצוות הטכני צריכים להציע אמצעי תיקון כדי לתקן פגמים ייצוגיים בדגימה.
  • התאמה למטרה וספיקות: חשוב להבין אם הנתונים שנאספו מספיקים למטרה המיועדת של הפרויקט. מערכי נתונים לא מספיקים עשויים שלא לשקף בצורה הוגנת את התכונות שצריך לשקול כדי לייצר תוצאה מוצדקת שתואמת את המטרה הרצויה של מערכת הבינה המלאכותית. בהתאם לכך, חברי צוות הפרויקט בעלי כישורים טכניים ומדיניות צריכים לשתף פעולה כדי לקבוע אם כמות הנתונים מספיקה ומתאימה למטרה.
  • שלמות המקור ודיוק המדידה:הפחתת הטיות אפקטיבית מתחילה ממש בתחילת תהליכי חילוץ ואיסוף הנתונים. גם המקורות וגם כלי המדידה עשויים להכניס גורמים מפלים למערך נתונים. כדי להבטיח אי-פגיעה מפלה, מדגם הנתונים חייב להיות בעל שלמות מקור מיטבית. זה כרוך באבטחה או אישור שתהליכי איסוף הנתונים כללו מקורות מדידה מתאימים, אמינים וחסרי פניות ושיטות איסוף חזקות.
  • עדכניות ועדכניות: אם מערכי הנתונים כוללים נתונים מיושנים, אז שינויים בהפצת הנתונים הבסיסית עשויים להשפיע לרעה על יכולת ההכללה של המודל המאומן. בתנאי שהסחפות ההפצה הללו משקפות שינוי במערכות יחסים חברתיות או דינמיקה קבוצתית, אובדן דיוק זה לגבי מאפיינים בפועל של האוכלוסייה הבסיסית עלול להכניס הטיה למערכת הבינה המלאכותית. במניעת תוצאות מפלות, יש לבחון את העדכניות והעדכניות של כל הרכיבים במערך הנתונים.
  • רלוונטיות, התאמה וידע בתחום: ההבנה והשימוש במקורות וסוגי הנתונים המתאימים ביותר הם חיוניים לבניית מערכת AI חזקה וחסרת פניות. ידע מוצק בתחום של התפלגות האוכלוסיה הבסיסית, ושל מטרת הניבוי של הפרויקט, הוא אינסטרומנטלי לבחירת תשומות מדידה רלוונטיות באופן מיטבי התורמים לרזולוציה הסבירה של הפתרון המוגדר. מומחי תחום צריכים לשתף פעולה באופן הדוק עם צוותי מדעי הנתונים כדי לסייע בקביעת קטגוריות ומקורות מדידה מתאימים בצורה מיטבית.

בעוד שמערכות מבוססות בינה מלאכותית מסייעות בתהליכי אוטומציה של קבלת החלטות ומספקות חיסכון בעלויות, מוסדות פיננסיים השוקלים בינה מלאכותית כפתרון חייבים להיות ערניים כדי להבטיח שלא יתרחשו החלטות מוטות. מובילי תאימות צריכים להיות בקשר עם צוות מדעי הנתונים שלהם כדי לאשר שיכולות הבינה המלאכותית הן אחראיות, יעילות וללא הטיה. קיום אסטרטגיה שדוגלת בבינה מלאכותית אחראית היא הדבר הנכון לעשות, והיא עשויה גם לספק נתיב לעמידה בתקנות בינה מלאכותית עתידיות.

דני בוטוויניק הוא מדען הנתונים הראשי ב NICE אקטמיזציה, מתן מנהיגות טכנית ומקצועית. דני הוא מומחה לבינה מלאכותית ומדעי נתונים, בעל מספר מאמרים ומאמרים מדעיים. בתפקידו הנוכחי, הוא מנהל קבוצה גדולה של מדעני נתונים, ותורם לצמיחת החדשנות ולקניין הרוחני של החברה, עם למעלה מ-15 שנות ניסיון במחקר, פיתוח וניהול במדעי נתונים ופיתוח תוכנה.