בריאות

מרוץ גילוי ורידי רשתית, הרחבת טווח להטיית גזע בינה מלאכותית

יצא לאור

לפני 3 שנים

ספטמבר 30, 2021

בהשראת הגילויים האחרונים שהדמיית AI רפואית יכול לחשוף את הגזע, קונסורציום מחקר בארה"ב ובבריטניה ערך מחקר האם דפוסי ורידי הרשתית מעידים על גזע, והגיע למסקנה שזה אכן המקרה, כאשר בינה מלאכותית מסוגלת לחזות גזע המדווח על ידי הורים בתינוקות מתמונות רשתית - תמונות ש לא יחשפו זהות גזעית לרופא אנושי שחוקר אותם, ואשר בעבר חשבו שאין בהם פוטנציאל לחשיפה גזעית.

הקבוצה הביעה דאגה כי וקטור נוסף זה של ריבוד גזעי בהדמיה רפואית פותח את האפשרות להטיה מוגברת בשימוש במערכות בינה מלאכותית בשירותי הבריאות.

תמונות רשתית מתוך נושא שחור ולבן. למעלה, תמונת פונדוס רשתית בצבע מלא מכל גזע כבר כוללת מאפיינים המבדילים בין גזע הקשורים לנטיות הצבע. להלן, מפות כלי הרשתית הנגזרות מהתמונות הללו, שאמורות "לפלס" את סימני העוגן הגזעיים הללו, אכן מכילות מאפיינים מזהים גזע, על פי הדו"ח החדש. מקור: https://arxiv.org/ftp/arxiv/papers/2109/2109.13845.pdf

המחברים מציינים עוד את האפשרות ש U-Net, מסגרת למידת המכונה שבאה להגדיר מגזר זה של שירותי בריאות מבוססי בינה מלאכותית, ואשר הוכשרה על נושאים לבנים בעיקר*, עשויה להיות השפעה על התופעה הנצפית הזו. עם זאת, המחברים טוענים שכן "עדיין לא מסוגל להסביר את הממצאים הללו במלואם על סמך השערת U-Net בלבד".

הערה על הממצאים במקורבים לפרויקט מאגר GitHub, כותבים המחברים:

"AI יכול לזהות גזע ממכשירי RVM בגווני אפור [מפות כלי הרשתית] שלא חשבו שמכילים מידע גזעי. שני הסברים פוטנציאליים לממצאים אלה הם ש: כלי הרשתית שונים מבחינה פיזיולוגית בין תינוקות שחורים ולבנים או מקטעי ה-U-Net מחלקים את כלי הדם ברשתית באופן שונה עבור פיגמנטציות שונות של קרקעית העין.

"...בכל מקרה, ההשלכות נשארות זהות: לאלגוריתמי בינה מלאכותית יש פוטנציאל להפגין הטיה גזעית בפועל, גם כאשר נראה כי ניסיונות ראשוניים להסיר מידע כזה מהתמונות הבסיסיות מוצלחות."

השמיים מאמר מכונה לא עיוור צבעים: בינה מלאכותית מנבאת זהות גזעית מפילוחים של כלי רשתית בשחור-לבן, והוא שיתוף פעולה שווה בין רופאים וחוקרים מחמישה מוסדות ומחלקות מחקר בארה"ב, ואחת בבריטניה.

רופאים המשתתפים בקונסורציום המחקר כוללים קרוואן פול צ'אן, MD, MSc, FACS, מוסמכת מועצת המנהלים ברפואת עיניים, ועמית מהמכללה האמריקאית לכירורגים; מייקל פ. צ'יאנג, MD, מנהל המכון הלאומי לעיניים במכונים הלאומיים לבריאות בבת'סדה, מרילנד; ו ג'יי פיטר קמפבל MD, MPH, פרופסור חבר לרפואת עיניים בבית הספר לרפואה באוניברסיטת Oregon Health & Science בפורטלנד.

העיניים צריכות זה

המאמר מציין את הפוטנציאל שהוכח בעבר להטיה שמקורה באדם להתפשט במערכות רפואיות בינה מלאכותית, לא פחות ב חקר העיניים*. תמונות פונדוס רשתית (RFIs, ראה השוואת תמונות לעיל), המשמשות להערכת מחלות עיניים, הן תמונות בצבע מלא המכילות מספיק מידע פיגמנטציה כדי לזהות גזע.

מפות כלי הדם של הרשתית בגווני אפור (RVMs) מסלקות את רוב המידע הזה על מנת לחלץ את הדפוס הבסיסי של נימים שעלולים להגדיר מצבי מחלה רבים. מאז ומתמיד ההנחה, ברמת הזיקוק הזו, לא נותרו מאפיינים גזעיים בדימויים רפואיים רדוקטיביים כאלה.

המחברים בדקו הנחה זו עם שימוש במערך נתונים של RFIs (תמונות רשתית בצבע מלא) שהתקבלו מתינוקות שנבדקו למחלה שעלולה לסנוור. ההקרנה לתמונות כאלה, מציינים המחברים, מופיעה יותר ויותר מחוץ להתייעצויות אישיות, ברפואה טלפונית והקשרי אבחון מרחוק אחרים, והיא הופכת יותר ויותר לנושא של ניתוח למידת מכונה.

המחקר החדש בוחן האם סוגים שונים של גרסאות רדוקציוניות של תמונות בצבע מלא המזהות גזע שומרות מידע גזעי, כפי שדווחו על ידי הורי התינוקות, ומצא שאפילו הזיקוקים ההרסניים ביותר של RFIs (בסף, שלד ושלד) בינארית) מאפשרים רמה מסוימת של זיהוי גזעי.

נתונים ומתודולוגיה

נתונים מ-245 תינוקות, שנאספו בין ינואר 2012 ליולי 2020 כחלק ממחקר עוקבה i-ROP רב-מרכזי, חולקו למערכי נתונים של אימון, תיקוף ומבחנים על בסיס 50/20/30, בהתאמה, כשהחלוקה הטבעית של הגזעים נשמרה. ככל שניתן נתוני המקור.

RFIs צבעוניים הצטמצמו לשלושת סגנונות ההדמיה הרדוקטיביים שהוזכרו לעיל, כך שמבחינה טכנית היה צריך להסיר סמנים גזעיים 'ברורים' מהנתונים.

רשתות עצביות קונבולוציוניות מרובות (CNN) אומנו להשיג סיווג בינארי ('שחור'/'לבן', בהתבסס על גזע מדווח מההורים) באמצעות PyTorch. ה-CNN הריצו את הנתונים על פני כל הגרסאות של התמונות, מ-RFI ועד לגרסאות משולבות, תוך שימוש בהיפוך והסיבובים האקראיים הרגילים, כאשר תמונות נגזרות בעלות רזולוציה של 224×244 פיקסלים.

המודלים אומנו עם ירידה בשיפוע סטוכסטי למשך עד עשר תקופות עם קצב למידה קבוע של 0.001, ועצירה מוקדמת יושמה והאימון הופסק כאשר התכנסות נתפסת זוהתה לאחר חמש תקופות (כלומר, המודל לא הולך להיות מדויק יותר עם המשך הַדְרָכָה).

מאחר שהיה חוסר איזון טבעי דמוגרפי בין נבדקים לבנים ושחורים, הוחל פיצוי כדי להבטיח שמקורות מיעוטים לא יופחתו באופן שיטתי כחריגים, והתוצאות הוצלבו כדי לוודא שלא התרחשה דליפת נתונים לאורך הניסויים.

דוגמאות של מפות רשתית מהמחקר ברמות שונות של סבילות לסף.

תוצאות

RVMs, אשר מחלצים ורידים ונימים מתמונות RFI בצבע מלא, לא אמורות להיות תיאורטית ניתנות להבחין בגזע על ידי CNN, על פי המחברים. עם זאת, התוצאות הראו שמספר גבוה יותר של עורקים ראשיים מפולחים על ידי U-Net עבור עיניים לבנות מאשר עבור עיניים שחורות.

בהערות הסיום, החוקרים מציינים 'מצאנו שבינה מלאכותית הצליחה לחזות בקלות את הגזע של תינוקות מפילוח כלי רשתית שאינם מכילים מידע גלוי לגבי פיגמנטציה', וזה "אפילו תמונות שנראו חסרות מידע בעין בלתי מזוינת שמרו מידע חיזוי על הגזע של התינוק המקורי". עוד מציעים החוקרים את האפשרות שכלי הרשתית של תינוקות שחורים לעומת לבנים שונים "בדרך כלשהי שבינה מלאכותית יכולה להעריך, אבל בני אדם לא יכולים".

הטיה קודמת?

המחברים גם מציעים שהאפליה עשויה להיות פונקציה של הנתונים השולטים בלבן שעליהם הוכשרה U-Net במקור. למרות שהם מתארים זאת כ'תיאוריה המובילה' שלהם, הם גם מודים שיכולות חיישני לכידה עשויות להוות גורם לתופעות, אם יתברר שההטיה שהתגלתה היא תולדה של ההיבטים הטכניים של שיטות הדמיה ברשתית, או של הטיית נתונים ב-U-Net שמנציח את עצמו לאורך השנים. בהתייחס לאפשרויות הללו, העיתון מודה:

"עם זאת, ה-U-Net הוכשרה על RFIs שהומרו לראשונה לתמונות בגווני אפור ועברו התאמת ניגודיות - במיוחד, השוואת היסטוגרמה מוגבלת ניגודיות (CLAHE) - ולכן מעולם לא הוכשרה בפועל על RFIs צבעוניים. לפיכך, איננו מסוגלים עדיין להסביר את הממצאים הללו במלואם על סמך השערת U-Net בלבד.'

עם זאת, המחברים טוענים שהסיבה פחות מדאיגה מההשפעה, וקובעות שהיכולת של מודלים בינה מלאכותית להבחין בגזע כרוכה באפשרות "סיכון להטיה באלגוריתמים של AI רפואי המשתמשים בהם כקלט".

המחברים מצביעים על האופי בעל הניגודיות הגבוהה של הגזעים שנחקרו, ומניחים כי קבוצות גזעיות 'בינוניות' עשויות להיות קשות יותר לזיהוי באמצעים דומים, וכי זהו היבט שהם מתכוונים ללמוד בעבודות מתמשכות וקשורות.

* כל הקישורים התומכים שסופקו על ידי העיתון הכלולים במאמר זה הומרו מקישורי PaperPile עם גישה מוגבלת לגרסאות מקוונות זמינות לציבור, במידת האפשר.

Medorion מרחיבה את פלטפורמת רשומות התנהגות אלקטרוניות המופעלות על ידי בינה מלאכותית

לא לפספס

נתונים סינתטיים אינם מגנים באופן אמין על הפרטיות, טוענים החוקרים

מרטין אנדרסון

כותב על למידת מכונה, בינה מלאכותית וביג דאטה.
אתר אישי: martinanderson.ai
איש קשר: [מוגן בדוא"ל]
טוויטר: @manders_ai

Unite.AI

מרוץ גילוי ורידי רשתית, הרחבת טווח להטיית גזע בינה מלאכותית

בריאות