בדל חוקרים מפתחים שיטה חדשה לשליטה ביצירת תמונות בינה מלאכותית - Unite.AI
צור קשר

בינה מלאכותית

חוקרים מפתחים שיטה חדשה לשליטה ביצירת תמונות בינה מלאכותית

מְעוּדכָּן on
תמונה: אוניברסיטת NC State

חוקרים מאוניברסיטת צפון קרוליינה סטייט פיתחו שיטה חדשה לשליטה ביצירת תמונות של בינה מלאכותית (AI), שניתן להשתמש בה בתחומים כמו כלי רכב אוטונומיים.

יצירת תמונה מותנית וטכניקות אחרות

יצירת תמונה מותנית היא משימת בינה מלאכותית הכוללת מערכות בינה מלאכותית יוצרות תמונות המבוססות על סט ספציפי של תנאים, שהמשתמש יכול לבקש. טכניקות חדשות יותר לקחו זאת רחוק יותר ומשלבות תנאים לפריסת תמונה, המאפשרת למשתמשים לציין את סוגי האובייקטים שהם רוצים שיופיעו בנקודות ספציפיות על המסך.

השיטה המתקדמת החדשה שפותחה על ידי החוקרים באוניברסיטה מתבססת על כל הטכניקות הללו, והיא מאפשרת למשתמשים לקבל יותר שליטה על התמונות תוך שמירה על מאפיינים מסוימים על פני סדרת תמונות.

טיאנפו וו הוא מחבר שותף של עבודת מחקר ועוזר פרופסור להנדסת מחשבים במדינת NC. 

"הגישה שלנו ניתנת להגדרה מחדש", אומר וו. "כמו גישות קודמות, שלנו מאפשרת למשתמשים לגרום למערכת ליצור תמונה על סמך סט ספציפי של תנאים. אבל שלנו גם מאפשר לך לשמור על התמונה ולהוסיף לה. לדוגמה, משתמשים יכולים לבקש מה-AI ליצור סצנת הר. לאחר מכן, המשתמשים יוכלו לבקש מהמערכת להוסיף גולשים לסצנה הזו."

מניפולציה של אלמנטים

עם השיטה החדשה, משתמשים יכולים גם לאפשר ל-AI לתפעל אלמנטים כך שהם יהיו זהים לזיהוי תוך כדי תנועה או שינוי בדרך כלשהי. דוגמה אחת כזו תהיה ה-AI היוצר סדרת תמונות שבהן גולשים פונים לכיוון הצופה תוך כדי תנועה על פני נוף.

"יישום אחד עבור זה יהיה לעזור לרובוטים אוטונומיים 'לדמיין' איך התוצאה הסופית עשויה להיראות לפני שהם מתחילים במשימה נתונה", אומר וו. "אתה יכול גם להשתמש במערכת כדי ליצור תמונות לאימון בינה מלאכותית. אז, במקום להרכיב תמונות ממקורות חיצוניים, אתה יכול להשתמש במערכת הזו כדי ליצור תמונות לאימון מערכות AI אחרות."

הגישה החדשה נבחנה עם מערך הנתונים של COCO-Stuff ומערך הנתונים של הגנום החזותי, ובהתבסס על הסטנדרטים לאיכות תמונה, היא עולה על הטכניקות העדכניות הקודמות. 

"הצעד הבא שלנו הוא לראות אם נוכל להרחיב את העבודה הזו לווידיאו ותמונות תלת מימד", אומר וו.

על מנת להכשיר את הגישה החדשה, החוקרים נאלצו להסתמך על תחנת עבודה של 4-GPU בהינתן כוח החישוב הרב הנדרש. למרות זאת, פריסת המערכת עדיין פחות יקרה מבחינה חישובית. 

"גילינו ש-GPU אחד נותן לך מהירות כמעט בזמן אמת", אומר Wu.

"בנוסף למאמר שלנו, הפכנו את קוד המקור שלנו לגישה זו לזמין ב-GitHub. עם זאת, אנחנו תמיד פתוחים לשתף פעולה עם שותפים בתעשייה."

אלכס מקפרלנד הוא עיתונאי וסופר בינה מלאכותית הבוחן את ההתפתחויות האחרונות בתחום הבינה המלאכותית. הוא שיתף פעולה עם סטארט-אפים ופרסומים רבים של AI ברחבי העולם.