צור קשר

מפתחי משחקים מחפשים בינה מלאכותית קולית להזדמנויות יצירתיות חדשות

בינה מלאכותית

מפתחי משחקים מחפשים בינה מלאכותית קולית להזדמנויות יצירתיות חדשות

mm

טכנולוגיית סינתזת קול, ובמיוחד סינתזת דיבור, הפכה למתוחכמת הרבה יותר בשנים האחרונות. בעוד שטכנולוגיית טקסט לדיבור קיימת כבר עשרות שנים, הטכנולוגיה הפכה להרבה יותר טבעית. אלגוריתמים חדישים יכולים לקחת רק כמה שעות של אודיו ולסנתז דגימות אודיו מציאותיות ביותר. ככל שהטכנולוגיה מתקדמת, נפתחים יישומים נוספים, כולל אפשרויות במדיה יצירתית. לאחרונה,  כפי שדווח על ידי VentureBeatחברות משחקי וידאו החלו לחקור את השימוש ביצירת קול באמצעות בינה מלאכותית כדי לייצר דיאלוגים עבור משחקי וידאו.

חברה אחת, משחקי לוויתן, החלה ליישם בינה מלאכותית קולית בתוך משחקים שהיא מפתחת כעת. וויית' רידג'ווי, הבעלים של Leviathan Games, הסביר כי בינה מלאכותית קולית יכולה לשנות את עיצוב המשחקים בדרכים דרמטיות. רידג'ווי הסביר כי השימוש בבינה מלאכותית קולית בעיצוב משחקים הוא מגמה מתפתחת, והשווה זאת לאופן שבו תוכנות אנימציה תלת-ממדיות השתנו במהלך העשור האחרון, כאשר חברות כמו פיקסאר יוצרות תוכנה קניינית שנועדה להקל על אנימציה ומידול.

שיטות מסורתיות ליצירת דיבור פועלות על ידי צירוף קבצי קול מוקלטים מראש תוך כדי תנועה, תוך חיבור משפטים ממילים וביטויים קיימים. שיטה זו של יצירת דיבור דורשת הקלטה של ​​מאות שעות של דיאלוגים ותיוג ידני של קטעי קול. זה גם נשמע קצת לא טבעי מכיוון שהטיה והדגשה נוטים להשתנות בין מילים. לשם השוואה, בינה מלאכותית קולית מתקדמת נשמעת טבעית הרבה יותר ופועלת בצורה שונה.

בינה מלאכותית קולית מבוססת על רשתות עצביות עמוקות. WaveNet הייתה אחת הבינה המלאכותית הראשונות שיכלה לייצר דגימות אודיו משכנעות וטבעיות. מכיוון שדגימות הקול נוצרות מאפס, אין צורך להקליט מראש מאות שעות של דיאלוג, כל עוד נתוני אימון מספיקים זמינים. מודלים של GANs ו-LSTM ממוטבים יכולים לייצר אודיו לאחר אימון על כמה שעות בלבד של אודיו מתויג. התוצאות יכולות להיות משכנעות במיוחד, כמו בניסוי ה-Duplex של גוגל. התקשרה למספרה כדי לקבוע תור.

ככל שטכנולוגיות אלו הופכות לחזקות יותר, סטנדרטיות יותר ונגישות בקלות דרך מחשוב ענן, סביר להניח שיותר מפתחי משחקים יפנו לבינה מלאכותית קולית כדי להפחית את זמן הייצור והעלויות. חברות מסוימות כבר יוצרות מודלים שניתן להשתמש בהם באופן פוטנציאלי על ידי מפתחי משחקים. אולפני העתק מתמחה בטכנולוגיית קול מבוססת בינה מלאכותית, וניתן לשמוע כמה דגימות אודיו שנוצרו על ידי הטכנולוגיה שלהם בקישורים כאן ו כאן.

לא סביר שמפתחי משחקים יבחרו לוותר על השימוש בדיבורים על פני בינה מלאכותית. למעשה, בינה מלאכותית קולית יכולה לפתוח הזדמנויות נוספות עבור דייבורים. נכון לעכשיו, חברות פיתוח משחקים רבות מדלגות לעתים קרובות על שימוש בדיבורים בגלל השקעת הזמן והעלויות הכרוכות ביצירת דיאלוגים קוליים. לעתים קרובות יש צורך להחזיר שחקני קול להקלטות נוספות אם ישנם שינויים בתסריט או אם במאי משחקים רוצים סוג אחר של הופעה. ניתן להשתמש בבינה מלאכותית קולית כדי להתנסות בדיבורים/ליצור אב טיפוס של דיאלוגים, ולקבל תחושה לגבי סוג השינויים והתיקונים בתסריט שצריך לבצע לפני שקוראים לדיבוב מקצועי להקליט את התסריט. זה יכול להוביל לכך שיותר חברות יהיו בעלות המשאבים להשקיע ביצירת דיאלוגים קוליים.

ניתן אפילו לאמן מודלים קוליים של בינה מלאכותית על קולו של שחקן קולי ספציפי, וליצור קטעי דיאלוג טריוויאליים באמצעות הבינה המלאכותית, כל עוד השחקן מקבל תשלום עבור השימוש בקולו. כפי שדווח על ידי VentureBeat, שחקני קול כמו סיימון ג'יי סמית', אופטימיים לגבי השימוש הגובר במודלים של בינה מלאכותית קולית והפוטנציאל שלהם לפתוח הזדמנויות חדשות למשחק קולי.

מעבר לשימוש בבינה מלאכותית קולית כדי ליצור אב טיפוס של תסריטים או ליצור שורות קוליות עבור דמויות משנה, מפתחי משחקים יכולים גם להשתמש בבינה מלאכותית קולית כדי לתת לשחקנים אפשרויות התאמה אישית נוספות עבור משחקי וידאו של משחקי תפקידים. נכון לעכשיו, אפילו משחקים המאפשרים לשחקנים לבחור קול עבור האווטארים שלהם בדרך כלל מציעים רק קומץ אפשרויות. בעזרת בינה מלאכותית קולית, האפשרויות יכולות להיות בלתי מוגבלות מבחינה פונקציונלית.

בלוגר ומתכנת עם התמחות ב למידת מכונה ו למידה עמוקה נושאים. דניאל מקווה לעזור לאחרים להשתמש בכוחה של בינה מלאכותית לטובת החברה.