Connect with us

Багатожанрове навчання стає популярним серед розробників штучного інтелекту

Штучний інтелект

Багатожанрове навчання стає популярним серед розробників штучного інтелекту

mm

Venture Beat (VB) присвятив одну зі своїх тижневих звітів перевагам багатожанрового навчання у розвитку штучного інтелекту. Їхнім імпульсом був звіт компанії ABI Research щодо цієї справи.

Ключова концепція полягає в тому, що “набори даних є фундаментальними будівельними блоками систем штучного інтелекту,” і що без наборів даних “моделі не можуть вивчити відносини, які інформують їхні передбачення.” Звіт компанії ABI прогнозує, що “хоча загальна кількість встановлених пристроїв штучного інтелекту зросте з 2,69 мільярда в 2019 році до 4,47 мільярда в 2024 році, порівняно небагато з них будуть сумісними в короткій перспективі.”

Це може представляти собою суттєву втрату часу, енергії та ресурсів, “замість того, щоб об’єднати гігабайти до петабайт даних, що протікають через них у єдину модель або каркас штучного інтелекту, вони будуть працювати незалежно та гетерогенно, щоб дати змогу зрозуміти дані, які їм подаються.”

Щоб подолати це, компанія ABI пропонує багатожанрове навчання, методологію, яка могла б консолідувати дані “з різних сенсорів та входів у єдину систему. Багатожанрове навчання може нести додаткову інформацію або тенденції, які часто стають очевидними лише тоді, коли вони всі включаються до процесу навчання.”

VB представляє життєздатний приклад, який розглядає зображення та текстові підписи. “ Якщо різні слова спарені з подібними зображеннями, ці слова, ймовірно, використовуються для опису тих самих речей або об’єктів. Навпаки, якщо деякі слова з’являються поруч з різними зображеннями, це означає, що ці зображення представляють той самий об’єкт. Враховуючи це, повинно бути можливим для моделі штучного інтелекту передбачити об’єкти зображення з текстових описів, і дійсно, велика кількість академічної літератури довела, що це справді так.”

Незважаючи на можливі переваги, компанія ABI зазначає, що навіть технологічні гіганти, такі як IBM, Microsoft, Amazon і Google, продовжують зосереджуватися переважно на унімодальних системах. Одним із причин є складності такого переходу.

Все ж таки, дослідники компанії ABI передбачають, що “загальна кількість відправлених пристроїв зросте з 3,94 мільйона в 2017 році до 514,12 мільйона в 2023 році, спровоковане прийняттям у робототехніці, споживчому, охороні здоров’я та медіа- та розважальному секторах.” Серед прикладів компаній, які вже реалізують багатожанрове навчання, вони згадують Waymo, яка використовує такі підходи для створення “гіпер-чутливих самоходних транспортних засобів,” і Intel Labs, де інженерна команда компанії “досліджує техніки збору даних сенсорів у реальних середовищах.”

Головний інженер компанії Intel Labs Omesh Tickoo пояснив VB, що “те, що ми зробили, використовуючи техніки для визначення контексту, такі як час доби, ми створили систему, яка повідомляє вам, коли дані сенсора не мають найвищої якості. Враховуючи цю довірчу оцінку, вона зважує різні сенсори проти один одного на різних інтервалах і вибирає правильну суміш, щоб дати нам відповідь, яку ми шукаємо.”

VB зазначає, що унімодальне навчання залишається переважним там, де воно високо ефективне – у застосуваннях, таких як розпізнавання зображень та обробка природної мови. Водночас воно передбачає, що “коли електроніка стане дешевшою, а обчислення більш масштабованими, багатожанрове навчання, ймовірно, лише зростатиме у популярності.”

Колишній дипломат і перекладач для ООН, зараз фріланс-журналіст/письменник/дослідник, зосереджений на сучасних технологіях, штучному інтелекті та сучасній культурі.