Connect with us

Майбутнє окулярів AR полягає в можливостях штучного інтелекту

Доповнена реальність

Майбутнє окулярів AR полягає в можливостях штучного інтелекту

mm

Дослідження в галузі штучного інтелекту домінують у загальній розмові. Застосування штучного інтелекту здаються безмежними – і не дивно, що це змінить наш світ і те, як ми взаємодіємо з ним. Разом з багатьма іншими галузями, це особливо стосується доповненої реальності.

Моделі штучного інтелекту вже використовуються для створення іммерсивних досвідів доповненої реальності – особливо в мобільних додатках. Галузі доповненої реальності та штучного інтелекту працюють разом, щоб створити інтуїтивні, унікальні досвіди, які більш彻но поєднують реальний і цифровий світ. Наступний рубіж у розвитку штучного інтелекту та доповненої реальності полягає у впровадженні передових можливостей штучного інтелекту у окуляри доповненої реальності для розширення можливостей іммерсивної взаємодії.

Генеративний штучний інтелект прискорить створення 3D-світів та створить безмежні можливості для користувачів створювати свої реальності

Генеративний штучний інтелект передбачає вдосконалення алгоритмів, мовних моделей та збільшення обчислювальної потужності для виконання необхідних розрахунків для карти та взаємодії з фізичним світом.

На даний момент існує обмеження на 3D-моделі в окулярах доповненої реальності, оскільки вони є в основному ручними. Однак Генеративний штучний інтелект зможе створювати ці моделі дуже швидко і автономно. Генеративний штучний інтелект в окулярах доповненої реальності допоможе створити 3D-моделі швидше, розблокувавши повний потенціал доповненої реальності. Це створення цифрового світу для накладення на фізичний світ буде швидшим, більш повним і іммерсивним без інтенсивної ручної праці.

Генеративний штучний інтелект також змінить досвід користувача та те, як ми взаємодіємо з фізичним простором. З окулярами доповненої реальності, оснащеними Генеративним штучним інтелектом, користувачі можуть буквально транспонувати свої уявлення у реальний світ. Без необхідності програмування, користувачі можуть використовувати розпізнавання голосу, щоб “говорити” свої зображення та 3D-об’єкти через свої окуляри доповненої реальності точно так, як вони хочуть. Вони можуть сказати: “уявіть, що дельфін плаває через кімнату” – і воно з’явиться перед ними. Можливості цієї іммерсії практично безмежні для розваг, роботи та іншого.

Окуляри доповненої реальності, які використовують Генеративний штучний інтелект, також змінить ігровий світ, створивши більш іммерсивний і персоналізований ігровий досвід. Наприклад, з ChatGPT, буде легше створювати більш реалістичні персонажі та додавати нові квести або ігрові світи. Це також можна використовувати для покращення ігрового досвіду шляхом аналізу поведінки гравця та полегшення гри або ускладнення її в реальному часі, автономно налаштовуючи досвід.

Штучний інтелект, який дозволяє переклад мови та написаного тексту, знижує мовні бар’єри

Автоматичне розпізнавання мови (ASR) використовує нейронну мережу аудіовізуального розпізнавання мови (алгоритм, який залежить від обробки зображень для витягування тексту). Це може перекладати написаний текст – такий як меню в іноземній країні – у вашу рідну мову в реальному часі.

Коли це застосовується в окулярах доповненої реальності, це може забезпечити реальний час субтитрів вашої рідної мови, поки хтось говорить іншою мовою – все це в рамках вашого окуляра доповненої реальності. Це усуває розчарування туристів та бізнесменів, які намагаються спілкуватися іноземною мовою, та сприяє більш комунікативному та співробітницькому світу.

Розпізнавання тексту та переклад поєднують техніки штучного інтелекту Оптичного розпізнавання символів (OCR) з двигунами перекладу тексту в текст, такими як DeepL. Двигуни штучного інтелекту, такі як Stable Diffusion, також можуть доповнювати вашу комунікацію анімаціями або іншими візуальними засобами, які можуть допомогти передати складні або детальні концепції. Це поглиблює участь користувача: пара окулярів доповненої реальності, оснащених цим штучним інтелектом, може демонструвати відповідне зображення або відео в реальному часі, яке стосується того, що користувач говорить перед ними на панелі або презентації. Google недавно показав розробку окулярів доповненої реальності з цією функціональністю.

Це також дозволяє глухій спільноті брати участь у повсякденних розмовах без необхідності читати з губ або підтримувати зірковий контакт, миттєво перетворюючи аудіо на субтитри, які відображаються перед очима користувача.

Штучний інтелект робить свій вплив у сфері охорони здоров’я, освіти та багатьох інших галузях. Незабаром у нас будуть розумні окуляри доповненої реальності, які, як популярна наукова фантастика, перенесуть людей у доповнені або віртуальні реальності, де штучний інтелект швидко картографує кімнату та позицію мовця, щоб зробити віртуальну комунікацію безшовною та менш громіздкою, незалежно від того, де знаходиться будь-яка зі сторін.

Штучний інтелект допомагає окулярам доповненої реальності легко виявляти та маркувати об’єкти у реальному світі – поглиблюючи взаємодію.

Конволюційна нейронна мережа (CNN) алгоритми об’єктного виявлення зараз використовуються в мобільних пристроях для оцінки положення та розміру об’єктів у сцені. Як тільки він виявляє об’єкт, програмне забезпечення доповненої реальності може накладати текст на нього або генерувати інший об’єкт у фізичний світ, створюючи взаємодію між ними. Об’єкти, які транспонуються у реальний світ, мають багато застосувань, включаючи інструктаж, навігацію, дієту та харчування, та багато іншого.

Коли ви носите пару окулярів доповненої реальності з цими можливостями штучного інтелекту, наприклад, користувач може прогулятися вулицями будь-якого міста та дізнатися про будь-яку пам’ятку в реальному часі при перегляді її. Окуляри доповненої реальності можуть ідентифікувати, маркувати та надавати інформацію про місто та його пам’ятки – все через окуляри користувача. Коли технологія розпізнавання об’єктів покращується, харчова інформація, така як калорії, білок, жир та холестерин будь-якої їжі та порції, буде доступна. Тим часом, прості QR-коди на продуктах можуть викликати харчову інформацію для користувачів.

Поза чистим виявленням об’єктів, програмне забезпечення розпізнавання обличчя також стає звичайним для людей виявлення. Вже зараз розпізнавання обличчя набирає популярності в авіаційній галузі, оскільки все більше рейсів використовують цю технологію для підтвердження особи пасажира – додаючи додатковий рівень безпеки та прискорюючи процес реєстрації. Розпізнавання обличчя, коли воно використовується в окулярах доповненої реальності, може дати користувачам можливість розпізнавання. Наприклад, у найближчому майбутньому з окулярами доповненої реальності, ви можете зустрітися з іншими в соціальних мережах та отримати інформацію про їхній фон миттєво, перш ніж вирішити, чи хочете ви “додати у друзі” або зв’язатися з ними.

Окуляри доповненої реальності, оснащені штучним інтелектом, змінюють нашу життя, а їх візуальні можливості будуть продовжувати покращуватися. У нашому все більш зв’язаному світі вони спрощують завдання та розбивають бар’єри, які лише кілька років тому вважалися непроникними. Дослідження в галузі штучного інтелекту відбуваються так швидко, що за наступні 10 років штучний інтелект зробить більше прогресу, ніж за попередні 50 років. Чи це уряд, бізнес чи особисте середовище, штучний інтелект незабаром з’єднається з окулярами доповненої реальності, щоб поєднати наш фізичний і цифровий світ.

Ari Grobman є CEO в Lumus. Ari є ветераном індустрії AR з майже 15-річним досвідом комерціалізації оптики Lumus. На попередній посаді у Lumus як віце-президента з розвитку бізнесу Ari представив Lumus провідним технологічним компаніям світу. Він привносить глибокі знання індустрії AR до компанії.