Доповнена реальність

Майбутнє окулярів доповненої реальності – це окуляри з підтримкою штучного інтелекту

mm

Прогрес у сфері штучного інтелекту домінує в основних розмовах. Застосування штучного інтелекту здається безмежним – і не дивно, що це змінить наш світ і те, як ми взаємодіємо з ним. Разом з багатьма іншими галузями, це особливо стосується доповненої реальності.

Моделі штучного інтелекту вже використовуються для створення іммерсивних досвідів доповненої реальності – особливо в додатках для мобільних пристроїв. Галузі доповненої реальності та штучного інтелекту працюють разом, щоб створити інтуїтивні, унікальні досвіди, які ще більш彻існо поєднують реальний і цифровий світи. Наступний рубіж у розвитку штучного інтелекту та доповненої реальності – впровадження передових можливостей штучного інтелекту в окуляри доповненої реальності для розширення можливостей іммерсивного взаємодії.

Генеративний штучний інтелект прискорить створення 3D- світів, і створить безмежні можливості для носіїв створювати свої реальності

Генеративний штучний інтелект включає вдосконалення алгоритмів, мовних моделей і збільшення обчислювальної потужності, необхідної для виконання необхідних розрахунків для картографування та взаємодії з фізичним світом.

На даний момент існує обмеження на 3D-моделі в окулярах доповненої реальності, оскільки вони в основному створені вручну. Однак Генеративний штучний інтелект зможе створювати ці моделі дуже швидко і автономно. Генеративний штучний інтелект в окулярах доповненої реальності допоможе створити 3D-моделі швидше, розблокувавши повний потенціал доповненої реальності. Це створення цифрового світу для наложення на фізичний світ буде швидшим, більш повним і іммерсивним, без необхідності інтенсивної ручної праці.

Генеративний штучний інтелект також трансформуватиме досвід користувача і те, як ми взаємодіємо з фізичним простором. З окулярами доповненої реальності з підтримкою Генеративного штучного інтелекту, носії можуть буквально перенести свої уявлення в реальний світ. Без необхідності програмування, носії можуть використовувати розпізнавання голосу, щоб “говорити” свої зображення і 3D-об’єкти через свої окуляри доповненої реальності точно так, як вони хочуть. Вони можуть сказати: “уявіть, що дельфін плаває через кімнату” – і воно з’явиться перед ними. Можливості для цього іммерсивного досвіду практично безмежні для розваг, роботи та іншого.

Окуляри доповненої реальності, які використовують Генеративний штучний інтелект, також змінять світ ігор, створюючи ще більш іммерсивний і персоналізований досвід гри. Наприклад, з ChatGPT, буде легше створювати більш реалістичні персонажі і додавати нові квести або ігрові світи. Це також можна використовувати для покращення досвіду гри, аналізуючи поведінку гравця і роблячи гру легшою або складнішою для гравця в реальному часі, автономно налаштовуючи досвід.

Штучний інтелект, що підтримує переклад мови + письмового тексту, зменшить мовні бар’єри

Автоматичне розпізнавання мови (ASR) використовує нейронну мережу аудіовізуального розпізнавання мови (алгоритм, який залежить від обробки зображень для витягування тексту). Це можна перекладати письмовий текст – такий як текст меню в іноземній країні – на вашу рідну мову в реальному часі.

Коли це застосовується в окулярах доповненої реальності, це може забезпечити реальні субтитри вашої рідної мови, поки хтось говорить іншою мовою – все це в рамках ваших окулярів доповненої реальності. Це усуває розчарування туристів і бізнесменів, які намагаються спілкуватися місцевою мовою, і тим самим сприяє більш комунікативному і співробітницькому світу.

Розпізнавання тексту і переклад поєднують техніки штучного інтелекту з текстово-текстовими двигунами перекладу, такими як DeepL. Двигуни штучного інтелекту, такі як Stable Diffusion, також можуть доповнювати вашу комунікацію анімаціями або іншими візуальними допоміжними засобами, які можуть допомогти передати складні або детальні концепції. Це поглиблює взаємодію користувача: пара окулярів доповненої реальності з цією функцією штучного інтелекту може відображати відповідне зображення або відео в реальному часі, яке стосується того, про що говорить користувач перед ними на панелі або презентації. Google недавно анонсував розробку окулярів доповненої реальності з цією функціональністю.

Це також дозволяє глухій спільноті брати участь у повсякденних розмовах без необхідності читати з губ або підтримувати зоровий контакт, миттєво перетворюючи аудіо на субтитри, які відображаються перед очима носія.

Штучний інтелект робить свій внесок у галузь охорони здоров’я, освіти та багатьох інших галузей. Незабаром ми матимемо розумні окуляри доповненої реальності, які, як популярна наукова фантастика, перенесуть людей у доповнені або віртуальні реальності, де штучний інтелект швидко картографує кімнату і позицію мовця, роблячи віртуальну комунікацію безшовною і менш громіздкою, незалежно від того, де знаходяться обидві сторони.

Штучний інтелект допомагає окулярам доповненої реальності легко виявляти і маркувати об’єкти в реальному світі – поглиблюючи взаємодію.

Конволюційна нейронна мережа (CNN) алгоритмів виявлення об’єктів зараз використовується в мобільних пристроях для оцінки позиції і розміру об’єктів у сцені. Як тільки він виявляє об’єкт, програмне забезпечення доповненої реальності може накладати текст на нього або генерувати інший об’єкт у фізичному світі, і створювати взаємодію між ними. Об’єкти, які переносяться у реальний світ, мають багато застосувань, включаючи інструкції, навігацію, дієту і харчування, і багато інших.

Коли ви носите окуляри доповненої реальності з цими можливостями штучного інтелекту, наприклад, користувач може прогулятися вулицями будь-якого міста і дізнатися про будь-яку пам’ятку в реальному часі при перегляді її. Окуляри доповненої реальності можуть ідентифікувати, маркувати і надавати інформацію про місто і його пам’ятки – все це через окуляри носія. Як тільки технологія розпізнавання об’єктів покращиться, харчова інформація, така як калорії, білки, жир і холестерин будь-якої їжі і порції, буде доступна. Тим часом, прості QR-коди на продуктах можуть викликати харчову інформацію для користувачів.

Поза межами чистого виявлення об’єктів, програмне забезпечення розпізнавання облич також стає все більш поширеним для людей виявлення. Вже зараз розпізнавання облич набирає популярність в авіаційній галузі, оскільки все більше рейсів використовують цю технологію для підтвердження особи пасажира – додаючи додатковий рівень безпеки і прискорюючи процес посадки. Розпізнавання облич, коли воно використовується в окулярах доповненої реальності, може дати носіям можливість розпізнавання будь-де. Наприклад, у найближчому майбутньому з окулярами доповненої реальності, ви можете зустрітися з іншими в соціальних мережах і отримати інформацію про їхній фон миттєво, перш ніж вирішити, чи хочете ви “додати у друзі” або зв’язатися з ними.

Окуляри доповненої реальності з підтримкою штучного інтелекту змінюють нашу життя, і їх візуальні можливості будуть продовжувати покращуватися. У нашому все більш зв’язаному світі вони спрощують завдання і руйнують бар’єри, які лише кілька років тому вважалися непроникними. Прогрес у сфері штучного інтелекту відбувається так швидко, що протягом наступних 10 років штучний інтелект зробить більше прогресу, ніж за попередні 50 років. Чи то уряд, бізнес або особисте середовище, штучний інтелект незабаром з’єднається з окулярами доповненої реальності, щоб поєднати наші фізичні і цифрові середовища.

Ari Grobman є CEO в Lumus. Ari є ветераном індустрії AR з майже 15-річним досвідом комерціалізації оптики Lumus. На попередній посаді у Lumus як віце-президента з розвитку бізнесу Ari представив Lumus провідним технологічним компаніям світу. Він привносить глибокі знання індустрії AR до компанії.