Connect with us

Дополненная реальность

Будущее очков AR – это AI-ориентированное

mm

Достижения в области искусственного интеллекта доминируют в повседневной беседе. Применения ИИ, кажется, безграничны – и не удивительно, что это изменит наш мир и то, как мы взаимодействуем с ним. Вместе с многими другими отраслями, это особенно применимо к дополненной реальности.

Модели ИИ уже используются для создания иммерсивных trải nghiệm дополненной реальности – особенно в приложениях для мобильных устройств. Области дополненной реальности и искусственного интеллекта работают вместе, чтобы создать интуитивные и уникальные trải nghiệm, которые более тщательно смешивают реальный и цифровой миры. Следующая граница в разработке ИИ и AR – это реализация передовых возможностей ИИ в потребительских очках дополненной реальности, чтобы расширить возможности иммерсивного взаимодействия.

Генеративный ИИ ускорит создание 3D-миров и создаст бесконечные возможности для носителей создавать свои собственные реальности

Генеративный ИИ включает в себя достижения в алгоритмах, языковых моделях и увеличении вычислительной мощности, необходимой для выполнения необходимых расчетов для картографирования и взаимодействия с физическим миром.

На данный момент существует ограничения на 3D-модели в очках дополненной реальности, поскольку они по сути являются ручными. Однако Генеративный ИИ создаст эти модели очень быстро и автономно. Генеративный ИИ в очках дополненной реальности поможет создавать 3D-модели более быстро, раскрывая полный потенциал дополненной реальности. Это создание цифрового мира, чтобы наложить его на физический мир, будет быстрее, более полным и иммерсивным без необходимости интенсивного ручного труда.

Генеративный ИИ также изменит опыт пользователя и то, как мы взаимодействуем с физическим пространством. С очками дополненной реальности, оснащенными Генеративным ИИ, носители могут буквально перенести свое воображение в реальный мир. Без необходимости программирования носители могут использовать распознавание голоса, чтобы “говорить” свои изображения и 3D-объекты через свои очки дополненной реальности точно так, как они хотят. Они могут сказать: “представьте, что в комнате плавает дельфин” – и он появится перед ними. Возможности для этого погружения практически безграничны для развлечений, работы и многого другого.

Очки дополненной реальности, оснащенные Генеративным ИИ, также изменят мир игр, создавая более иммерсивный и персонализированный игровой опыт. Например, с помощью ChatGPT будет проще создавать более реалистичных персонажей и добавлять новые квесты или игровые миры. Это также можно использовать для улучшения игрового опыта, анализируя поведение игрока и делая игру проще или более сложной для игрока в реальном времени, настраивая опыт автономно.

AI-ориентированный перевод речи + письменного текста уменьшит языковые барьеры

Автоматическое распознавание речи (ASR) использует нейронную сеть аудиовизуального распознавания речи (алгоритм, который полагается на обработку изображений для извлечения текста). Это может переводить письменный текст – например, меню в чужой стране – в ваш родной язык в реальном времени.

Когда это применяется в очках дополненной реальности, это может предоставить реальные субтитры на вашем родном языке, пока кто-то говорит на другом языке – все в рамках ваших очков дополненной реальности. Это устраняет разочарование туристов и бизнесменов, пытающихся общаться на местном языке, и таким образом способствует более коммуникативному и сотрудническому миру.

Распознавание текста и перевод сочетают AI-ориентированные техники оптического распознавания символов (OCR) с движками перевода текста в текст, такими как DeepL. Движки ИИ, такие как Stable Diffusion, также могут дополнить вашу коммуникацию анимациями или другими визуальными средствами, которые могут помочь передать сложные или подробные концепции. Это углубляет вовлеченность пользователя: очки дополненной реальности, оснащенные этим ИИ, могут показать соответствующее изображение или видео в реальном времени, которое имеет отношение к тому, что пользователь говорит перед ними на панели или презентации. Google недавно анонсировала разработку очков дополненной реальности с этой функциональностью.

Это также позволяет глухой общине участвовать в повседневных разговорах без необходимости читать по губам или поддерживать зрительный контакт, мгновенно превращая аудио в субтитры, отображаемые перед глазами носителя.

ИИ делает свое присутствиеfelt в здравоохранении, образовании и многих других областях. Скоро у нас будут умные очки дополненной реальности, которые, как популярная научная фантастика, перенесут людей в дополненную или виртуальную реальность, где ИИ быстро картографирует комнату и позицию говорящего, чтобы сделать виртуальную коммуникацию беспроблемной и менее громоздкой, независимо от того, где находится любая из сторон.

ИИ помогает очкам дополненной реальности легко обнаруживать и маркировать объекты в реальном мире – углубляя вовлеченность.

Свёрточные нейронные сети (CNN) алгоритмов обнаружения объектов в настоящее время используются в мобильных устройствах для оценки позиции и размера объектов в сцене. Как только он обнаруживает объект, программное обеспечение дополненной реальности может наложить текст на него или сгенерировать другой объект в физический мир и создать взаимодействие между ними. Объекты, которые переносятся в реальный мир, имеют многочисленные применения, включая инструкции, навигацию, диету и питание, и многие другие.

Когда вы носите очки дополненной реальности с этими возможностями ИИ, например, пользователь может прогуляться по улицам любого города и узнать о любом ориентире в реальном времени, глядя на него. Очки дополненной реальности могут идентифицировать, маркировать и предоставлять информацию о городе и его ориентирах – все через оправу носителя. По мере улучшения технологии распознавания объектов будут доступны данные о питании, такие как калории, белки, жиры и холестерин любой пищи и размера порции. Тем временем, простые QR-коды на продуктах вызовут подробную информацию о питании для пользователей.

За пределами простого обнаружения объектов, программное обеспечение распознавания лиц также становится все более распространенным для обнаружения людей. Уже распознавание лиц набирает обороты в авиационной промышленности, поскольку все больше рейсов используют эту технологию для подтверждения личности пассажира – добавляя дополнительный уровень безопасности и ускоряя процесс посадки. Распознавание лиц, когда оно используется в очках дополненной реальности, могло бы дать носителям возможность распознавать людей повсюду. Например, в ближайшем будущем с очками дополненной реальности вы сможете встретиться с другими в социальных сетях и получить их информацию о фоне мгновенно, прежде чем решить, хотите ли вы “дружить” или связаться с ними.

Очки дополненной реальности, оснащенные ИИ, меняют нашу жизнь, и их визуальные и технические возможности будут продолжать улучшаться. В нашем все более связанном мире они упрощают задачи и ломают барьеры, которые всего несколько лет назад считались непреодолимыми. Достижения в области искусственного интеллекта происходят так быстро, что в течение следующих 10 лет ИИ сделает больше прогресса, чем за предыдущие 50 лет. Будь то правительство, бизнес или личная среда, искусственный интеллект скоро сольется с очками дополненной реальности, чтобы смешать наш физический и цифровой миры.

Ari Grobman является CEO в Lumus. Ari - ветеран индустрии AR с почти 15-летним опытом коммерциализации оптики Lumus. На своей предыдущей должности в Lumus в качестве вице-президента по развитию бизнеса Ari представил Lumus ведущим технологическим компаниям по всему миру. Он привносит глубокое знание индустрии AR в компанию.