Финансирование
Collov Labs привлекает $23M Series A, чтобы сделать ставку на визуальный ИИ как на следующий интерфейс

Collov Labs привлекла $23 миллиона в рамках раунда Series A и запустила новую исследовательскую лабораторию, направленную на развитие визуальных систем ИИ, что сигнализирует о более широком сдвиге в том, как искусственный интеллект может эволюционировать за пределами текстового взаимодействия.
Раунд, поддержанный Brightway Future Capital, Taihill Venture и Mindworks Capital, будет финансировать разработку систем, предназначенных для интерпретации изображений и входных данных с камеры, с целью ermögления ИИ понимать и действовать в физическом мире.
Сдвиг от чат-интерфейсов ИИ
Большая часть современного внедрения ИИ сосредоточена вокруг чат-интерфейсов. Collov Labs строит вокруг другой предпосылки: что визуальный ввод станет основным способом взаимодействия людей с ИИ.
Вместо того, чтобы запрашивать системы текстом, компания фокусируется на ermögлении пользователям указать камеру на сцену и иметь ИИ интерпретировать контекст, рассуждать о том, что он видит, и помогать с реальными действиями. Это отражает более широкий переход отрасли к многомодальному ИИ, где системы объединяют видение, язык и рассуждение в едином опыте.
Идея не совсем нова, но недавние достижения в вычислительной технике, моделях и обработке на устройстве делают ее все более практичной.
Строительство к реальному взаимодействию ИИ
Collov Labs разрабатывает системы, которые сочетают диффузионные модели, пространственное рассуждение и агентные рабочие процессы. Цель – перейти от статического распознавания изображений к системам, которые могут понимать отношения внутри сцены и выполнять многоступенчатые действия.
Этот раздел соответствует растущему толчку к системам ИИ, которые взаимодействуют с физическими средами, особенно поскольку аппаратное обеспечение эволюционирует для поддержки обработки в реальном времени и постоянного контекста.
Фон компании отражает этот фокус. Ее команда имеет опыт в многомодальном ИИ, крупномасштабных системах рекомендаций и прикладном машинном обучении как в академии, так и в отрасли.
От инструментов дизайна к более широкому слою ИИ
Существующие продукты Collov, включая его инструменты дизайна, работающие на ИИ, дают представление о том, как эти системы функционируют на практике. Компания изначально получила известность в таких областях, как дизайн интерьера и генерация визуального контента, где ИИ может интерпретировать пространственные макеты и генерировать реалистичные выходные данные.
Ранее итерации бизнеса фокусировались на платформах дизайна, работающих на ИИ, и инструментах автоматизации, подход, который уже увидел коммерческий успех в таких областях, как недвижимость, розничная торговля и электронная коммерция.
Эти продукты теперь действуют как обратная связь, поставляя реальные данные, которые помогают улучшить модели компании и усовершенствовать понимание визуальных сред.
Почему визуальный ИИ может расширить внедрение
Одним из основных предположений, лежащих в основе стратегии Collov Labs, является то, что текстовые интерфейсы имеют ограниченный охват. Хотя чат-боты стимулировали осведомленность, большинство мирового населения еще не вступило в значимое взаимодействие с инструментами ИИ.
Визуальные интерфейсы, с другой стороны, по своей сути более интуитивны. Сдвиг отражает более ранние переходы в вычислительной технике, где графические интерфейсы сделали системы доступными для более широкой аудитории за пределами технических пользователей.
Если этот подход окажется успешным, он может снизить барьер для внедрения ИИ и расширить его использование в отраслях, где визуальный контекст имеет решающее значение, включая розничную торговлю, дизайн, логистику и полевые операции.
Роль аппаратного обеспечения и ИИ на устройстве
Достижения в аппаратном обеспечении являются ключевым фактором, способствующим росту визуального ИИ. По мере того, как возможности обработки на смартфонах, носимых устройствах и специализированных чипах улучшаются, больше работы, необходимой для интерпретации изображений и видео, может происходить локально в реальном времени. Это снижает задержку и позволяет системам реагировать мгновенно на то, что видит пользователь, а не полагаться исключительно на облачную обработку.
Этот сдвиг также меняет то, как доставляется ИИ. Вместо того, чтобы существовать в основном как отдельные приложения, визуальная интеллект может стать встроенной в устройства themselves, работающей непрерывно на фоне. Это открывает дверь для более контекстно-зависимых взаимодействий, но также вызывает практические проблемы вокруг точности, надежности и того, как эти системы ведут себя в непредсказуемых реальных средах.
Более широкие последствия для взаимодействия ИИ
Переход к визуальному ИИ предполагает постепенный сдвиг во взаимодействии человека и компьютера. Системы, которые могут интерпретировать сцены и пространственные отношения, могут снизить необходимость в структурированных входных данных, делая ИИ более доступным для пользователей, которые менее комфортно чувствуют себя с текстовыми инструментами.
В то же время сложность реальных сред вводит новые проблемы. Неправильная интерпретация сцены или пропуск ключевого контекста может привести к неправильным выходным данным, и последствия этих ошибок становятся более значительными, поскольку ИИ приближается к принятию решений.
Вместо того, чтобы заменять существующие интерфейсы, визуальный ИИ, скорее всего, будет эволюционировать наряду с ними, добавляя еще один слой взаимодействия. Со временем это может привести к более интегрированному опыту, где ИИ реагирует на контекст так же, как и на явные инструкции.










