Угол Андерсона

Сможет ли искусственный интеллект в конечном итоге процветать за пределами «рва»?

опубликованный 1 апреля 2026

Мартин Андерсон

Изображение из мультфильма в стиле игры SIMs, где шотландский лорд в своем замке с недоумением наблюдает за процветающими жителями деревни за своим рвом. GPT-1.5.

Затраты и ограничения, связанные с развитием искусственного интеллекта, а также его влияние на стоимость оборудования, вынуждают пользователей создавать собственные системы – в то время как растущее регулирование угрожает парализовать эту «теневую экономику ИИ».

Обзор Среди множества «подводных камней», встречающихся в научных статьях, одним из наиболее частых является то, что проблема, рассматриваемая в статье, была... уже решено в другом местеи что вклад нового исследования носит лишь случайный или постепенный характер.

Это может произойти по ряду причин: исследователи надеялись на квантовый скачок, а получили лишь квази-скачок; предыдущие решения проблемы были более ресурсоемкими, чем новое предложение; или просто цели проекта полностью провалились, но культура академических исследований «публикуй или погибнешь» вынудила команду все равно опубликовать его (часто скрытно). среди лавин (в самый загруженный день публикации на портале).

Однако в литературе по машинному обучению все чаще встречается относительно новая и не вызывающая извинений причина: предлагаемая функция или возможности являются В настоящее время доступно только через порталы с закрытым исходным кодом и привязкой к API..

Сегодня утром я рассматривал одну из таких статей – сотрудничества взаимодействие между китайскими университетами и Amazon, решение повторяющейся проблемы сбой удаления объекта в системах редактирования изображений на основе диффузии, которые часто просто «заполняют» целевое пространство похожим объектом:

В крайнем левом углу — исходное изображение; справа от него — красная маска сегментации, которая указывает ИИ, какую часть изображения нужно удалить; далее, на изображении «Наш» показан успешный подход к удалению объекта, а на двух оставшихся изображениях показаны аналогичные системы, которые вместо удаления шины просто вставляют другую шину.. Источник

В приведенном выше примере центральное изображение демонстрирует новый подход, успешно удаляющий автобус и добавляющий правдоподобный фон, в отличие от двух предыдущих методов (два крайних левых изображения), в каждом из которых автобус удаляется, но затем добавляется другой фон. различный Автобус снова в кадре!

Попался!

Отложим в сторону вопросы «почему» и «зачем» этого вызова на потом (и это действительно так). интересный предмет Затем, читая новую статью, я наткнулся на классический «подвох»: авторы признают, что дорогие проприетарные системы уже достаточно надежно справляются с этой задачей — то, что я знаю по многолетнему опыту работы с Adobe. Светляк в Photoshop, среди прочих систем с закрытым исходным кодом:

«Методы, основанные на диффузии, часто дают ложные результаты, вставляя непреднамеренные объекты после удаления целевых, что приводит к контекстно несогласованным результатам».

С другой стороны, современные многомодальные модели с закрытым исходным кодом, такие как ChatGPT и Nano Banana, хотя и более эффективны в удалении объектов, требуют большого количества параметров и значительных вычислительных затрат, что препятствует их практическому применению на периферийных устройствах.

«Поэтому крайне необходимо разработать специализированную модель удаления объектов, которая не только обеспечит превосходную производительность удаления, но и будет обладать низкой задержкой при выводе и значительно меньшим количеством параметров».

Это объяснение, сосредоточенное на технических препятствиях, упускает из виду очевидный факт, что архитектуры с закрытым исходным кодом, такие как ChatGPT и Nano Banana, недоступны. вообще для локальной установки. Хотя такие системы... способность создавать спорные материалы В течение последнего года подобные порталы, благодаря своей политике «контроля доступа», получили дополнительное общественное оправдание, поскольку являются частными в основном из-за коммерческих соображений.

По сути, новая статья подразумевает, что, хотя целевая проблема решается в коммерческих системах, Для остальных из нас это может быть неактуально., которым необходимо научиться решать подобные задачи в «реальном мире» – то есть в системах с открытым исходным кодом, независимо от того, можно ли их реально установить локально или нет.

Параллельная разработка

Однако зачем решать задачу, которая по-прежнему зависит от платной системы, не из-за ограничений, связанных с проприетарными технологиями, а потому что требуемые вычислительные мощности графического процессора превышают возможности любой локальной системы? В большинстве таких новых «открытых» статей и репозиториев кода описываются системы обучения/вывода с чрезвычайно высокими требованиями к ресурсам, например, кластеры из процессоров A100.

Ну, это зависит от того, какой вывод вы делаете из всего этого. готовящиеся к запуску, разрушающие экономику центры обработки данных для ИИ Они должны будут выполнить свои обещания, когда наконец-то появятся в сети. Страхи простых людей и надежды элиты в равной степени предполагают, что защищенные от внешнего воздействия проприетарные системы уровня ChatGPT приведут к сокращению рабочих мест, постоянно повышая стоимость подписки и снижая уровень обслуживания, чтобы удовлетворить потребности первых венчурных инвесторов, которым пришлось ждать 3-5 лет, прежде чем системы начнут функционировать.

Однако в литературе наблюдается растущая тенденция в поддержку альтернативного будущего и «самостоятельного», маргинального духа многих онлайн-сообществ, таких как сабреддит r/stablediffusion, который в настоящее время насчитывает 920 000 пользователей и который давно запретил публикации, касающиеся систем генерации изображений/видео с закрытым исходным кодом.

В этом альтернативном будущем новые глобальные центры обработки данных для ИИ будут обеспечивать вычислительные мощности для настраиваемых и определяемых пользователем систем, а не удовлетворять потребности монументальных «черных ящиков», таких как ChatGPT и Adobe Firefly.

Поверхностное трение

Просматривая сложные, собранные с Patreon удаленные видеоинструкции по работе с графическими процессорами на r/stablediffusion, на данный момент все это кажется невозможным: модели... постоянно меняя правила игры С каждым обновлением они сталкиваются с трудностями; их сложно развернуть локально, даже в самых простых и удобных для пользователя средах; и, в целом, количество связанных с этим сложностей предполагает, что это занятие исключительно для энтузиастов-энтузиастов и для более смелых компаний, не занимающихся непосредственно ИИ, но желающих разрабатывать и поддерживать собственные локальные системы, а не арендовать такие возможности.

Однако за последние тридцать лет каждая технология, где существовал огромный спрос на открытое и демократичное упрощение и коммерциализацию, стала объектом всеобщего потребления. как правило, получает этоПри этом наиболее распространенные решения обычно возникают из-за противоречий между коммерческими системами и альтернативами и инициативами с открытым исходным кодом.

Науки, которые когда-то были узкоспециализированными «гиковскими» сферами, такими как подключение к интернету, системы управления контентом и платформы для ведения блогов, а также интернет-безопасность, фотография и управление медиафайлами, эволюционировали от запутанной сложности к простоте и полезности.

Поэтому в будущем ландшафт искусственного интеллекта может оказаться более разнообразным и полным более мелких и действительно конкурирующих игроков, чем того хотели бы нынешние лидеры рынка ИИ.

Самоактуализация по необходимости

По иронии судьбы, «большой искусственный интеллект» вносит значительный вклад в зарождающийся дух независимости среди конечных пользователей, поглощая для своих центров обработки данных все компьютерные компоненты. особенно DRAM – то, что в противном случае досталось бы «обычным» потребителям.

Следовательно, многие представляют себе будущее, в котором доступ к ресурсам «глобального ИИ» с закрытым исходным кодом будет осуществляться через маломощные тонкие клиенты. развивающийся растущий интерес при обслуживании имеющегося у них оборудования.

Атака ИИ на цепочки поставок в технологической отрасли также привела к тому, что поставщики технологических услуг стали... поднимать цены За последние 3-6 месяцев либо потому, что небольшие компании действительно испытывают трудности из-за дефицита оборудования, либо просто потому, что... потому что ИИ.

Это привело к рост интереса к самостоятельному размещению контента. и на территории предприятия, включая саморазмещаемые сети машинного обучения.

В последнее время я сам оказался втянут в этот процесс, перейдя на локальное хранилище в сети для фотографий и видео, а также для резервного копирования файлов. Для первого я использую бесплатный медиасервер с открытым исходным кодом Immich, предназначенный для работы на разных платформах, что помогает мне избежать высоких цен (и другие вызывающие беспокойство вопросы) iCloud и других поставщиков облачного хранилища:

Бесплатная платформа Immich позволяет хранить ваши медиафайлы на вашем оборудовании и предоставлять к ним доступ только через ваши каналы. В данном случае я также использую Immich в Docker для передачи данных с моего графического процессора NVIDIA 3090 по локальной сети туда, где хранятся фотографии и видео, чтобы более мощный графический процессор мог обрабатывать изображения и видео, требующие интенсивной обработки с помощью ИИ.

Если судить по моему собственному опыту, вибрация-кодирование - В данный момент проклятый во многих некогда «чистых» онлайн-сообществах – это подпитывает эту волну независимости (даже если она может угрожать репозитории с открытым исходным кодом, на которые он опирается).

Например, сетевые технологии всегда были моей слабой стороной в вычислительной технике, поэтому помощь ИИ была для меня необходима для запуска безопасного VPS-сервера, поддерживающего ряд новых сервисов, размещаемых на собственном сервере.

Таким образом, можно утверждать, что «большой ИИ» расширяет возможности «малого ИИ»; поэтому, возможно, нынешний рост гипермасштабных, сверхдорогих компаний, занимающихся ИИ, можно рассматривать как необходимое, но лишь переходное состояние перед появлением более демократичного и наделенного правами пользователей общества ИИ, которое отбросит корпорации, стремящиеся к созданию рва и получению ренты, как отработанные ракеты-носители – подобно краху доткомов в 2000 году. оставили после себя уязвимую инфраструктуру что значительно ускорит развитие интернета еще долго после того, как компании, которые его финансировали, обанкротятся.

Эпоха соответствия

Что ж, скорее всего, на этот раз это не повторится.

Даже если мы склонность формировать какой-либо вид бывший ров маргинальное общество, регулирование в области ИИ в сочетании с Современная глобальная тенденция к проверке возрастаПо всей видимости, это приведет к тому, что подобные пути развития будут предвосхищены и заблокированы.

Ключевым фактором предотвращения «теневой экономики ИИ» является регулирование. Уже сейчас центральные хранилища, такие как... GitHub и Обнимая лицо В зависимости от настроек репозитория, часто требуется авторизация в сети перед тем, как разрешить пользователям клонировать репозитории локально.

Таким образом, уже существуют механизмы для более широкого мониторинга фреймворков ИИ, чем это принято в настоящее время; и предусматривает Усилия по обеспечению такого надзора в настоящее время консолидируются из отдельных правительственных инициатив. в глобальный импульс.

Таким образом, если рыночные силы и изобретательность движения за свободное программное обеспечение устранят препятствия для неформального внедрения ИИ, то, похоже, барьеры вернутся в виде... требования к управлениюТребования к соблюдению норм, хотя и обременительные, оправданы для компаний, но, возможно, не для отдельных лиц – подобно препятствиям, которые были добавлены в системы онлайн-платежей для потребителей с тех пор, как золотой век PayPal в 2000s.

Мета Было потрачено 2 миллиарда долларов на лоббирование контроля за возрастом на уровне операционной системы. Из-за значительных инвестиций в ИИ или интересов в сборе данных, результаты деятельности крупных технологических компаний... поддержка контроля над возрастом Дело в том, что «локальный» ИИ может стать таким же регулируемым, как и вещество класса А; и, подобно тому, как это произошло с DMCA, предназначен для криминализации намерение Вместо какого-либо конкретного механизма обхода авторских прав, международные правила регулирования ИИ в таком сценарии могли бы объявить любое несоответствующее использование машинного обучения вне закона, при этом затраты (с точки зрения активного надзора) были бы минимальными.

Ещё год назад это могло показаться чрезмерно антиутопическим взглядом, но это было до того, как... Калифорния и Systemd поддержал идею проверки возраста на аппаратном уровне, в настоящее время видели многие в качестве заменителя чего-либо в стиле КПК запрет об анонимности в интернете.

Заключение

Таким образом, хотя правовая и законодательная база, возможно, готовится к тому, чтобы ИИ стал строго регулируемой сферой, так что обычные пользователи не смогут «варить собственное пиво», как и выращивать или ферментировать регулируемые вещества без разрешения, исследовательский сектор сохраняет более оптимистичный настрой – что ИИ станет демократичной и полезной силой в обществе в целом, а не только для сторонников самого популярного на сегодняшний день закрытого поставщика программного обеспечения.

Многое зависит от того, как будут распоряжены обломки после того, как лопнет пузырь ИИ – по крайней мере, в той степени, в которой поставщики либо консолидируются, либо рынок стабилизируется и начнет долгосрочную раздробленность, что, вероятно, потребует более мягкого регулирования.

Впервые опубликовано Среда, 1 апреля 2026 г.

Мартин Андерсон

Автор статей о машинном обучении, специалист по синтезу человеческих изображений. Бывший руководитель исследовательского контента в Metaphysic.ai.
Личный сайт: Мартинандерсон.ай
Контактное лицо: [электронная почта защищена]
Твиттер: @manders_ai