Взгляд Anderson

Будет ли ИИ в конечном итоге процветать вне рва?

mm
A cartoon image of a SIMs-style game where a Scottish Laird in his castle is regarding the thriving villagers beyond his moat with puzzlement. GPT-1.5.

Затраты и ограничения Big AI, а также его влияние на стоимость оборудования, заставляют пользователей создавать свои собственные системы – как раз когда растущая регуляция угрожает закрыть эту “тень AI-экономику”.

 

Мнение Среди многих “ловушек”, которые появляются в научных исследовательских работах, одна из наиболее частых заключается в том, что проблема, которую решает статья, уже была решена в другом месте, и что вклад нового исследования является лишь случайным или инкрементальным.

Это может произойти по нескольким причинам: исследователи надеялись на квантовый скачок, но получили квази-шаг вместо этого; ранее решения проблемы были более ресурсоемкими, чем новое предложение; или просто проектные цели полностью провалились, но культура “публикуй или умри” в академических исследованиях заставила команду выпустить его все равно (часто среди лавины портала самого загруженного дня публикации).

В литературе по машинному обучению, однако, относительно новая и бесстрашная причина становится все более частой: что функция или функциональность, предлагаемая в статье, только в настоящее время доступна через закрытые, связанные с API порталы.

Я рассматривал одну такую статью этим утром – сотрудничество между китайскими университетами и Amazon, решающее проблему неудачи удаления объекта в системах редактирования изображений на основе диффузии, которые часто просто “перезаполняют” целевое пространство подобным объектом вместо:

<img class="size-full wp-image-407380" src="https://www.unite.ai/wp-content/uploads/2026/04/you-only-erase-once.jpg" alt="Слева – исходное изображение; справа от него – красочная сегментационная маска, которая говорит ИИ, какую часть изображения удалить; далее, 'Наш подход', показывает успешный подход к удалению объекта – и два оставшихся изображения показывают подобные системы, которые вместо удаления автобуса просто вставляют другой автобус вместо него. Источник – https://arxiv.org/pdf/2603.27599v1” width=”1200″ height=”272″ /> Слева – исходное изображение; справа от него – красочная сегментационная маска, которая говорит ИИ, какую часть изображения удалить; далее, ‘Наш подход’, показывает успешный подход к удалению объекта – и два оставшихся изображения показывают подобные системы, которые вместо удаления автобуса просто вставляют другой автобус вместо него. Источник

В приведенном выше примере центральное изображение показывает новый подход, успешно удаляющий автобус и помещающий правдоподобный фон, против двух предыдущих методов (два левых изображения), которые каждый удаляют автобус, но затем помещают другой автобус обратно в изображение!

Ловушка!

Отложив в сторону причины и обстоятельства этого вызова на другой раз (и это интересная тема ), я затем наткнулся на классическую “ловушку”, читая новую статью: авторы признают, что дорогие, проприетарные системы могут уже выполнять эту задачу довольно надежно – что я знаю, из нескольких лет использования Adobe Firefly в Photoshop, среди других закрытых систем:

‘[Диффузионные] методы часто галлюцинируют, вставляя непредвиденные объекты после удаления целевых объектов, что приводит к контекстно-непоследовательным [результатам].

‘С другой стороны, недавние закрытые многомодальные модели, такие как ChatGPT и Nano Banana, хотя и более мощные в удалении объектов, но включают большие счетчики параметров и высокую вычислительную нагрузку, препятствующую их практической развертке на пограничных устройствах.

‘Следовательно, крайне необходимо разработать посвященную модель удаления объекта, которая не только обеспечивает превосходную производительность удаления, но также обладает низкой задержкой вывода и значительно меньшим количеством параметров.’

Это объяснение, сосредоточенное на технических препятствиях, умалчивает о очевидном факте, что закрытые архитектуры, такие как ChatGPT и Nano Banana, вовсе не доступны для локальной установки. Хотя такие системы способны производить спорный материал, их роль в качестве хранителей ворот за последний год приобрела дополнительное общественное оправдание, но порталы такого типа являются проприетарными в основном из-за коммерческих императивов.

По сути, новая статья подразумевает, что хотя целевая проблема решена в коммерческих системах, это может быть неактуально для остальных из нас, кто должен учиться решать ее в “реальном мире” – т.е. в открытом исходном коде системах, будь то они могут быть реалистично установлены локально или нет.

Параллельное развитие

Однако, почему решать проблему, которая все еще зависит от платной системы, не из-за проприетарных ограничений, а потому, что необходимая вычислительная мощность GPU превышает то, что любая локальная установка может реалистично поддерживать? Большинство таких новых “открытых” статей и репозиториев кода содержат настройки обучения/вывода с возмутительными требованиями к ресурсам, такими как кластеры A100.

Ну, это зависит от того, какой конец вы думаете, что все эти предстоящие, разорительные центры обработки данных ИИ будут выполнять, когда они наконец появятся. Страхи обычных людей и надежды элит одинаково представляют себе огороженные, проприетарные системы ИИ, вытесняющие рабочие места, постоянно повышающие стоимость подписки и снижающие уровень обслуживания, чтобы удовлетворить ранний капитал венчурных фондов, который должен был ждать 3-5 лет, чтобы запустить операции.

Но растущая тенденция в литературе, кажется, поддерживает альтернативное будущее, и “иди-одиночка”, маргинальный дух многих онлайн-сообществ, таких как subreddit r/stablediffusion, который в настоящее время имеет 920 000 пользователей, и который давно запретил публикации, связанные с закрытыми системами генерации изображений/видео.

В этом альтернативном будущем новый глобальный запас центров обработки данных ИИ будет облегчать сырую вычислительную мощность для настроенных пользователем, определенных пользователем систем, а не удовлетворять требованиям монументальных “черных ящиков” таких как ChatGPT и Adobe Firefly.

Поверхностное трение

Осматривая сложные, Patreon-копаемые удаленные GPU-обходы на r/stablediffusion, все кажется невозможным на данный момент: модели постоянно меняют цели с каждым обновлением; они трудно развертываются локально, даже в самых простых и удобных рамках; и, в целом, количество трения, связанного с этим, предполагает занятие строго для гиков-хоббиистов и для того более авантюрного типа компаний, не直接 участвующих в ИИ, но желающих разработать и поддерживать свои собственные локальные системы, вместо того, чтобы арендовать такие возможности.

Однако, за последние тридцать лет каждая технология, где был огромный спрос на открытое и демократическое упрощение и коммодитизацию, склонна получить это, с наиболее распространенными решениями, обычно возникающими из напряжений между коммерческими системами и открытыми альтернативами и инициативами.

Занятия, которые когда-то были специализированными “нердовыми” анклавами, такими как интернет-соединения, системы управления контентом и блог-платформы, а также интернет-безопасность, фотография и управление медиа, все эволюционировали от ошеломляющей сложности к простоте и полезности.

Следовательно, более поздний ландшафт ИИ может быть более пестрым и наполненным меньшими и действительно конкурирующими игроками, чем текущие лидеры рынка ИИ могут предпочесть.

Самоактуализация по необходимости

Иронично, “Большой ИИ” способствует возникновению духа независимости среди конечных пользователей, засасывая все компоненты компьютера – особенно DRAM – которые в противном случае пошли бы к “обычным” потребителям.

В результате многие представляют себе будущее, где закрытые “глобальные ресурсы ИИ” доступны через тонкие клиенты и развивают растущий интерес к поддержанию своей существующей техники.

Нападение ИИ на цепочки поставок технологий также заставило поставщиков технологических услуг повысить цены за последние 3-6 месяцев, либо потому, что небольшие компании действительно сжимаются нехваткой оборудования, либо просто потому, что ИИ.

Это привело к росту интереса к самообслуживанию и на месте – включая самообслуживание сетей машинного обучения.

Я сам попал в это недавно, перейдя на локальное хранение LAN для фотографий и видео, а также резервных копий файлов. Для первого я использовал бесплатную и открытую платформу Immich multi-платформенного медиа-сервера, giúpая мне уйти от роста цен (и других проблем) облачных провайдеров хранения данных:

Бесплатная платформа Immich может хранить ваши медиа на вашем оборудовании и держать их в ваших собственных каналах. В данном случае я также использую Immich на Docker, чтобы обслужить мой NVIDIA 3090 GPU по LAN, где хранятся фотографии и видео, так что более мощный GPU может обрабатывать любую тяжелую обработку изображений/видео.

Бесплатная платформа Immich может хранить ваши медиа на вашем оборудовании и держать их в ваших собственных каналах. В данном случае я также использую Immich на Docker, чтобы обслужить мой NVIDIA 3090 GPU по LAN, где хранятся фотографии и видео, так что более мощный GPU может обрабатывать любую тяжелую обработку изображений/видео.

Если мой собственный опыт является хоть каким-то представительным указанием, вайб-кодирование – в настоящее время проклято во многих онлайн-сообществах – подпитывает эту волну независимости (даже если это может угрожать открытым репозиториям, на которые оно опирается).

Например, сетевое взаимодействие всегда было моей слабой стороной в вычислениях, поэтому помощь ИИ была необходима для меня, чтобы запустить безопасный VPS, чтобы поддержать ряд новых самообслуживаемых услуг.

Таким образом, “Большой ИИ” можно рассматривать как эмансипирующий “маленький ИИ”; поэтому, возможно, мы можем рассматривать текущий рост гипермасштабных, гипер-оцененных компаний ИИ как необходимое, но только переходное состояние до более демократического и эмансипированного общества ИИ, которое откажется от поиска рва, поиска арендной платы корпораций, как отработанных ускорителей – как и разрушение доткомов в 2000 году оставило после себя эксплуатируемую инфраструктуру, которая глубоко ускорит веб долго после того, как компании, которые заплатили за нее, рухнули.

Эра соответствия

Ну, это, вероятно, не повторится в этот раз.

Даже если мы действительно склонны формировать некоторого рода пост-рвовое сообщество, регулирование вокруг ИИ, в сочетании с текущей глобальной тенденцией к проверке возраста, вероятно, предвидит и блокирует эти пути развития.

Якорь для предотвращения “тени ИИ-экономики” – регулирование. Уже центральные репозитории, такие как GitHub и Hugging Face, часто требуют онлайн-авторизации перед тем, как разрешить пользователям клонировать репозитории локально, в зависимости от настроек репозитория.

Следовательно, механизмы уже существуют для более широкого контроля ИИ-рамок, чем это сейчас практикуется; и воля к увеличению такого надзора теперь консолидируется из отдельных инициатив правительства в глобальный импульс.

Итак, если рыночные силы и изобретательность движения FOSS удалят трение из случайной развертки ИИ, дорожные блоки, кажется, вернутся в форме требований к управлению: требования к соответствию, которые, хотя и обременительны, являются полезными для компаний, но, возможно, не для отдельных лиц – подобно трению, которое было добавлено к потребительским онлайн-системам оплаты с момента золотого века PayPal в 2000-х годах.

Независимо от того, потратил ли Meta 2 миллиарда долларов на лоббирование контроля уровня ОС из-за его значительных инвестиций в ИИ или из-за его интересов в сборе данных, результат поддержки крупными технологическими компаниями контроля возраста заключается в том, что “локальный ИИ” может стать так же регулируемым, как вещество класса А; и, подобно тому, как DMCA был спроектирован для криминализации намерения rather, чем любого конкретного механизма нарушения копирайта, международные регулирования ИИ могли, в таком сценарии, сделать все несовместимое использование машинного обучения преступлением, при очень небольшой стоимости (в плане активного надзора).

Это могло показаться чрезмерно-дистопийным взглядом год назад – но это было до того, как Калифорния и systemd поддержали идею аппаратного контроля возраста, в настоящее время видимую многими как прокси для запрета на онлайн-анонимность в стиле КПК.

Заключение

Итак, хотя правовое и законодательное фоновое регулирование, возможно, готовится, чтобы завоевать ИИ в высокорегулируемое пространство, так что случайные пользователи не смогут “сварить свой собственный” больше, чем они могут вырастить или ферментировать регулируемые вещества без разрешения, сектор исследований сохраняет более оптимистичную позицию – что ИИ станет демократизированной и полезной силой в более широком обществе, чем только последователи наиболее популярного закрытого поставщика дня.

Многое зависит от того, как будет выглядеть ситуация после того, как пузырь ИИ лопнет – по крайней мере, в той степени, в которой поставщики либо консолидируются, либо рынок оседает в долгосрочную балканизацию – что, вероятно, потребует более мягкого регулирующего подхода.

 

Опубликовано впервые в среду, 1 апреля 2026 года

Писатель о машинном обучении, специалист в области синтеза человеческих изображений. Бывший руководитель исследовательского контента в Metaphysic.ai.