Connect with us

Сервисы децентрализованной инференции в стиле PiedPiper для ИИ?

Взгляд Anderson

Сервисы децентрализованной инференции в стиле PiedPiper для ИИ?

mm
AI-generated image (GPT-1.5): An esoteric visualization of an AI mesh network. Inset: publicity photo from HBO's 'Silicon Valley', via https://www.hollywoodreporter.com/tv/tv-reviews/silicon-valley-review-1250092/

Имеет ли ‘BitTorrent для ИИ’ реальную возможность?

 

Мнение Только что вчера я закончил пересмотр увлекательного и язвительного сатирического сериала Майка Джаджа Долина силиконовая – в котором группа социально-ограниченных гениев-геек пытается создать ‘новый интернет’ под названием PiedPiper, через сеть-меш установленную на всех мобильных телефонах – и меня заинтересовало увидеть, как сообщество HN взаимодействует с новым предложением подобного рода.

Eigen Labs’ DarkBloom находится где-то между эгалитарной концепцией децентрализованной сети-меш для инференции ИИ и мотивами криптовалютного майнинга, позволяя владельцам систем Apple Silicon Mac превратить свое оборудование в узел инференции:

Из раздела 'Заработок' на сайте DarkBloom пользователи могут выбрать, какое оборудование они хотят сдать в аренду, и какие модели ИИ они хотят поддержать. Источник: https://darkbloom.dev/

Из раздела ‘Заработок’ на сайте DarkBloom пользователи могут выбрать, какое оборудование они хотят сдать в аренду, и какие модели ИИ они хотят поддержать. Источник

Система в настоящее время集中ится на текстовых моделях, таких как агентная Trinity Mini (3B) и Cohere Transcribe, хотя также предлагает разнообразные модели генерации изображений, такие как FLUX 2 Klein 4B:

Диапазон моделей, из которых 'арендодатель' может выбрать для сдачи в аренду, вместе с прогнозируемыми ежемесячными доходами.

Диапазон моделей, из которых ‘арендодатель’ может выбрать для сдачи в аренду, вместе с прогнозируемыми ежемесячными доходами.

Пользователи, участвующие в схеме, якобы могут заработать достаточно денег за месяц предоставления инференции, чтобы регулярно добавлять новый Mac к постоянно растущей цепочке, пока, в теории, они не смогут заработать полноценную ферму инференции.

По сути, схема такого рода, которая действительно была бы популярной (в настоящее время у нее есть проблема холодного старта), могла бы вернуть энтузиастов-любителей в поисках оборудования, как в последнем большом криптовалютном буме (и последующем крахе).

Не так быстро

Однако для маленьких игроков этот корабль может уже уйти. Кроме апокалиптической потребности ИИ в ОЗУ, спрос на глобальную инфраструктуру центров данных, оснащенных ИИ, продолжает повышать стоимость оборудования и услуг для обычного потребителя, который ранее смог монополизировать ОЗУ для криптовалютного майнинга благодаря периферийному характеру деятельности, а также из-за неопределенности регулирования, которая сдерживала деловые интересы в криптовалютах.

Хотя супер-дешевый MacBook Neo появился как альтернатива постоянно растущему оборудованию, его мобильный чип A18 и 8 ГБ видеопамяти не ставят его в серьезную конкуренцию как машину инференции.

Но даже если конечный пользователь не стремится создать полноценную ферму инференции, а просто хочет сдать в аренду свою текущую неиспользуемую емкость M[n], потенциальные доходы кажутся значительными, если проблема холодного старта быстро решится, и если платформа начнет рекламировать себя как нечто большее, чем любопытный эксперимент в потенциальном спросе.

Инференс по-другому

Хотя несколько комментаторов признали демократию в стиле PiedPiper/Torrent в схеме DarkBloom, задачи инференции не так легко делятся, как фрагментация файла фильма на несколько хэшированных срезов, чтобы его можно было позже собрать в клиенте торрента.

Модель DarkBloom не предлагает, чтобы процессор M[n] участника обрабатывал x% задачи инференции. В основном только несколько фреймворков или методологий могут достичь такого рода использования нескольких GPU на одной задаче инференции, включая TensorRT LLM от NVIDIA, который использует параллелизм конвейера; и шардированную инференцию от DeepSpeed, которая использует параллелизм модели (MP).

Скорее, ваш Mac, оснащенный DarkBloom, загрузит и запустит одну из перечисленных моделей и выполнит 100% инференции для платящих пользователей, с конечным шифрованием и с запросами, расшифровываемыми только на аппаратно-аттестованных узлах, что означает, что поставщики не смогут прочитать данные во время выполнения. Сама нагрузка будет состоять из одной или нескольких текстовых инференций или хотя бы одного полного изображения.

Неясно, насколько обширной будет одна пользовательская сессия; как оно есть, хоббиисты ИИ привыкли получать GPU через фермы инференции, такие как RunPod; хотя может потребоваться некоторое время, чтобы получить желаемый GPU на пиковой загрузке, пользователь может монополизировать его столько, сколько позволяет сессия, если она не истечет.

Итак, возможно, что один платящий пользователь может оказаться использующим возможности одного арендованного Mac с серией M для ИИ на очень долгой сессии, если нет логистического или комплаентного преимущества в смене клиентов между запросами.

Mac был выбран для этого подхода, видимо, потому, что существует только ограниченное количество возможных технических конфигураций для участника, и поэтому легко присвоить подходящую модель клиенту.

Кроме того, Mac, способные внести вклад в сеть DarkBloom, имеют аппаратный безопасный анклав, который гарантирует стену между пользователем и поставщиком.

Это все факторы, которые не так легко рационализировать в более общих, самодельных настройках, и на сотни или тысячи известных ноутбуков и настольных компьютеров с Windows и Linux, доступных за последние 6-7 лет.

Однако должно быть очевидно, что гораздо больший пул оборудования, не являющегося Mac, может вместить огромный спрос, если их разнообразные характеристики можно рационализировать, вместо того, чтобы – как в DarkBloom – ехать на ограниченных наборах спецификаций Apple, что делает бизнес-предложение простым, и архитектурный подход (предположительно) гораздо проще.

Юридический надзор?

Возможно, самой большой проблемой, с которой сталкивается ‘демократическое’ решение такого рода, является закрытый характер предложенного процесса; правительства по всему миру в настоящее время занимаются новым законодательством, которое фактически положит конец анонимности в интернете где бы оно ни было учреждено, и явно не находятся в про-частном настроении в этот период.

Следовательно, перспектива случайной инференции ИИ, проводимой без фильтров, проверок или балансов, через распределенную сеть (если можно назвать DarkBloom так – это больше рынок инференции), кажется, иронично, отдаленной.

Возможно, что DarkBloom или другие последующие схемы инференции-меш должны согласиться на бэкдоры, которые эффективно ограничат конфиденциальность хозяина, который не сможет видеть работающие задачи клиентов; вместо этого возвращенные данные инференции будут доступны через структуры посредников государственных агентств, сохраняя все инференции аудиторными.

Предположительно, если всплеск новых законов предлагающих проверки идентификации на уровне ОС когда-либо получат широкое распространение, такие меры могут стать излишними. Но без них, принимая во внимание текущую атмосферу, сеть в стиле DarkBloom, скорее всего, будет считаться подобной ‘ай-нету’, где могут происходить незаконные действия на основе ИИ в секрете.

Тесты на разделение

На сегодняшний день было удивительно мало реальных попыток сделать то, что подразумевает система ‘в стиле PiedPiper’; сама по себе DarkBloom находится на одном из крайних полюсов, распределяя полные задачи на отдельные машины, а не пытаясь фрагментировать их через сеть, в то время как большинство производственных систем просто избегают эту проблему, сохраняя инференцию на одном хосте.

Однако есть несколько проектов, которые представляют нечто немного ближе к ‘общей выполнению’.

Petals, который активно описывает себя как ‘сеть в стиле BitTorrent’, распределяет блоки трансформеров через несколько интернет-узлов, передавая промежуточные состояния между ними:

Типичный рабочий процесс Petals, где один запрос инференции маршрутизируется через несколько удаленных узлов GPU, каждый из которых содержит подмножество слоев модели; в отличие от DarkBloom, выполнение фрагментируется через сеть, с промежуточными состояниями, передаваемыми между независимо эксплуатируемыми узлами, увеличивая задержку и уязвимость на каждом хопе, приближаясь к истинной системе в стиле сетки.

Типичный рабочий процесс Petals, где один запрос инференции маршрутизируется через несколько удаленных узлов GPU, каждый из которых содержит подмножество слоев модели; в отличие от DarkBloom, выполнение фрагментируется через сеть, с промежуточными состояниями, передаваемыми между независимо эксплуатируемыми узлами, увеличивая задержку и уязвимость на каждом хопе, приближаясь к истинной системе в стиле сетки. Источник

Hivemind экспериментирует с подобной координацией и маршрутизацией между равными, хотя в интересах обучения моделей, а не инференции из уже обученных моделей; и Lattica фокусируется на базовом сетевом слое, необходимом для того, чтобы такие системы были жизнеспособными:

Схематическое представление Lattica, показывающее нижний уровень peer-to-peer-субстрата, который обрабатывает NAT-траверс, распределение контента и координацию на основе DHT, с шардированной инференцией, возникающей только как один из возможных слоев приложения; в отличие от DarkBloom или Petals, Lattica не определяет саму систему инференции, но предоставляет сетевые и синхронизационные примитивы, необходимые для ее построения.

Схематическое представление Lattica, показывающее нижний уровень peer-to-peer-субстрата, который обрабатывает NAT-траверс, распределение контента и координацию на основе DHT, с шардированной инференцией, возникающей только как один из возможных слоев приложения; в отличие от DarkBloom или Petals, Lattica не определяет саму систему инференции, но предоставляет сетевые и синхронизационные примитивы, необходимые для ее построения. Источник

Все три этих модели приближаются к сетевой идее, но за счет задержки, нестабильности и уязвимости.

Напротив, exo сохраняет инференцию внутри локального кластера, используя быстрые соединения для разделения рабочих нагрузок между GPU, не полагаясь на публичный интернет. На практике такая настройка ведет себя меньше как распределенная сетка и больше как одна расширенная машина, хотя есть явная возможность расширить этот подход на более широкую сеть:

Вид кластера из exo, показывающий небольшое кольцо локальных машин Apple Silicon, совместно размещающих одну модель, с параллелизмом конвейера или тензорным шардированием, распределяющим слои между узлами; в отличие от систем на основе WAN, exo полагается на быстрые локальные соединения, эффективно превращая несколько устройств в одну составную машину инференции.

Вид кластера из exo, показывающий небольшое кольцо локальных машин Apple Silicon, совместно размещающих одну модель, с параллелизмом конвейера или тензорным шардированием, распределяющим слои между узлами; в отличие от систем на основе WAN, exo полагается на быстрые локальные соединения, эффективно превращая несколько устройств в одну составную машину инференции. Источник

Наконец, несколько часто цитируемых подходов вообще не решают проблему инференции: теперь уже почтенный (2016) FedAvg от Google; выход MIT 2018 года SplitNN; и австралийское предложение 2020 года SplitFed, занимаются распределенным обучением или обменом данными с сохранением конфиденциальности, а не обслуживанием живых запросов инференции.

Поскольку обучение – это гораздо более ресурсоемкая перспектива, чем инференция, любые сети, которые окажутся способными распределить такую нагрузку эффективно, через кластеры или узлы, могут иметь непропорциональную долю интереса хоббиистов и бизнеса позже.

Заключение

Поскольку большая часть технологий в Долине силиконовой была диким изобретением, мы не знаем, была ли PiedPiper действительно управляема хэшами (т.е. делила и распределяла данные на части, в стиле торрента), или ‘решала’ задачу или даже сессию на любом узле в любое время, что делает DarkBloom.

Однако текущая спешка предоставить оборудование для обучения и инференции на уровне центра данных указывает на то, что сектор поставок либо ожидает обслужить всех, как в стиле RunPod, либо готовится к наиболее прибыльному корпоративному уровню поставок – заманчивая перспектива, подорванная общей отсутствием защитных рвов в развертывании ИИ.

Если инференция-меш станет реальностью, разумно ожидать, что среди первых попыток использовать ее будут инкумбенты, такие как OpenAI и Anthropic, которые либо могут развернуть специальные системы внутри существующей базы установленных приложений, либо сотрудничать над открытыми системами, которые легко устанавливать (поскольку компании такого размера и охвата имеют деньги и мотивацию для упрощения сложных установок такого рода).

Что касается того, может ли появиться более демократическая, пользовательская сетка, настоящий аналог ИИ для BitTorrent – ряд факторов выступает против нее.

Во-первых, текущая глобальная кампания против шифрования и анонимности может удалить или подорвать многие из механизмов, которые делают системы, такие как BitTorrent, анонимными, такие как конечное шифрование и VPN. Как только ‘общие’ зашифрованные потоки, скрывающие такие протоколы, будут открыты для инспекции, новые слои надзора и запрета становятся возможными, и это может подорвать привлекательность системы в стиле DarkBloom.

Во-вторых, возникающие или предлагаемые правила против ‘злоупотребления’ ИИ или против анонимной работы открытых фреймворков означают, что стоимость соблюдения – незначительная на корпоративном уровне – скорее всего, снимет с рынка всех более мелких игроков.

Наконец – сила крупного игрока сектора, чтобы Принять, Расширить и Уничтожить (EEE, как Facebook и Twitter, возможно, сделали с более ад хок интернет-сообществами), означает, что текущие крупные игроки могут операционализировать и оптимизировать модель сетки к своей выгоде, на рынке, где конечные пользователи почти полностью нетерпимы к любой трению в принятии.

 

Опубликовано впервые в четверг, 16 апреля 2026 г.

Писатель о машинном обучении, специалист в области синтеза человеческих изображений. Бывший руководитель исследовательского контента в Metaphysic.ai.