Ângulo de Anderson
O AI Eventualmente Vai Prosperar Fora do Fosso?

Os custos e restrições do Big AI, bem como sua influência nos custos de hardware, estão forçando os usuários a construir seus próprios sistemas – assim como a regulamentação em ascensão ameaça fechar essa “economia de sombra do AI”.
Opinião Entre os muitos “gotchas” que aparecem em artigos de pesquisa científica, um dos mais frequentes é que o problema abordado no artigo já foi resolvido em outro lugar, e que a contribuição da nova pesquisa é meramente incidental ou incremental.
Isso pode acontecer por várias razões: os pesquisadores estavam esperando um salto quântico, mas obtiveram um salto quase-quântico; que as soluções anteriores do problema eram mais intensivas em recursos do que a nova oferta; ou simplesmente que os objetivos do projeto falharam completamente, mas a cultura “publicar ou perecer” da pesquisa acadêmica forçou a equipe a lançá-lo de qualquer forma (freqüentemente enterrado entre a avalanche de um portal de publicação mais movimentado).
Na literatura de aprendizado de máquina, no entanto, um motivo relativamente novo e não apologetic está se tornando mais frequente: que o recurso ou funcionalidade oferecida está disponível apenas por meio de portais fechados e vinculados a APIs.
Eu estava considerando um desses artigos esta manhã – uma colaboração entre universidades chinesas e Amazon, abordando o problema recorrente de falha na remoção de objetos em sistemas de edição de imagens baseados em difusão, que frequentemente simplesmente “repetem” o espaço-alvo com um objeto semelhante em vez disso:

À esquerda está a imagem original; à direita, a máscara de segmentação vermelha que diz ao AI qual parte da imagem remover; em seguida, ‘Ours’, mostra uma abordagem de remoção de objeto bem-sucedida – e as duas imagens restantes mostram sistemas semelhantes que, em vez de remover o ônibus, apenas inserem um ônibus diferente em vez disso. Fonte
No exemplo acima, a imagem central mostra a nova abordagem removendo com sucesso o ônibus e colocando um plano de fundo plausível, vs. os dois métodos anteriores (as duas imagens mais à esquerda), que cada um remove o ônibus, mas então coloca um diferente ônibus de volta na imagem!
Gotcha!
Deixando de lado os porquês e como desse desafio para outra hora (e é um assunto interessante tema ), eu então encontrei um clássico “gotcha”, lendo o novo artigo: a concessão dos autores de que sistemas proprietários caros podem realizar essa tarefa de forma bastante confiável – algo que eu sei, de alguns anos de uso do Adobe Firefly no Photoshop, entre outros sistemas de código fechado:
‘[Métodos baseados em difusão] frequentemente alucinam, inserindo objetos não intencionais após remover os alvos, levando a resultados inconsistentes [contextualmente].
‘Por outro lado, modelos multimodais recentes de código fechado, como ChatGPT e Nano Banana, embora sejam mais poderosos na remoção de objetos, envolvem grandes contagens de parâmetros e alta sobrecarga computacional, dificultando sua implantação prática em dispositivos de borda.
‘Portanto, é bastante necessário desenvolver um modelo de remoção de objeto dedicado que não apenas permita um desempenho de remoção superior, mas também desfrute de baixa latência de inferência e significativamente menos parâmetros.’
Essa explicação, concentrando-se nos obstáculos técnicos, elide o fato óbvio de que arquiteturas de código fechado, como ChatGPT e Nano Banana, não estão disponíveis para instalação local. Embora a capacidade desses sistemas de produzir material controverso tenha emprestado justificativa pública adicional para sua gestão nos últimos anos, portais desse tipo são proprietários principalmente devido a imperativos comerciais.
Essencialmente, o novo artigo implica que, embora o problema-alvo seja resolvido em sistemas comerciais, isso pode ser irrelevante para o resto de nós, que precisam aprender a resolver isso no “mundo real” – ou seja, em sistemas de código aberto, sejam eles instalados localmente ou não.
Desenvolvimento Paralelo
No entanto, por que resolver um problema que ainda depende de um sistema pago, não devido a restrições proprietárias, mas porque o cálculo de GPU necessário excede o que qualquer configuração local pode sustentar realisticamente? A maioria desses novos artigos e repositórios de código “abertos” apresenta configurações de treinamento/inferência com demandas de recursos escandalosas, como clusters de A100s.
Bem, isso depende do que você acha que todos esses centros de dados de IA pendentes e quebradores de economia vão cumprir quando finalmente entrarem em operação. Medos comuns e esperanças das elites imaginam sistemas proprietários de nível ChatGPT deslocando empregos, aumentando constantemente os custos de assinatura e reduzindo os níveis de serviço, para satisfazer o capital de venture inicial que teve que esperar 3-5 anos para ser operacionalizado.
Mas uma tendência crescente na literatura parece estar apoiando um futuro alternativo, e o espírito “faça-você-mesmo” de muitas comunidades online, como o subreddit r/stablediffusion, que atualmente tem 920.000 usuários, e que há muito tempo proibiu postagens relacionadas a sistemas de geração de imagem/vídeo de código fechado.
Nesse futuro alternativo, o novo suprimento global de centros de dados de IA facilitará o cálculo bruto para sistemas configurados pelo usuário, definidos pelo usuário, em vez de atender às demandas de monumentais “caixas pretas” como ChatGPT e Adobe Firefly.
Atrito de Superfície
Olhando para as complexas e minadas por Patreon, as orientações de GPU remoto no r/stablediffusion, tudo parece impossível no momento: os modelos estão constantemente mudando os objetivos com cada atualização; eles são difíceis de implantar localmente, mesmo nas estruturas mais fáceis e amigáveis; e, em geral, a quantidade de atrito envolvido sugere uma busca estritamente para geeks e para essa cepa mais aventureira de empresas não diretamente envolvidas em IA, mas que desejam desenvolver e manter seus próprios sistemas locais, em vez de alugar essas capacidades.
No entanto, nos últimos trinta anos, toda tecnologia em que havia uma grande demanda por simplificação e commoditização democráticas e abertas tendeu a obtê-la, com as soluções mais difundidas geralmente emergindo das tensões entre sistemas comerciais e alternativas e iniciativas de código aberto.
Buscas que eram antes enclaves especializados de “nerd”, como conexões de internet, sistemas de gerenciamento de conteúdo e estruturas de blog, bem como segurança da internet, fotografia e gerenciamento de mídia, todos evoluíram de complexidade confusa para simplicidade e utilidade.
Portanto, o paisagem de IA posterior pode ser mais variada e cheia de jogadores menores e genuinamente competitivos do que os atuais líderes de mercado de IA possam preferir.
Auto-Realização, Por Necessidade
Ironicamente, o “Big AI” está contribuindo muito para um espírito emergente de independência entre os usuários finais, sugando para seus centros de dados todos os componentes de computador – especialmente DRAM – que de outra forma teriam ido para “consumidores comuns”.
Consequentemente, muitos estão imaginando um futuro em que recursos de “IA global” de código fechado sejam acessados por meio de clientes finos subpotentes e desenvolvendo um interesse crescente em manter seus equipamentos existentes.
O ataque da IA às cadeias de suprimento de tecnologia também fez com que os provedores de serviços de tecnologia aumentassem seus preços nos últimos 3-6 meses, seja porque as empresas menores estão sendo genuinamente espremidas pela seca de hardware, ou apenas porque a IA.
Isso levou a um crescimento do interesse em hospedagem própria e em local – incluindo hospedagem de redes de aprendizado de máquina.
Eu mesmo me envolvi nisso recentemente, migrando para armazenamento de LAN local para fotos e vídeos, bem como backups de arquivos. Para o primeiro, eu estou usando o servidor de mídia multiplataforma gratuito e de código aberto Immich, ajudando-me a me afastar dos aumentos de preços (e outros problemas) de provedores de armazenamento em nuvem como o iCloud:

A plataforma Immich gratuita pode manter sua mídia em seu equipamento e privada para seus próprios canais. Nesse caso, eu também uso Immich no Docker para servir meu GPU NVIDIA 3090 sobre a LAN para onde as fotos e vídeos são salvos, para que o GPU mais potente possa lidar com qualquer processamento de imagem/vídeo pesado.
Se a minha própria experiência for algum indicador representativo, programação de vibração – atualmente amaldiçoada em muitas comunidades online “puras” – está alimentando essa onda de independência (mesmo que possa ameaçar os repositórios de código aberto em que se baseia).
Por exemplo, a rede sempre foi meu ponto fraco na computação, então a assistência da IA foi essencial para eu configurar um VPS seguro para apoiar uma série de novos serviços de hospedagem própria.
Dessa forma, o “Big AI” está, de certa forma, capacitando o “pequeno AI”; portanto, talvez possamos considerar o atual aumento de empresas de IA de hipercala e hiper-valorizadas como um estado necessário, mas apenas transitório, antes de uma sociedade de IA mais democrática e capacitada para os usuários emergir, descartando corporações que buscam moat e rent-seeking como foguetes de estágio gasto – assim como o estouro das ponto-com em 2000 deixou infraestrutura explorável que aceleraria profundamente a web muito depois que as empresas que pagaram por ela haviam colapsado.
A Era da Conformidade
Bem, isso provavelmente não vai se repetir desta vez.
Even que sejamos inclinados a formar algum tipo de sociedade de ex-moat marginal, a regulamentação em torno da IA, combinada com a tendência global atual em direção à verificação de idade, parece provável que antecipe e bloqueie esses caminhos de desenvolvimento.
O ancoradouro para prevenir uma “economia de sombra do AI” é a regulamentação. Já, repositórios centrais como GitHub e Hugging Face frequentemente exigem login online antes de permitir que os usuários clonem repositórios localmente, dependendo das configurações do repositório.
Portanto, os mecanismos já existem para impor o monitoramento de estruturas de IA de forma mais ampla do que a prática atual; e a vontade de aumentar essa supervisão agora está se consolidando de iniciativas governamentais individuais em um impulso global.
Então, se as forças do mercado e a ingenuidade do movimento FOSS removerem o atrito do deploy casual de IA, obstáculos parecem estar retornando na forma de exigências de conformidade: demandas de conformidade que, embora onerosas, são dignas para as empresas, mas talvez não para os indivíduos – semelhantes ao atrito que foi adicionado aos sistemas de pagamento online de consumo desde a idade de ouro do PayPal nos anos 2000.
Se a Meta gastou US$ 2 bilhões em lobby para controle de idade no nível do sistema operacional devido ao seu investimento significativo em IA, ou seus interesses na coleta de dados, o resultado do apoio da grande tecnologia para o controle de idade é que a “IA local” pode se tornar tão regulamentada quanto uma substância de classe A; e, assim como a DMCA foi projetada para criminalizar intenção em vez de qualquer mecanismo específico de evasão de direitos autorais, as regulamentações internacionais de IA poderiam, nesse cenário, tornar todo uso não conforme de aprendizado de máquina um ato ilegal, a um custo muito baixo (em termos de supervisão ativa).
Isso pode ter parecido uma visão excessivamente distópica um ano atrás – mas isso foi antes que Califórnia e systemd apoiassem a ideia de verificação de idade no nível do hardware, atualmente vista por muitos como um proxy para uma proibição da anonimidade online.
Conclusão
Então, enquanto o pano de fundo jurídico e legislativo está se preparando, talvez, para cooptar a IA em um espaço altamente regulamentado, de modo que os usuários casuais não possam “fabricar sua própria” IA mais do que podem cultivar ou fermentar substâncias regulamentadas sem permissão, o setor de pesquisa mantém sua postura mais otimista – de que a IA se tornará uma força democratizada e benéfica na sociedade mais ampla do que apenas os adeptos do provedor de código fechado mais popular do dia.
Muito depende da disposição dos escombros após a bolha de IA estourar – pelo menos na medida em que os provedores ou consolidam ou o mercado se estabelece em uma longa balkanização – o que provavelmente exigiria uma abordagem regulatória mais suave.
Publicado pela primeira vez na quarta-feira, 1 de abril de 2026












