Anderson의 관점
AI가 결국 모아트 밖에서 번성할 수 있을까?

빅 AI의 비용과 제한,以及 하드웨어 비용에 대한 영향은 사용자가 자체 시스템을 구축하도록 강요하고 있습니다. 그리고 규제의 증가로 인해 ‘암흑 AI 경제’를 폐쇄할 위협을 받고 있습니다.
의견 과학 연구 논문에서 나타나는 많은 ‘gotchas’ 중 하나는 논문에서 다루는 문제가 이미 다른 곳에서 해결되었으며, 새로운 연구의 기여는 부차적이거나 점진적이라는 것입니다.
이것은 여러 가지 이유로 발생할 수 있습니다. 연구자들은 양자 도약을 기대했지만, 부분적인 도약만을 얻었을 수 있습니다. 문제의 이전 해결책은 새로운 제안보다 더 많은 자원을 필요로 할 수 있습니다. 또는 프로젝트의 목표가 완전히 실패했지만, 학술 연구의 ‘출판 또는 폐지’ 문화로 인해 팀이 그것을 발표하도록 강요받았을 수 있습니다(종종 포털의 가장 바쁜 발행일 중 하나에서).
기계 학습 문헌에서 jedoch, 비교적 새로운 이유가 더 빈번하게 등장하고 있습니다. 즉, 제공된 기능 또는 기능이 현재 닫힌 소스, API에 바인딩된 포털을 통해만 사용할 수 있음을 의미합니다.
오늘 아침 나는 이러한 논문 중 하나를 고려했습니다. 중국 대학과 Amazon 간의 협력으로, 확산 기반 이미지 편집 시스템에서 반복적으로 발생하는 객체 제거 실패 문제를 해결했습니다. 이는 종종 대상 공간을 유사한 객체로 다시 채우는 경우가 많습니다:

가장 왼쪽에 원본 이미지가 있습니다. 그 오른쪽에는 AI에 이미지의 어느 부분을 제거해야 하는지 알려주는 빨간 분할 마스크가 있습니다. 다음으로 ‘우리의’ 이미지는 성공적인 객체 제거 접근 방식을 보여줍니다. 나머지 두 이미지는 객체를 제거하는 대신 버스를 삽입하는 유사한 시스템을 보여줍니다. 출처
위의 예에서, 중앙 이미지는 새로운 접근 방식이 버스를 성공적으로 제거하고 합리적인 배경을 삽입하는 것을 보여줍니다. 반면에 이전 두 가지 방법(가장 왼쪽의 두 이미지는 각각 버스를 제거하지만, 이미지를 다시 삽입합니다.
Gotcha!
이 도전의 이유와 관련된 내용은 나중에 다루도록 하겠습니다(그리고 이는 흥미로운 주제입니다). 그 후에 나는 새로운 논문에서 经典的な ‘gotcha’를 읽게 되었습니다. 즉, 저자들은 비싼, 독점적인 시스템이 이미 이 작업을 매우 신뢰성 있게 수행할 수 있다는 것을 인정합니다. 이는 Adobe Firefly를 포함한 다른 닫힌 소스 시스템을 사용한 몇 년의 경험에서 알 수 있습니다:
‘[확산 기반] 방법은 종종 제거된 대상 객체之后에 의도하지 않은 객체를 삽입하여 컨텍스트적으로 일관되지 않은 [결과]를 생성합니다.
‘반면, 최근의 닫힌 소스 멀티모달 모델인 ChatGPT 및 Nano Banana는 객체 제거에서 더 강력하지만, 큰 매개 변수 수와 높은 계산 오버헤드를 가지고 있어 에지 디바이스에서 실用的 배포를 방해합니다.
‘따라서, 우수한 제거 성능을 제공하면서도 낮은 추론 지연 시간과 훨씬 더 적은 매개 변수를 갖는 전용 객체 제거 모델을 개발하는 것이 매우 필요합니다.’
이 설명은 기술적인 장벽에 집중하지만, 닫힌 소스 아키텍처인 ChatGPT 및 Nano Banana가 로컬 설치에 전혀 사용할 수 없다는 명백한 사실을 생략합니다. 이러한 시스템의 논쟁의 여지가 있는 자료 생성 능력은 지난 1년 동안 추가적인 공공 정당성을 제공했습니다. 그러나 이러한 포털은 주로 상업적 Imperative로 인해 독점적입니다.
본질적으로, 새로운 논문은 대상 문제가 상업적 시스템에서 해결되었지만, 이것이 우리에게는 관련이 없을 수 있음을 의미합니다. 즉, 우리는 ‘실제 세계’에서, 즉 오픈 소스 시스템에서 이를 해결하는 방법을 배우야 합니다. 즉, 이러한 시스템을 현실적으로 로컬에 설치할 수 있든 없든 관계없이 말입니다.
병렬 개발
그러나, 유료 시스템에 의존하지 않고, 독점적 제약으로 인해 아니라, 필요한 GPU 컴퓨팅이 로컬 설정에서 현실적으로 지속할 수 있는 것보다 더 많은 것을 요구하기 때문에, 이미 해결된 문제를 해결할 필요가 있을까요? 대부분의 새로운 ‘오픈’ 논문과 코드 저장소에는 A100 클러스터와 같은-training/inference 설정이 포함되어 있으며, 엄청난 자원 요구를 가집니다.
그렇다면, 모든 이러한 예정된, 경제를 파괴하는 AI 데이터 센터가 최종적으로 온라인으로 가면, 무엇을 달성할 것입니까? 일반인의 두려움과 엘리트의 희망은 모두, 직업을 대체하고, 구독 비용을 지속적으로 증가시키고, 서비스 수준을 낮추는, 모아트가 있는, 독점적인 시스템을 상상합니다. 초기 VC 자본이 3-5년을 기다려야 operationalize할 수 있기 때문에.
그러나 문헌에서 나타나는 증가하는 추세는 대안적인 미래를 지원하는 것으로 보입니다. 즉, 새로운 글로벌 AI 데이터 센터 공급이 사용자 구성 및 사용자 정의 시스템을 위한 원시 컴퓨팅을促進하는 것입니다. 이는 ChatGPT 및 Adobe Firefly와 같은 기념비적인 ‘블랙 박스’ 프레임워크의 요구를 충족시키는 것이 아닙니다.
표면 마찰
r/stablediffusion에서 복잡한, Patreon-mined 원격 GPU 워크스루를 살펴보면, 모든 것이 현재 불가능해 보입니다. 모델은 상수적으로 목표를 변경하고 있습니다. 로컬에 배포하기 어렵고, 사용자 친화적인 프레임워크에서조차 어려울 수 있습니다. 일반적으로 마찰의 양은 지오크 하비스트와 기업만이 참여하는 것으로 보입니다. 즉, 직접 AI에 참여하지는 않지만, 자체 로컬 시스템을 개발하고 유지하고자 하는 것입니다.
그러나 지난 30년 동안, 개방적이고 민주적인 단순화 및 대중화를 위해巨大한 수요가 있는 모든 기술은 그것을 얻었다는 것으로 보입니다. 가장 많이 확산된 솔루션은 상업적 시스템과 오픈 소스 대안 및 이니셔티브 간의 긴장에서 나타나는 경우가 많습니다.
인터넷 연결, 콘텐츠 관리 시스템 및 블로그 프레임워크와 같은 전문적인 ‘nerd’ 영역은, 인터넷 보안, 사진 및 미디어 관리와 함께, 복잡함에서 단순성과 유용성으로 진화했습니다.
따라서 나중에 AI 풍경은 현재의 선도적인 AI 시장 리더가 선호하는 것보다 더 다양하고, 실제로 경쟁하는 더 작은 플레이어가 많을 것입니다.
필요에 의한 자기 실제화
모순적으로, ‘빅 AI’는 사용자 끝에서 독립적인 정신을 크게 기여하고 있습니다. 즉, 데이터 센터에 모든 컴퓨터 구성 요소를 흡수함으로써, ‘일반’ 소비자에게 갈 수 있었을 것입니다. 특히 DRAM이 그렇습니다.
결과적으로, 많은 사람들이 닫힌 소스 ‘글로벌 AI’ 자원을薄 클라이언트를 통해 액세스하고, 기존 장비를 유지하는 데 관심이 증가하는 미래를 상상하고 있습니다. 또한 AI의 기술 공급망 공격으로 인해 기술 서비스 제공업체가 가격을 인상했습니다. 이는 작은 회사들이 실제로 하드웨어 가뭄으로 인해 압박을 받고 있거나, 단순히 AI를 이유로 가격을 인상했습니다.
이로 인해 자체 호스팅 및 온프레미스에 대한 관심이 증가했습니다. 즉, 기계 학습 네트워크를 자체 호스팅하는 것입니다.
최근에 나는 이것에 매료되었습니다. 즉, 로컬 LAN 저장소를 사용하여 사진 및 비디오를 저장하고, 파일 백업을 수행했습니다. 전자는 무료 및 오픈 소스 Immich 멀티 플랫폼 미디어 서버를 사용하여, 가격 인상(및 다른 문제)를 피할 수 있었습니다. 즉, iCloud 및 기타 클라우드 저장소 제공업체의:

무료 Immich 플랫폼은 미디어를 장비에 유지하고, 개인 채널에 비공개로 유지할 수 있습니다. 이 경우, 나는 또한 Docker에서 Immich를 사용하여 로컬에 저장된 사진 및 비디오에서 NVIDIA 3090 GPU를 LAN으로 제공하여, 더 강력한 GPU가 AI 기반 이미지/비디오 처리를 처리할 수 있도록 합니다.
만약 내 경험은 어떤 대표적인 표시라면, 바이브 코딩은 이 독립성의 물결을促しています. 이는 현재 저주를 받고 있는 많은 온라인 커뮤니티에서입니다.
예를 들어, 네트워킹은 항상 내 컴퓨팅의 약점이었습니다. 따라서 AI 지원은 내가 보안 VPS를 실행하고, 새로운 자체 호스팅 서비스를 지원하는 데 필수적이었습니다.
이러한 방식으로, ‘빅 AI’는 ‘작은 AI’를 강화하는 것으로 보입니다. 따라서 현재의 초대형, 초가치 AI 회사들의 상승을, 더 민주적인 사용자 중심의 AI 사회가 등장하기 전에 필요한 nhưng 과渡적인 상태로 간주할 수 있습니다. 즉, 모아트를 추구하는, 임대료를 추구하는 기업을 사용한 후 버린 로켓 부스터와 마찬가지로, 2000년의 닷컴 버블이 남겨진 인프라를 남겨두었던 것과 마찬가지로, 이는 웹을 가속화하는 데 크게 기여할 것입니다.
준수 시대
그러나, 이것은 이번에는 반복되지 않을 것입니다.
규제와 함께 AI를围繞하는 현재의 글로벌 추세는 이러한 개발의 경로를 예상하고 차단할 것입니다. ‘암흑 AI 경제’를 방지하는錨은 규제입니다. 이미 GitHub 및 Hugging Face와 같은 중앙 저장소는 로컬에서 저장소를 복제하기 전에 온라인 로그인을 요구하는 경우가 많습니다. 저장소 설정에 따라 다르지만 말입니다.
따라서, AI 프레임워크를보다 넓게監視하는 메커니즘은 이미 존재합니다. 또한 이러한 監視를 증가시키는 의지는 현재 개인 정부 이니셔티브에서 글로벌 추세로 통합되고 있습니다.
따라서, 시장의 힘과 FOSS 운동의 지성이 캐주얼 AI 배포의 마찰을 제거할 경우, 규제 요구 사항의 형태로 장애물이 다시 나타날 것입니다. 즉, 회사들에게는 번거로울 수 있지만, 개인들에게는 아닐 수 있습니다. 이는 관리 요구 사항입니다. 소비자 수준의 온라인 결제 시스템에 추가된 마찰과 유사합니다. 즉, 2000년대의 페이팔의 황금 시대와 같습니다.
Meta가 OS 수준의 연령 제어를 위해 20억 달러를 로비에 사용한 이유는, 그들의 상당한 AI 투자 때문인지, 또는 데이터 수집에 대한 관심 때문인지, 결과는 큰 기술이 연령 제어를 지원하는 것입니다. 즉, ‘로컬’ AI는 마약과 같은 물질로 규제될 수 있습니다. 그리고, DMCA는 의도를 범죄화하기 위해 설계되었던 것과 마찬가지로, 국제적인 AI 규제는, 거의 هیچ 監視 비용 없이, 기계 학습의 모든 非 준수 사용을 불법 행위로 만들 수 있습니다.
이것은 1년 전에는 너무 비관적인 시각으로 보였을 것입니다. 그러나, 캘리포니아와 시스템드가 하드웨어 수준의 연령 확인 아이디어를 지지한 이후로, 이러한 시각은 달라졌습니다. 이는 현재 많은 사람들에게 중국식 온라인 익명성 금지의 대리인으로 보입니다.
결론
따라서, 규제 배경은, 사용자가 더 이상 ‘자체적으로’ 만들 수 없도록, 규제된 공간으로 AI를 협조할 준비가 된 것처럼 보입니다. 즉, 규제된 물질을 성장시키거나 발효시키는 것과 마찬가지로, 사용자들은 허가 없이 규제된 물질을 사용할 수 없습니다.
그러나 연구 부문은, AI가 더 민주적인 힘으로 발전하여, 현재의 가장 인기 있는 닫힌 소스 제공업체의 추종자들보다 더 넓은 사회에서 유익한 힘으로 발전할 것이라는 더 낙관적인 입장을 유지하고 있습니다.
모든 것은 AI 버블이 터진 후의 잔해의 처분에 달려 있습니다. 즉, 제공업체가 통합되거나, 시장의 안정화가 장기적인 분열화를 요구하는지 여부에 달려 있습니다. 이는 더 부드러운 규제 접근을 필요로 할 것입니다.
처음으로 2026년 4월 1일 수요일에 게시되었습니다.












