인곡지λŠ₯

ν΄λΌμš°λ“œ μ—μ΄μ „νŠΈμ˜ μ €λ ΄ν•œ μ‹œλŒ€κ°€ 쑰용히 λλ‚˜κ³  μžˆλ‹€

mm

변경이 적용될 예정인 당일, 앤트로픽은 이를 취소했다. 몇 주 동안 앤트로픽의 청구 페이지는 강제적인 전환을 명시하고 있었다: 2026년 6월 15일부터 시작하여 클라우드 에이전트 SDK(헤드리스 claude -p 명령, 깃허브 액션 통합, 서브스크립션을 통해 인증하는 제3자 앱)를 통해 실행되는 모든 작업은 더 이상 플랜의 사용량 제한에서 끌어오지 않고 별도의 월간 크레딧에서 끌어오게 되며, 이는 표준 API 요금으로 청구된다. 그런 다음 15일, 페이지 상단에 새로운 문장이 나타났다: “아래에 설명된 클라우드 에이전트 SDK 사용량 변경을暂停합니다. 현재는 아무런 변경도 없습니다.”

클라우드 자동 작업을 실행한다면,暂时적으로 안도할 수 있다. 그러나 나는 아직 안도하지 않을 것이다.

중단된 것은 무엇인가

앤트로픽이 중단한 계획은 깨끗한 분리였다. 상호작용 사용(터미널, IDE, 채팅 창에서 사용)은 이전과 같이 서브스크립션에서 끌어온다. 자동 사용은 분리된다: 에이전트 SDK, 헤드리스 명령, 깃허브 액션, 제3자 하네스. 이 버킷은 미터링된 크레딧으로 이동할 예정이었다: 프로에 경우 월 20달러, 맥스 5x에 경우 월 100달러, 맥스 20x에 경우 월 200달러, 사용자당, 롤오버는 없다. 크레딧이 소진되면, 추가로 API 요금을 지불하거나 에이전트가 다음 사이클까지 중지된다.

이 수학이 중요한 이유는 클라우드 서브스크립션이 이 산업에서 좋은 거래 중 하나인 이유는 API와 달리 미터링하지 않기 때문이다. 코드 편집기 Zed는 서브스크립션이 에이전트 사용량을 약 15~30배까지 보조하고 있다고 추정했다. 오퍼스 에이전트를 충분히 실행하면 200달러 플랜이 수천 달러의 토큰과 같은 작업을 수행한다. 이 갭은 솔로 운영자가 항상 켜져 있는 파이프라인을 연결하고 파산하지 않는 이유이다. 6월 15일 변경은 앤트로픽이 이 갭을 닫기 시작한 것이다.

그런 다음 갭을 닫지 않았다. 페이지는 현재 회사가 “클라우드 서브스크립션으로 사용자를 더 잘 지원하기 위해 플랜을 업데이트하는 중”이라고 말하고 있으며, 변경 사항이 적용되기 전에 공지할 것이라고 한다. 이것은 지연이다. 이것은 반전이 아니다.

보조금은 지속될 수 없었다

앤트로픽이 실제로 말한 것을 읽고 방향을 놓치기 어렵다. 4월에 클라우드 코드 책임자 보리스 체르니는 명확하게 말했다: “우리의 서브스크립션은 이러한 제3자 도구의 사용 패턴에 대해 설계되지 않았다.” 그는 용량을 “신중하게 관리하는 리소스”라고 불렀고, 제품과 API의 고객을 우선시하며, 회사가 지속 가능한 성장을 관리하여 고객을 장기적으로 서비스하기 위해 의도적으로 성장을 관리하고 싶다고 말했다. 이것은 제3자 자동 사용이 비용으로 가격을 매길 의도하는 회사의 언어이다. 6월 분리는 그 메커니즘이었다. 중지는 메커니즘이 준비되지 않았음을 의미한다.

타이밍이 나머지를 채운다. 앤트로픽은刚刚 공개 시장에 대한 기밀 서류를 제출했다. 공개 시장에 나아가는 회사는 사용자가 $200 플랜에 대해 수천 달러의 컴퓨팅을 끌어오고, 그에 대한 비용을 청구할 방법이 없으며, 영원히 그렇게 유지하는 항목을 원하지 않는다. 그리고 더广泛한 시장은 이미 같은 방향으로 이동하고 있다: 깃허브 코파일럿은 몇 주 전에 토큰 기반 청구를 도입했고, 가장 무거운 사용자에게 가격 충격을 주었다. 전체 산업은 보조금으로 제공된 것을 다시 가격 매기고 있으며, 사용량 기반 가격 매기기 방향으로의 전환은 단일 회사보다 크다. 앤트로픽이 이번에는 깜짝 놀랐지만, 계속 놀라지 않을 것이다.

앤트로픽의 eigenen 도움말 페이지도 당신에게 이것이 어디에 도달하는지 말해준다. 팀을 위한 지침에 따르면, “공유 프로덕션 자동화를 실행하는 사람은 클라우드 플랫폼을 API 키와 함께 사용해야 하며, 예측 가능한 비용을 지불할 수 있다”고 한다. 다시 읽어보라. 서브스크립션은 생산 시스템의 기반이 될 의도는 없었다. 그것은 램프이다.

운영자가 무엇을 해야 하는가

이것은 패닉할 이유가 아니며, 클라우드를 떠날 이유도 아니다. 나는 클라우드를 선택하여 전체 운영을 구축하고, 선택은 여전히 유효하다. 그러나 운영자의 판독은 특정하다: 제어할 수 없는 보조금은 건설할 수 있는 기반이 아니다.

따라서 실제 숫자를 알아야 한다. 자동 사용량을 한 주간 끌어오고, API 요금으로 가격을 매겨서 파이프라인이 실제로 실행하는 비용을 확인하라. 만약答案이 “괜찮다”면, 아무런 행동도 취할 필요가 없다. 만약答案이 당신을 놀라게 한다면, 당신은 누군가가 차이를 먹고 있다는 것을 알아챈 것이다 — 그리고 당신은 아직 고칠 시간이 있으므로, 청구 이메일에서 알아차리지 않았기 때문에.

그런 다음 미터가 이미 켜져 있는 것처럼 설계하라. 공격적으로 캐싱하라. 저렴한 작업을 더 저렴한 모델로 라우팅하고, 오푸스를 필요로 하는 단계에만 사용하라. API 가격에서 수익성이 있는 파이프라인을 구축하라, 왜냐하면 그것이 결국 지불할 가격이기 때문이다. 다음 발표의 다음 버전에 의해 타격을 받는 운영자는 그 갭에默默히 의존하고, 숫자를 실행하지 않은 사람이다.

그것이 모든 것이 돌아가는 원리이다. 앤트로픽이 언제든지 다시 가격을 매길 수 있는 저렴한 서브스크립션의 레버리지를 얻었다. 그러나 당신이自己的 시스템에 구축한 레버리지 — 캐싱, 라우팅, 작업을 토큰 비용과 상관없이 저렴하게 만드는 아키텍처 — 는 당신의 것이다.

Alex McFarland은 인곡 μ§€λŠ₯의 μ΅œμ‹  κ°œλ°œμ„ νƒκ΅¬ν•˜λŠ” AI μ €λ„λ¦¬μŠ€νŠΈμ΄μž μž‘κ°€μž…λ‹ˆλ‹€. κ·ΈλŠ” μ „ μ„Έκ³„μ˜ μˆ˜λ§Žμ€ AI μŠ€νƒ€νŠΈμ—…κ³Ό μΆœνŒλ¬Όλ“€κ³Ό ν˜‘λ ₯ν–ˆμŠ΅λ‹ˆλ‹€.