마이크로소프트와 우버, 비상 브레이크 가동: AI 정액 요금제의 비밀스러운 종말
4개월 만에 예산이 바닥났습니다: AI 에이전트가 지출을 급증시키는 방법
숨겨진 AI 빙산: 이러한 막대한 비용은 주요 공급업체들에 의해 은폐되고 있다
인공지능이 기업의 일상적인 생산 공정에 도입되면서 전례 없는, 그리고 종종 예측 불가능한 비용 폭증이 동반되고 있습니다. 초기 시범 단계에서는 보조금이 지원되는 정액 요금과 관리 가능한 테스트 실행 덕분에 어느 정도 이점을 누렸지만, 독립적으로 작동하는 에이전트형 AI 시스템으로의 전환은 기존 청구 모델의 치명적인 약점을 드러내고 있습니다. 사용량에 따라 비용을 지불하는 방식은 예산에 시한폭탄과 같은 존재로 드러나고 있습니다.
마이크로소프트나 우버 같은 거대 IT 기업조차 AI 예산을 대폭 삭감하거나 몇 달 만에 크레딧을 소진하는 것을 보면 한 가지 분명한 사실을 알 수 있습니다. 바로 현재의 가격 모델이 경제적 위험을 공급자에서 구매자로 완전히 전가한다는 것입니다. 이 글에서는 사용량 기반 AI 요금 청구 방식의 다섯 가지 주요 구조적 위험을 분석하고, 숨겨진 막대한 인프라 비용을 밝히며, 패러다임 전환이 불가피한 이유를 제시합니다. 최고재무책임자(CFO)와 IT 의사결정권자에게 중요한 것은 단순히 자원 사용에 대한 비용만 지불하는 방식에서 벗어나 실질적이고 측정 가능한 비즈니스 가치를 보상하는 성과 중심의 계약으로 전환하는 것입니다.
이와 관련된 내용:
AI 기반 요금 청구의 심각한 실패 – 토큰 기반 가격 모델이 기업에 막대한 재정적 손실을 초래하는 이유
다른 사람의 실험 비용은 누가 부담하는가?
보조금 지원 AI 구독 시대는 끝났습니다. 이제 남은 것은 냉혹한 현실입니다. 마이크로소프트는 개발자 1인당 월 500달러에서 2,000달러에 달하는 비용 때문에 수천 건의 클로드 코드(Claude Code) 라이선스를 내부적으로 취소했습니다. 우버는 약 5,000명의 개발자가 클로드 코드를 집중적으로 사용한 후 2026년 AI 예산을 단 4개월 만에 모두 소진했습니다. 마이크로소프트 소유의 깃허브(GitHub)는 2026년 6월 1일부로 모든 코파일럿(Copilot) 구독 서비스를 종료하고 깃허브 AI 크레딧(GitHub AI Credits)이라는 토큰 기반 크레딧 시스템으로 전환했습니다. 이 세 가지 사건은 기술적 실패가 아니라 환상의 종말을 의미합니다.
전 세계 기업들은 구조적 재평가에 직면하고 있습니다. 인공지능(AI) 업계는 그동안 시범 프로젝트와 제한적인 사용 사례를 기반으로 제품 가격을 책정해 왔습니다. 하지만 독립적으로 계획, 반복, 실행하는 에이전트 시스템으로의 전환이 가속화되면서 AI 관련 지출이 폭발적으로 증가하고 있으며, 이는 기존 기업 예산으로는 감당하기 어려운 수준입니다. 가트너에 따르면, 전 세계 AI 지출은 2026년에 2조 5900억 달러에 달할 것으로 예상되며, 이는 전년 대비 47% 증가한 수치입니다. 이제 문제는 기업들이 AI에 투자할 것인가가 아니라, 수익성이 없을 경우 누가 그 비용을 부담할 것인가입니다.
소비 청구의 환상
토큰 기반 요금제는 처음에는 공정한 모델처럼 보입니다. 실제로 사용한 만큼만 비용을 지불하면 되니까요. 하지만 이러한 논리는 근본적인 구조적 비대칭성을 감추고 있습니다. 기존 기업 예산은 사용자 라이선스, 서버 용량, 거래량과 같은 예측 가능한 투입 요소에 기반합니다. 반면 토큰 기반 요금제는 사용자 수에 비례하는 것이 아니라 각 사용자 상호작용의 깊이와 복잡성에 따라 확장됩니다. 간단한 질문을 하는 사용자는 수십 개의 토큰을 소비하는 반면, 50페이지 분량의 계약서를 분석하는 동일한 사용자는 수만 개의 토큰을 소비합니다.
비선형성이 바로 진짜 문제입니다. 시범 단계에서는 일반적으로 열정적인 얼리어답터들이 AI 도구를 체계적이고 최적화된 방식으로 활용합니다. 하지만 실제 운영 단계에서는 직원들이 직관적으로 시스템을 사용하며, 긴 대화, 방대한 문서 업로드, 반복적인 작업, 복잡하고 다단계적인 추론 과정을 거칩니다. 경험적 관찰에 따르면 시범 단계와 실제 운영 단계 사이의 자원 소모량은 보통 3~5배, 극단적인 경우에는 10배까지 차이가 납니다. 따라서 이사회와 최고재무책임자(CFO)가 AI 투자 승인을 위해 처음 사용했던 비용 예측은 구조적으로 무의미합니다.
공급자가 구매자에게 전가하는 5가지 위험 범주
토큰 가격 모델은 체계적으로 다섯 가지 위험 범주를 공급자에서 구매 회사로 이전합니다. 이는 우연의 일치도 아니고 시장 실패도 아니며, 바로 비즈니스 모델 자체의 특징입니다.
예산 리스크는 근본적으로 계약상의 문제에서 비롯됩니다. 기업은 단위 비용을 기준으로 연간 예산을 책정하는데, 공급업체는 언제든 이를 조정할 수 있기 때문입니다. 우버 사례가 이를 완벽하게 보여줍니다. 우버는 사전 확장 단계의 비용 모델을 기반으로 2026년 전체 AI 예산을 산정했습니다. 그런데 클로드 코드(Claude Code)를 사용하는 개발자 비율이 회사 전체에서 32%에서 84%로 증가하자, 예산은 그 해 4개월 만에 소진되었습니다.
수용 위험은 특이한 논리를 따릅니다. 토큰 카운터는 구현된 워크플로가 실제로 가치를 제공하는지 여부와 관계없이 계속 작동합니다. 잘못된 답변에 10만 토큰을 소모하는 모델과 올바른 답변에 10만 토큰을 사용하는 모델의 비용은 동일합니다. MIT 데이터에 따르면 모든 기업의 GenAI 시범 사업 중 95%가 측정 가능한 투자 수익을 달성하지 못하는 현실에서, 이러한 청구 모델의 품질에 대한 무관심은 사소한 문제가 아니라 문제의 핵심입니다.
에이전트 기반 AI 시스템의 역동성을 고려할 때 위험 예측은 특히 중요해집니다. 고정된 기술 비용에 익숙했던 CFO들은 이제 지출이 변동성이 크고 예측하기 어렵다는 사실을 깨닫고 있습니다. 에이전트 기반 AI 쿼리는 에이전트 간 통신, 평가기, 합성기, 재시도 루프 등으로 토큰 소모량이 급증하기 때문에 표준 LLM 호출보다 비용이 5배에서 25배 더 많이 듭니다. 프로그래밍 에이전트는 하루에 7백만 개의 토큰을 소비할 수 있는 반면, 데이터 입력 에이전트는 최대 2,500만 개의 토큰을 소비할 수 있습니다. 골드만삭스는 이러한 변화를 수치화하여 AI 에이전트가 2030년까지 전 세계 토큰 수요를 24배 증가시킬 수 있다고 예측했습니다.
규제 산업에서 거버넌스 위험은 특히 심각합니다. 토큰 기반 모델은 모든 API 호출 시 제3자 제공업체의 추론 인프라를 통해 회사 데이터를 처리합니다. 금융 서비스 제공업체, 의료 회사, 보험 회사의 경우 이는 사용량 증가에 따라 감사 위험과 규정 준수 노력이 커지는 문제로 이어집니다. GDPR은 기업이 개인 데이터를 처리하는 모든 AI 시스템에 대해 데이터 보호 영향 평가를 수행하도록 요구합니다. 새로운 토큰 사용량이 발생할 때마다 회사의 데이터 보호 경계에 영향을 미칠 수 있습니다. 토큰 사용량이 많을수록 투명성 없이 회사 밖으로 유출되는 데이터가 많아집니다.
결과 위험은 가장 논의가 적은 부분이지만 구조적으로 가장 중요한 범주입니다. 토큰 기반 가격 모델은 가치가 아닌 소비량을 측정합니다. AI 프로그램이 측정 가능한 손익 효과를 창출하든, 실패한 기업용 생성형 AI 시범 사업 목록에 합류하든 관계없이 제공업체는 동일한 보상을 받습니다. RAND Corporation의 데이터에 따르면 모든 AI 프로젝트의 80.3%가 의도한 비즈니스 가치를 제공하지 못합니다. 2025년에는 기업의 42%가 대부분의 AI 이니셔티브를 중단했는데, 이는 전년 대비 17% 증가한 수치입니다. Gartner는 생성형 AI를 도입하는 기업의 65%가 2026년까지 예산 예상치를 초과할 것으로 추정합니다. 이 모든 것을 토큰 기반 청구 모델과 함께 고려해 보면, 소비량 기반 청구는 구조적으로 기업의 손해를 감수하는 도박이라는 것이 분명해집니다.
숨겨진 빙산: 상징적인 가격 외에 또 무엇이 지불되고 있는가
눈에 보이는 비용은 실제 비용의 극히 일부에 불과한 경우가 많습니다. 2026년까지의 다양한 산업 분야 데이터를 살펴보면, AI 에이전트를 실제 운영 환경에서 실행하는 데 필요한 인프라(거버넌스, 모니터링, 규정 준수 및 통합) 비용이 추론 비용 자체보다 2~5배 더 비싼 것으로 나타났습니다. 명확하게 정의된 워크플로우 에이전트 하나를 개발하는 데 4만 달러에서 7만 달러가 소요되며, 월 운영 비용은 3,200달러에서 1만 3천 달러에 달합니다. 이 비용의 대부분은 토큰화되지 않습니다.
관찰 및 모니터링에만 해도 에이전트당 연간 6,000달러에서 50,000달러가 소요됩니다. 전 세계 기업 AI 에이전트 지출은 2026년에 2,019억 달러에 이를 것으로 예상되지만, 에이전트 제품 자체 시장 규모는 90억~110억 달러에 불과한 것으로 추산됩니다. 에이전트 제품 매출 1달러당 약 23달러에 달하는 인프라, 통합, 컨설팅, 내부 개발 비용이 발생하는데, 이는 어떤 벤더의 재무제표에도 반영되지 않습니다. AI 지출 증가에 대해 보고하는 CFO들은 바로 이러한 현상을 지적합니다. 즉, 표면적인 지출만 주목받고, 그 이면에 숨겨진 실제 비용 항목은 AI 지출로 분류조차 되지 않는다는 것입니다.
또 다른 구조적 요인은 소위 에이전트 확산입니다. 새로운 에이전트가 추가될 때마다 토큰 소모 일정에 행이 하나씩 추가되지만, 그에 따른 수익은 보장되지 않습니다. 토큰 가격 모델은 에이전트를 효율적이고 전략적으로 사용할 유인을 제공하지 않기 때문에 에이전트가 내부적으로 무분별하게 증식하게 됩니다. 그 결과, 서로 통신하는 병렬적이고 통제되지 않은 AI 워크로드가 발생하여 토큰이 계속해서 늘어납니다.
🤖🚀 관리형 AI 플랫폼: UNFRAME로 더욱 빠르고 안전하며 스마트한 AI 솔루션을 경험하세요
여기서는 기업이 맞춤형 AI 솔루션을 신속하고 안전하게, 그리고 진입 장벽 없이 구현하는 방법을 배우게 됩니다.
관리형 AI 플랫폼은 인공지능을 위한 모든 것을 포함하는, 걱정 없는 솔루션입니다. 복잡한 기술, 값비싼 인프라, 그리고 장기간의 개발 과정을 직접 처리할 필요 없이, 전문 파트너로부터 필요에 맞춘 완벽한 솔루션을 단 며칠 만에 제공받을 수 있습니다.
주요 장점을 한눈에 살펴보세요:
⚡ 신속한 구현: 아이디어 구상부터 바로 사용 가능한 애플리케이션 개발까지 몇 달이 아닌 며칠 만에 완료됩니다. 즉각적인 부가가치를 창출하는 실용적인 솔루션을 제공합니다.
🔒 최고의 데이터 보안: 귀하의 민감한 데이터는 안전하게 보호됩니다. 당사는 제3자와 데이터를 공유하지 않고 안전하고 법규를 준수하는 데이터 처리를 보장합니다.
💸 재정적 위험 없음: 결과에 대해서만 비용을 지불합니다. 하드웨어, 소프트웨어 또는 인력에 대한 높은 초기 투자 비용이 완전히 사라졌습니다.
🎯 핵심 사업에 집중하세요: 귀사가 가장 잘하는 일에 집중하십시오. AI 솔루션의 기술 구현, 운영 및 유지 관리는 저희가 모두 담당합니다.
📈 미래 지향적이고 확장 가능: 귀사의 AI는 귀사와 함께 성장합니다. 지속적인 최적화 및 확장성을 보장하고, 새로운 요구 사항에 맞춰 모델을 유연하게 조정합니다.
자세한 내용은 여기에서 확인하세요:
토큰 대신 결과물을 제공하는 방식: 이것이 바로 AI 계약의 이상적인 모습입니다
기존 소프트웨어 세계가 이미 오래전에 이러한 모델을 극복한 이유는 무엇일까요?
현재 진행 중인 AI 가격 논쟁을 소프트웨어 산업의 역사적 맥락에서 살펴보는 것은 의미 있는 일입니다. 기업용 소프트웨어는 지난 수십 년 동안 순전히 사용량 기반 모델에서 공급업체가 비용을 부담하는 시스템 및 SLA 모델로 꾸준히 진화해 왔습니다. ERP 시스템, CRM 플랫폼, 클라우드 인프라 등 그 어떤 공급업체도 소프트웨어의 컴퓨팅 시간 사용량에 따라 비용을 받는 것이 아닙니다. 보상은 가용성, 용량 및 정의된 서비스 수준에 따라 결정됩니다.
AI 제공업체들이 이러한 관행에서 벗어난 이유는 자체 비용 구조가 고객에게 전가하는 것과 동일한 토큰 미터 방식에 기반하기 때문입니다. 대다수의 AI 제공업체는 OpenAI, Anthropic, Mistral과 같은 동일한 기본 모델 제공업체로부터 모델을 구매하고 변동 비용을 고객에게 전가합니다. 다른 소프트웨어 계층과 다른 점은 한계 비용이 0이 아니라는 것입니다. 사용자 한 명, 요청 한 건, 모델 버전 하나 추가될 때마다 제공업체는 더 많은 비용을 부담하게 됩니다. 이러한 딜레마는 현실이지만, 제공업체가 기업 측에 체계적으로 위험을 전가하는 대신 스스로 해결해야 할 책임을 면제하는 것은 아닙니다.
고전적인 SaaS 논쟁과의 유사점은 시사하는 바가 큽니다. SaaS가 온프레미스 소프트웨어를 대체했을 때, 사용자 수 기반 모델이 표준으로 자리 잡았습니다. 즉, 사용자 한 명당 하나의 가격이 적용되는 방식이었죠. 하지만 AI는 이러한 모델을 뒤흔듭니다. 작업에 따라 사용자 한 명이 기존 방식보다 10배에서 10만 배까지 더 많은 리소스를 소비할 수 있기 때문입니다. 이러한 위험을 전적으로 구매자에게 전가하는 것은 해결책이 될 수 없습니다. 공급자의 인센티브와 구매자의 성과가 다시 한번 일치하는 상업적 구조가 필요합니다.
성과 중심 가격 책정은 대안적인 계약 패러다임이다
AI를 위한 성과 중심 가격 모델은 할인 시스템이나 마케팅 약속이 아닙니다. 이는 근본적으로 다른 상업 구조를 나타냅니다. 즉, 공급자는 특정 워크플로에서 정의된 비즈니스 성과가 확인되었을 때, 솔루션당 또는 연간 단위로 보상을 받으며, 프로세스 과정에서 소모된 토큰에 따라 보상받는 것이 아닙니다.
이러한 접근 방식은 구조적으로 점점 더 중요해지고 있습니다. 앤드리슨 호로위츠는 이미 2024년 말에 AI가 소프트웨어 시장에 강요하는 세 가지 주요 변화를 지적했습니다. 소프트웨어가 노동력으로 변모하고 있고, 사용자 라이선스가 회계 단위로서의 정당성을 잃어가고 있으며, 가변 비용 예측이 점점 더 어려워지고 있다는 것입니다. 데카곤과 같은 AI 기반 기업들은 이미 소비 기반과 결과 기반 요소를 결합한 하이브리드 모델로 대응하고 있습니다. 구조적 추세는 분명합니다. AI가 고객 서비스 티켓, 코드 라인 수, 문서 검토와 같은 측정 가능한 활동을 대체함에 따라 자연스러운 회계 단위는 자원 투입이 아닌 결과가 될 것입니다.
성과 기반 가격 모델과 토큰 모델을 구조적으로 구분 짓는 것은 위험 분산 방식입니다. 토큰 모델에서는 구매자가 실패의 모든 위험을 감수하고, 공급자는 결과와 관계없이 수익을 얻습니다. 반면 성과 기반 모델에서는 공급자가 플랫폼 효율성을 구축하여 변동성을 흡수할 수 있어야 하며, 서비스가 원하는 효과를 내지 못할 경우 수익을 잃을 위험을 감수해야 합니다. 이는 토큰 모델에는 구조적으로 부족한 품질 향상 동기를 즉각적으로 부여합니다. 그러나 이러한 모델을 경제적으로 지속 가능하게 운영하려면 공급자가 내부 비용을 효과적으로 관리해야 하는데, 현재 대부분의 토큰 공급자는 이 요건을 충족하지 못하고 있습니다.
성과 모델에 대한 비판론자들은 이 모델이 효율성 향상을 공급자에게 유리하게 만든다고 주장합니다. AI 공급자가 개선된 모델을 통해 동일한 결과를 얻는 데 더 적은 자원을 사용한다면, 수익 증대로 이득을 보는 것은 기업이 아니라 공급자라는 것입니다. 이러한 비판은 타당하며, 성과 모델이 자동으로 공정하지 않다는 것을 보여줍니다. 성과의 정확한 정의, 측정 방법, 그리고 가격 책정 방식에 따라 기업이 실제로 얻는 이익이 결정됩니다.
다음 협상: 모든 CFO와 CIO가 요구해야 할 사항은 무엇인가?
협상력은 구매자에게 있습니다. 적어도 모든 계약 갱신 협상에서는 그렇습니다. 현재 토큰 계약을 보유하고 있는 기업들은 다음 갱신 협상에서 단순히 백만 토큰당 가격만을 따지는 것이 아니라, 훨씬 더 심층적인 구조화된 질문을 던져야 합니다.
핵심 질문은 "이 시스템이 제대로 작동하지 않을 경우 내가 무엇을 부담해야 하는가?"입니다. 실패 위험을 분담하려 하지 않는 공급업체는 구매자 측 이사회 및 CFO와는 구조적으로 다른 이해관계를 가지고 있습니다. 이는 단순히 선의의 문제가 아니라, 인센티브 구조의 문제입니다. 두 번째 핵심 질문은 데이터 주권에 관한 것입니다. 모든 API 호출 시 회사 데이터가 회사 경계를 벗어나는가? 금융, 의료, 보험과 같은 규제 산업의 경우, 이는 선택 사항이 아닌 GDPR, SOC 2, HIPAA에 따른 기본적인 법적 원칙입니다.
세 번째 핵심 요구 사항은 측정 가능성입니다. 기업의 49%는 AI 투자에 대한 투자 수익률(ROI)을 정확하게 계산할 수 없다고 답했는데, 이는 클라우드 제공업체, GPU 서비스, API 제공업체, SaaS 플랫폼 등 다양한 곳에 비용이 분산되어 있고 표준화된 청구 방식이 없기 때문입니다. 측정 기준이 없으면 기업은 성과 모델을 협상하거나 어떤 워크플로가 실제로 긍정적인 ROI를 창출하는지에 대한 정보에 입각한 결정을 내릴 수 없습니다. 따라서 AI 비용을 측정할 수 있는 조직의 역량은 모든 체계적인 가격 협상의 필수 조건입니다.
가트너는 또한 에이전트형 AI 프로젝트의 40% 이상이 실제 비용과 에이전트형 확장의 복잡성 때문에 상용화 단계에 도달하기 전에 포기될 것이라고 예측합니다. 오늘날 탄탄한 ROI 프레임워크 없이 에이전트형 워크플로우를 위한 토큰 계약을 체결하는 기업은 값비싼 실험만 하고 포기하는 바로 그 40%에 속할 위험이 있습니다.
구조적 변화는 불가피하지만, 그 속도는 구매자에 따라 결정됩니다
인공지능(AI) 산업은 필연적으로 상업적 성숙 단계에 접어들고 있습니다. 보조금 단계에서 지속 가능한 가격 모델로 나아가는 길은 바로 현재 드러나고 있는 위기들을 거쳐야만 합니다. 세계 최대 AI 인프라 투자 기업 중 하나인 마이크로소프트는 오픈AI에 130억 달러를 투자했지만, 경쟁사의 코딩 도구 가격을 검토한 후 구매하지 않기로 결정했습니다. 이는 특정 제품뿐 아니라 전체 가격 모델에 강력한 상징적 신호를 보내는 것입니다.
소프트웨어 산업의 통합 논리는 결과 중심 모델이 중장기적으로 우세할 것임을 시사합니다. 왜냐하면 이러한 모델만이 공급업체의 인센티브를 비즈니스 성과와 일관되게 일치시키기 때문입니다. 현대 기업 소프트웨어의 다른 모든 영역은 이미 이러한 발전을 거쳤습니다. AI 또한 예외는 아닐 것입니다. 유일한 질문은 이러한 성숙 과정이 시장 메커니즘에 의해 주도될 것인지, 아니면 계약 갱신 시마다 "결과가 나타나지 않으면 내가 지불하는 비용은 얼마인가?"라는 간단한 질문을 던지는 비즈니스 리더 세대에 의해 주도될 것인지입니다
기업들이 현재 인공지능(AI) 계약 협상에서 내리는 결정은 AI 투자가 실질적인 성과로 이어질지, 아니면 위험을 성공적으로 아웃소싱한 벤더의 제품 개발 로드맵에 계속 자금을 지원할지를 결정짓습니다. 이 차이는 기술적인 문제가 아니라 상업적인 문제입니다. 그리고 그 차이는 다음 계약 체결 순간부터 시작됩니다.
🎯🎯🎯 데이터 기반 B2B 산업 허브를 준사내 솔루션으로 활용
Xpert.Digital은 Konrad Wolfenstein 이 이끄는 데이터 기반 B2B 산업 허브입니다. 이 회사는 산업 파트너를 위한 외부 솔루션 역할을 하며, 마케팅, 콘텐츠 및 영업 분야의 운영 격차를 해소하여 고객 측의 추가 리소스 투입을 방지합니다.
자세한 내용은 여기에서 확인하세요:
귀사의 글로벌 마케팅 및 사업 개발 파트너
☑️ 저희 업무 언어는 영어 또는 독일어입니다
☑️ 신규 기능: 모국어로 소통하세요!
저와 저희 팀은 여러분의 개인 자문가로서 기꺼이 도움을 드릴 준비가 되어 있습니다.
여기 있는 문의 양식을 작성 wolfenstein@xpert.digital.하시거나 +49 7348 4088 965 로 전화 주시면 연락 드리겠습니다. 제 이메일 주소는 입니다
저는 우리의 공동 프로젝트를 기대하고 있습니다.


