«Токенмаксинг» — это была Amazon? Почему корпорация растратила полмиллиарда долларов в токенах: управляемый ИИ как защитный механизм
Предварительная версия Xpert
Available in 27 languages 📢
Предпочитаю Xper.Digital в GoogleⓘОпубликовано: 1 июня 2026 г. / Обновлено: 1 июня 2026 г. – Автор: Konrad Wolfenstein

«Токенмаксинг» — это была Amazon? Почему корпорация потратила полмиллиарда долларов в токенах: управляемый ИИ как защитный механизм — Изображение: Xpert.Digital
«Максимизация токенов» обходится в миллионы: секретный тренд в области искусственного интеллекта, который ставит на колени Amazon, Uber и другие компании
Ловушка в 500 миллионов долларов: почему автономные агенты искусственного интеллекта разоряют корпоративные бюджеты
Один месяц, неограниченный доступ к моделям ИИ и невероятный счет в 500 миллионов долларов: недавно раскрытый инцидент из корпоративного мира демонстрирует огромные финансовые риски искусственного интеллекта при его использовании без четких инструкций. В то время как так называемый «агентный ИИ» все чаще берет на себя сложные задачи автономно, такие явления, как «максимизация токенов», приводят к экспоненциальному росту затрат за кулисами — зачастую без какой-либо ощутимой добавленной стоимости для компании. Даже такие технологические гиганты, как Amazon, Uber и Meta, уже на собственном горьком опыте убедились, что неконтролируемое внедрение ИИ поглощает бюджеты в рекордно короткие сроки. Этот случай проливает свет на, пожалуй, самый дорогостоящий провал ИИ в корпоративной истории и наглядно демонстрирует, почему «управляемый ИИ» — систематический контроль, управление и ограничение рабочих процессов ИИ — больше не является необязательной функцией ИТ, а абсолютной стратегической необходимостью для каждой компании.
Когда отсутствие управления обходится дороже, чем сама модель ИИ
Где-то в бухгалтерии крупной корпорации финансовая команда всё ещё обрабатывает события прошедшего месяца. Ни квартального отчёта, ни годового плана — одного месяца оказалось достаточно, чтобы перевести примерно 500 миллионов долларов на платформу Claude компании Anthropic, и никто не смог заморозить расходы. Не потому, что компания не смогла установить лимит. А просто потому, что никто этого не сделал.
Этот случай, впервые описанный Axios 28 мая 2026 года и подтвержденный консультантом по ИИ, в настоящее время считается крупнейшим публично известным случаем месячных убытков, понесенных корпорацией из-за перерасхода средств на ИИ, в истории компаний. Это не единичный случай на периферии отрасли — это симптом структурной слабости, от которой в настоящее время страдают многие крупные компании: сочетание безудержного использования агентного ИИ и почти полного отсутствия управляемых структур ИИ.
Подробности дела: 500 миллионов долларов без ограничения суммы
Название компании, о которой идёт речь, не было указано ни Axios, ни цитируемым консультантом. На платформе X циркулировали предположения об Amazon, но без каких-либо доказательств. Известно лишь, что корпорация предоставила своим сотрудникам неограниченный доступ к платформе Claude компании Anthropic — без ограничений на расходы, без квот на использование и без панелей мониторинга потребления токенов в режиме реального времени.
В результате расходы выросли в геометрической прогрессии. Сотрудники активно использовали агентов ИИ для программирования, рабочие процессы с длительными контекстными окнами и многоуровневые агентные системы ИИ, которые автономно связывали задачи в цепочки. Ни финансовый отдел, ни структуры управления ИТ не вмешались. Когда пришел счет, оказалось, что за один месяц было потрачено 500 миллионов долларов.
Anthropic предлагает механизмы управления корпоративного уровня: панели администратора, ограничения на использование для каждого пользователя и инструменты обеспечения соответствия требованиям. Однако эти функции требуют активной настройки. В данном случае эта настройка была полностью проигнорирована. Результат: Anthropic получала ежемесячную выручку от одного клиента на уровне, о котором венчурные капиталисты обычно могут только мечтать.
Агентный ИИ: скрытый множитель затрат
Чтобы понять, как стало возможным заработать 500 миллионов долларов за 30 дней, необходимо разобраться в природе так называемых агентных систем искусственного интеллекта. Типичный запрос к языковой модели — вы вводите вопрос, получаете ответ — требует управляемого количества токенов. Агент ИИ, напротив, функционирует принципиально иначе.
Системы агентного ИИ планируют автономно, последовательно выполняют множество задач, оценивают собственные промежуточные результаты, корректируют себя, обращаются к внешним инструментам и на каждом шаге переосмысливают всю предыдущую историю разговора. Каждое новое действие требует от модели обработки не только текущего запроса, но и всей накопленной истории разговора — эффект снежного кома, который приводит к экспоненциальному росту стоимости токенов. Недавнее исследование Лаборатории цифровой экономики Стэнфордского университета, в котором участвовал Эрик Бриньольфссон, эмпирически продемонстрировало, что задачи агентного ИИ потребляют в среднем до 1000 раз больше токенов, чем простые задачи рассуждения на основе кода или кодовый чат.
В статье был выявлен особенно важный вывод: модели структурно не способны предсказывать собственные затраты токенов. Для идентичных задач фактическое потребление токенов одним и тем же агентом может различаться в 30 раз. При этом более высокое потребление токенов не обязательно означает более высокое качество результатов — точность часто достигает максимума при среднем использовании токенов и стабилизируется при более высоких уровнях потребления.
Эта присущая стохастичность делает составление бюджета на основе токенов в соответствии с классической финансовой логикой практически невозможным – если только не создать структурные рамки с помощью управляемых систем искусственного интеллекта, которые контролируют поток затрат независимо от поведения модели.
Токенизация: когда стимулы к повышению производительности искажаются
Случай с 500 миллионами токенов — не единичный случай. Он является частью более широкого явления, которое теперь имеет собственное название: «максимизация потребления токенов». Это относится к преднамеренному завышению потребления токенов — не из-за реальной необходимости, а для достижения внутренних показателей эффективности, продвижения по карьерной лестнице или просто для использования неточности измерений производительности, основанных на искусственном интеллекте.
Компания Amazon внедрила внутреннюю систему ранжирования под названием «KiroRank» для своей платформы разработчиков Kiro, которая оценивала сотрудников на основе использования ими ИИ. Первоначальная цель была похвальной: стимулировать внедрение ИИ и выделять лучшие практики. Непредвиденным последствием стало то, что сотрудники начали назначать агентам ИИ бессмысленные задачи просто для увеличения количества токенов и продвижения в рейтинге. Старший вице-президент Amazon Дэйв Тредвелл впоследствии объяснил сотрудникам, что, хотя таблица лидеров была разработана с благими намерениями, она привела к ненужным дополнительным затратам. Его послание было недвусмысленным: «Не используйте ИИ ради самого использования». Система была закрыта. В качестве нового критерия оценки Amazon ввела «нормализованные развертывания» — метрику, которая измеряет не количество токенов, а фактическое число сгенерированных полезных развертываний кода.
Несколько недель назад компания Meta запустила аналогичную доску для оценки лидерских качеств сотрудников под названием «Клодеономика». Схема повторяется систематически: как только потребление токенов становится измеримым показателем, сотрудники оптимизируют свою деятельность, ориентируясь на потребление токенов, а не на создание ценности.
Компания Uber предоставила дополнительные доказательства масштаба проблемы. Технический директор Правеен Неппалли Нага подтвердил изданию The Information, что Uber исчерпала весь свой бюджет на ИИ на 2026 год уже к апрелю — всего через четыре месяца после начала года. Это было вызвано быстрым расширением штата Claude Code до примерно 5000 инженеров, что полностью перегрузило внутренние финансовые модели компании. Uber уже потратила 3,4 миллиарда долларов на исследования и разработки в 2025 году — на девять процентов больше, чем в предыдущем году. Таким образом, бюджетная катастрофа была вызвана не проблемой ресурсов, а проблемой управления.
Операционный директор Uber Эндрю Макдональд публично заявил то, что многие руководители компаний обсуждают внутри компании, но редко выражают так прямо: высокое потребление токенов не имеет очевидной корреляции с положительными результатами для клиентов. Uber также использовал внутренние рейтинги для продвижения внедрения ИИ — с тем же пагубным результатом, что и Amazon.
Отрасль, испытывающая давление издержек: еще более впечатляющие примеры
Дело Клода на 500 миллионов долларов — самое впечатляющее отдельное дело, но отнюдь не единственное. Только в мае 2026 года произошла серия сенсационных финансовых катастроф, которые в совокупности создают структурную картину.
Разработчик Питер Штайнбергер, создатель вирусного инструмента для разработки ИИ-агентов OpenClaw, опубликовал скриншот своей панели управления API OpenAI: 1 305 088,81 долларов США в токенах за 30 дней, распределенных между 603 миллиардами токенов через 7,6 миллиона запросов API, сгенерированных примерно 100 экземплярами Codex, запущенными командой из трех человек. Штайнбергер сейчас работает непосредственно в OpenAI и лично не оплачивал эту сумму — OpenAI покрыла расходы в рамках соглашения о финансировании. Тем не менее, этот случай иллюстрирует масштаб затрат, которые могут достигать среды разработки, управляемые агентами.
В апреле 2026 года австралийский консультант по искусственному интеллекту Джесси Дэвис получил счет от Google Cloud на сумму 25 672,86 австралийских долларов (приблизительно 18 391 доллар США) – несмотря на то, что на его счету было всего 10 австралийских долларов. Атака была осуществлена с использованием общедоступного ключа API, хранящегося в виде переменной в открытом виде в среде контейнера. Девять функций безопасности Google Cloud могли бы предотвратить этот инцидент, однако все они были отключены по умолчанию. Хуже того, Google автоматически повысил уровень учетной записи до более высокого уровня с лимитом расходов от 20 000 до 100 000 долларов США без уведомления, как только был превышен порог в 1000 долларов.
Microsoft начала сокращать внутренние лицензии на код Claude после того, как ежемесячные расходы на одного инженера выросли до 500–2000 долларов. Компания переводит своих инженеров на GitHub Copilot CLI в качестве более экономичной альтернативы.
Генеральный директор OpenAI Сэм Альтман публично признал, что регулярно слышит от руководителей предприятий: «Наши расходы постоянно растут, люди чувствуют себя продуктивными, но где же доходы, где реальный рост производительности?»
🤖🚀 Управляемая платформа ИИ: более быстрые, безопасные и интеллектуальные решения на основе ИИ с UNFRAME.AI
Здесь вы узнаете, как ваша компания может быстро, безопасно и без высоких барьеров для входа внедрить индивидуальные решения на основе искусственного интеллекта.
Управляемая платформа искусственного интеллекта — это комплексное и беззаботное решение для вашего бизнеса в сфере искусственного интеллекта. Вместо того чтобы возиться со сложными технологиями, дорогостоящей инфраструктурой и длительными процессами разработки, вы получаете готовое решение, адаптированное под ваши потребности, от специализированного партнера — зачастую всего за несколько дней.
Основные преимущества с первого взгляда:
⚡ Быстрая реализация: от идеи до готового к использованию приложения за считанные дни, а не месяцы. Мы предлагаем практические решения, которые создают немедленную добавленную стоимость.
🔒 Максимальная безопасность данных: Ваши конфиденциальные данные остаются с вами. Мы гарантируем безопасную и соответствующую законодательству обработку данных без их передачи третьим лицам.
💸 Отсутствие финансового риска: вы платите только за результат. Полностью исключаются высокие первоначальные инвестиции в оборудование, программное обеспечение или персонал.
🎯 Сосредоточьтесь на своем основном бизнесе: сконцентрируйтесь на том, что у вас получается лучше всего. Мы берем на себя всю техническую реализацию, эксплуатацию и обслуживание вашего решения на основе ИИ.
📈 Перспективность и масштабируемость: ваш ИИ растет вместе с вами. Мы обеспечиваем непрерывную оптимизацию и масштабируемость, а также гибко адаптируем модели к новым требованиям.
Более подробная информация здесь:
Управление искусственным интеллектом как корпоративная ответственность: как защитить бюджет и обеспечить соответствие нормативным требованиям
Что означает управляемый ИИ — и почему он мог бы предотвратить этот ущерб
В деловом контексте термин «управляемый ИИ» относится к структурированному, платформенному подходу к контролю, мониторингу и управлению всей деятельностью в области ИИ внутри организации. В отличие от неконтролируемого прямого доступа к API, управляемый ИИ создает административный уровень контроля между сотрудниками и базовыми языковыми моделями.
В полностью внедренной управляемой системе искусственного интеллекта сценарий с затратами в 500 миллионов долларов никогда бы не произошел — по ряду технических и организационных причин.
Во-первых, ограничения расходов на уровне проекта, команды или пользователя позволяют автоматически регулировать или полностью прекращать трафик API после достижения заданных лимитов бюджета. Google Cloud учла это и объявила о введении «ограничений расходов» для Gemini, Cloud Run и других сервисов на своей конференции Next в апреле 2026 года — ограничений, которые не только оповещают пользователей, но и активно приостанавливают трафик.
Во-вторых, детальный мониторинг в режиме реального времени на уровне пользователей, команд и рабочих процессов позволяет выявлять аномалии на ранней стадии, прежде чем затраты начнут расти. Технический директор Modal Акшат Бубна подсчитал, что около 50 процентов внутреннего потребления токенов в компаниях совершенно бесполезно — проблема в том, что сейчас невозможно отличить бесполезную половину от продуктивной. Системы управляемого ИИ обеспечивают именно это различие за счет детального анализа использования.
Во-третьих, управление доступом на основе ролей позволяет дифференцировать группы пользователей: рутинные задачи направляются на менее затратные модели (например, Claude Haiku), в то время как ресурсоемкие рабочие процессы выполняются на более мощных, но более дорогих моделях. Сама компания Anthropic в своей официальной документации по ценообразованию прямо рекомендует распределение задач в зависимости от модели в качестве стратегии снижения затрат: Haiku для простых задач, Sonnet для большинства производственных нагрузок и Opus только для наиболее сложных задач логического вывода.
В-четвертых, механизмы кэширования запросов защищают от избыточного потребления токенов: повторяющиеся блоки контекста, такие как системные подсказки или политики компании, не нужно перезагружать при каждом запросе. Для рабочих процессов Agentic, которые загружают один и тот же контекст сотни раз в день, это может снизить затраты на токены на 60–80 процентов.
В-пятых, пакетная обработка обеспечивает значительную экономию средств для задач, не критичных ко времени: API пакетной обработки Anthropic предлагает скидки до 50 процентов по сравнению с синхронными запросами. В управляемой системе ИИ такие оптимизации применяются автоматически, что исключает необходимость принятия решений отдельными разработчиками вручную.
Пробел в структурном управлении: почему компании к этому не готовы
Возникает вопрос не технический, а организационный: почему корпорации с тысячами сотрудников, многомиллиардными ИТ-бюджетами и сложными структурами управления облачными ресурсами не смогли внедрить даже самые простые механизмы контроля затрат на ИИ?
Ответ кроется в структурном временном лаге. Концепции управления облачными ресурсами, такие как FinOps — дисциплинированный, межфункциональный подход к управлению расходами на облачные ресурсы — развивались на протяжении многих лет, когда вычислительные затраты были предсказуемыми и масштабируемыми линейно. Модели ценообразования токенов ИИ ведут себя принципиально иначе: они нелинейны, недетерминированы, а управляемые агентами рабочие процессы генерируют затраты, которые не являются ни предсказуемыми, ни интуитивно понятными.
Отчет «Состояние FinOps 2026» подтверждает, что расходы на ИИ эволюционировали от экспериментальных бюджетов до базовой инфраструктуры, и что почти все команды FinOps теперь несут совместную ответственность за рабочие нагрузки, связанные с ИИ. В то же время отсутствуют устоявшиеся показатели рентабельности инвестиций: согласно опросу, проведенному в прямом эфире на саммите FinOps Foundation, самая большая проблема для руководителей бизнеса заключается не в объеме затрат на ИИ, а в неспособности продемонстрировать его ценность.
Ценовая политика Anthropic еще больше усложнила ситуацию. В апреле 2026 года Anthropic коренным образом реформировала свою корпоративную модель: вместо фиксированных абонентских платежей за использование ресурсов теперь действуют более низкие номинальные цены за использование ресурсов (например, 20 долларов в месяц для технических пользователей Claude Code) в сочетании с обязательными предварительными платежами за потребление. Предыдущие скидки на API в размере 10-15 процентов для оптовых покупателей были отменены. Эта структура полностью перекладывает риск потребления на предприятие: компании платят за гарантированные объемы независимо от фактического потребления, в то время как неконтролируемое потребление, превышающее гарантированный объем, оплачивается по полной цене.
По прогнозам Gartner, к концу 2027 года более 40 процентов всех проектов в области агентного ИИ будут прекращены – в основном из-за неадекватных структур управления.
Управление ИИ как стратегический корпоративный императив
Последствия этих случаев очевидны: управление ИИ перестало быть рутинной задачей ИТ-отдела и стало стратегической корпоративной ответственностью. Компании, внедряющие управляемые структуры ИИ, получают ряд важных преимуществ по сравнению с нерегулируемыми внедрениями.
Прозрачность затрат и контроль расходов составляют основу. Ведущие организации уже используют строгие ограничения расходов, управление доступом на основе ролей, панели мониторинга в реальном времени и политики, которые предписывают более экономичные модели для рутинных задач. В своих рекомендациях по управлению Databricks прямо рекомендует устанавливать ограничения на этапе проектирования и выполнения: предопределенные лимиты токенов, ограничения на длину контекста, правила кэширования и системы обнаружения аномалий, которые вмешиваются до того, как рабочие процессы выйдут из-под контроля.
Измерение на основе ценности заменяет метрики, основанные на токенах. Переход Amazon от KiroRank к «нормализованным развертываниям» — измерению значимых развертываний кода вместо количества токенов — указывает путь вперед: релевантной метрикой является не потребление, а полученный результат. Этот сдвиг в метриках — не техническая сноска, а фундаментальная переоценка того, что означает производительность ИИ.
Использование специализированных инструментов, а не универсальных систем, позволяет значительно снизить затраты без ущерба для качества. Для определенных, повторяющихся задач специализированные, оптимизированные для конкретной задачи решения часто в 10–100 раз дешевле, чем универсальная модель. На саммите FinOps Foundation это было сформулировано как ключевой принцип: сначала определите, требуется ли вообще ИИ для выполнения задачи; затем определите, какая модель является наиболее экономически эффективной; и только потом оптимизируйте.
Архитектуры шлюзов ИИ централизуют управление. Такие платформы, как Bifrost (Maxim AI), выступают в качестве центральных шлюзов, которые маршрутизируют, отслеживают и обеспечивают соблюдение политик в отношении всего трафика ИИ в организации. Подобные архитектуры позволяют организациям управлять лимитами расходов, маршрутизацией моделей, фильтрами конфиденциальности и требованиями соответствия в одном центральном месте, а также полностью регистрировать все действия ИИ для целей аудита.
Экономика эпохи токенов: новые правила для финансирования предприятий
Дело на 500 миллионов долларов знаменует собой поворотный момент в том, как следует рассматривать корпоративные финансы и инфраструктуру ИИ в комплексе. Модели ценообразования на основе токенов отличаются от традиционных лицензий на программное обеспечение: нет фиксированной годовой платы, нет четко определенной области применения и нет естественного ограничения потребления.
Это принципиальное различие перегружает традиционные процессы корпоративного бюджетирования. Финансовые директора, привыкшие моделировать затраты на программное обеспечение как фиксированные расходы, сталкиваются с моделью переменных затрат, которая может масштабироваться экспоненциально. Прогнозируется, что к 2026 году глобальные расходы на ИИ достигнут 2,52 триллиона долларов — на 44 процента больше, чем в прошлом году. Такой масштаб делает неконтролируемое внедрение решений в масштабах предприятий системным риском.
Майкл Берри, известный своими ранними сигналами о рыночных кризисах, описал «максимальное потребление токенов» как «чрезмерное потребление, обусловленное квотами, рейтингами и управлением» и «безумную, поспешную, временную фазу». Он предсказывает, что эта фаза неустойчива. Независимо от того, окажется ли его прогноз верным или нет, структурное давление, необходимое для корректировки, уже началось.
Парадигма неконтролируемого, демократизированного доступа к ИИ как акселератору инноваций в настоящее время корректируется реальностью масштабных перерасходов. В результате остается более зрелая модель: широкий доступ, но с четко определенными границами, измеримыми целями и институциональными механизмами контроля – короче говоря, управляемый ИИ в самом полном смысле этого слова.
Что компаниям необходимо сделать сейчас?
Описанные примеры позволяют компаниям, использующим ИИ в масштабах предприятия, незамедлительно делать оперативные выводы.
Первоочередная задача — незамедлительное введение строгих лимитов расходов на уровне пользователей, команд и проектов. Anthropic, Google Cloud и OpenAI предлагают механизмы корпоративного контроля, которые необходимо настроить. Главная проблема почти во всех известных случаях заключалась не в их отсутствии в продуктовом портфеле, а в неспособности их настроить.
Параллельно необходимо измерить базовый уровень фактического потребления токенов за 30 дней до внедрения или масштабирования рабочих процессов Agentic. Без этого базового уровня нет точки отсчета для выявления аномалий. Системы обнаружения аномалий, которые автоматически запускают оповещения при достижении 25, 50 и 75 процентов месячного бюджета, обеспечивают второй уровень безопасности.
Необходимо перейти от количественных показателей к метрикам, отражающим конечный результат, к метрикам, отражающим конечный результат. Компания Amazon представила жизнеспособную модель с «нормализованными развертываниями». Инвестиции в ИИ, результаты которых не поддаются измерению, следует пересмотреть.
Внедрение агентного ИИ требует четкого, поэтапного управления: пилотные группы, ясно определенные сценарии использования, ограничения затрат на каждый рабочий процесс и регулярные проверки перед более широким внедрением. Масштабируемость агентного ИИ — это его преимущество, но она также представляет собой финансовый риск, если его использовать без четких ограничений.
Вывод: 500 миллионов долларов за урок, который был бесплатным
Масштаб этого дела, оцениваемого в 500 миллионов долларов, впечатляет, но причина банальна: никто ничего не предпринял. Техническая инфраструктура для контроля затрат была создана, но конфигурация оставляла желать лучшего. Не хватало управляемой стратегии в области ИИ — институциональной структуры, которая бы объединяла доступ к ИИ с управлением ИИ.
Послание руководителям бизнеса ясно: щедрый доступ к инструментам ИИ без системы управления — это не признак доверия к сотрудникам, а финансовая халатность. Случаи Uber, Amazon, Microsoft и анонимной корпорации с полумиллиардными инвестициями не описывают в совокупности проблемы, возникающие на начальном этапе внедрения новой технологии. Они описывают системный сбой в интеграции новых технологий с проверенными принципами корпоративного управления.
Управляемый ИИ — это решение этой проблемы. Не как ограничение инноваций, а как условие их устойчивости.
Консалтинг - Планирование - Внедрение
Я с удовольствием стану вашим личным консультантом.
со мной по адресу wolfenstein∂xpert.digital связаться
Просто позвоните мне по номеру +49 7348 4088 965 .





















