"Tokenmaxing" - האם זו הייתה אמזון? מדוע תאגיד שרפה חצי מיליארד דולר בטוקנים: בינה מלאכותית מנוהלת כמנגנון הגנה

Konrad Wolfenstein

לפני 3 שבועות

"Tokenmaxing" – האם זו הייתה אמזון? מדוע תאגיד שרפה חצי מיליארד דולר בטוקנים: בינה מלאכותית מנוהלת כמנגנון הגנה – תמונה: Xpert.Digital

"Tokenmaxing" עולה מיליונים: טרנד הבינה המלאכותית הסודי שמביא את אמזון, אובר ושות' על ברכיהן

מלכודת 500 מיליון הדולר: מדוע סוכני בינה מלאכותית אוטונומיים מפוצצים תקציבים של תאגידים

חודש אחד, גישה בלתי מוגבלת למודלים של בינה מלאכותית, וחשבון של 500 מיליון דולר שלא ייאמן: תקרית שנחשפה לאחרונה בעולם התאגידי חושפת את הסיכונים הפיננסיים העצומים של בינה מלאכותית כאשר משתמשים בה ללא הנחיות ברורות. בעוד שמה שמכונה "בינה מלאכותית סוכנתית" משתלטת יותר ויותר על משימות מורכבות באופן אוטונומי, תופעות כמו "מקסום אסימונים" גורמות לעלויות להתפוצץ באופן אקספוננציאלי מאחורי הקלעים - לעתים קרובות ללא ערך מוסף מוחשי עבור החברה. אפילו ענקיות טכנולוגיה כמו אמזון, אובר ומטה כבר למדו בדרך הקשה שפריסת בינה מלאכותית בלתי מבוקרת טורפת תקציבים בזמן שיא. מקרה זה שופך אור על מה שנחשב לכישלון הבינה המלאכותית היקר ביותר בהיסטוריה של התאגידים וממחיש בצורה חיה מדוע "בינה מלאכותית מנוהלת" - שליטה, ניהול והגבלה שיטתיים של זרימות עבודה של בינה מלאכותית - אינה עוד תכונה אופציונלית של IT, אלא הכרח אסטרטגי מוחלט עבור כל חברה.

כאשר חוסר משילות הופך יקר יותר ממודל הבינה המלאכותית עצמו

איפשהו במחלקת החשבונאות של תאגיד גדול, צוות כספים עדיין מעבד את אירועי חודש אחד. בלי דוח רבעוני, בלי תוכנית שנתית - חודש אחד הספיק כדי להעביר כ-500 מיליון דולר לפלטפורמת קלוד של אנתרופיק מבלי שאף אחד יוכל להפעיל הקפאת הוצאות. לא בגלל שהחברה לא הצליחה לקבוע מגבלה. אלא פשוט בגלל שאף אחד לא עשה זאת.

מקרה זה, שדווח לראשונה על ידי Axios ב-28 במאי 2026, ואושר על ידי יועץ בינה מלאכותית, נחשב כיום להפסד הגדול ביותר הידוע לציבור בחודש אחד עקב חריגות בעלויות בתחום הבינה המלאכותית בהיסטוריה של התאגידים. זה לא מקרה בודד בשולי התעשייה - זהו סימפטום של חולשה מבנית הפוקדת כיום חברות גדולות רבות: השילוב של שימוש בלתי מרוסן בבינה מלאכותית סוכנתית והיעדר כמעט מוחלט של מבני בינה מלאכותית מנוהלים.

המקרה בפירוט: 500 מיליון דולר ללא מגבלה

החברה המדוברת לא נקראה על ידי Axios או היועץ המצוטט. ספקולציות לגבי אמזון הופצו בפלטפורמה X, אך ללא כל ראיות. מה שידוע הוא שהתאגיד נתן לעובדיו גישה בלתי מוגבלת לפלטפורמת Claude של Anthropic - ללא מגבלות הוצאה, ללא מכסות שימוש וללא לוחות מחוונים בזמן אמת לניטור צריכת אסימונים.

התוצאה הייתה עלייה אקספוננציאלית בעלויות. העובדים עשו שימוש נרחב בסוכני קידוד מבוססי בינה מלאכותית, זרימות עבודה עם חלונות הקשר ארוכים ומערכות בינה מלאכותית רב-שכבתיות שקשרו משימות זו לזו באופן אוטונומי. לא מחלקת הכספים ולא מבני ניהול ה-IT התערבו. כאשר החשבון הגיע, 500 מיליון דולר הוצאו - בחודש אחד.

Anthropic מציעה מנגנוני בקרה ברמת הארגון: לוחות מחוונים של מנהלים, מגבלות שימוש מבוססות משתמשים וכלי תאימות. עם זאת, תכונות אלו דורשות תצורה פרואקטיבית. במקרה זה, תצורה זו הוזנחה לחלוטין. התוצאה: Anthropic ייצרה הכנסה חודשית מלקוח בודד ברמה שמשקיעי הון סיכון בדרך כלל רק חולמים עליה.

בינה מלאכותית סוכנתית: מכפיל העלות השקט

כדי להבין כיצד 500 מיליון דולר ב-30 יום אפשריים, יש להבין את טבען של מה שנקרא מערכות בינה מלאכותית סוכניות. שאילתה אופיינית למודל שפה - אתה מקליד שאלה, מקבל תשובה - צורכת מספר ניהולי של טוקנים. סוכן בינה מלאכותית, לעומת זאת, מתפקד בצורה שונה באופן מהותי.

מערכות בינה מלאכותית סוכניות מתכננות באופן אוטונומי, מבצעות משימות מרובות ברצף, מעריכות את תוצאות הביניים שלהן, מתקנות את עצמן, משתמשות בכלים חיצוניים ומשנות את כל היסטוריית השיחה הקודמת בהקשר עם כל שלב. כל פעולה חדשה דורשת מהמודל לעבד לא רק את ההנחיה הנוכחית אלא את כל היסטוריית השיחה המצטברת - אפקט כדור שלג שגורם לעלויות האסימונים לעלות באופן אקספוננציאלי. מחקר שנערך לאחרונה על ידי מעבדת הכלכלה הדיגיטלית של סטנפורד, בו השתתף אריק בריניולפסון, הדגים באופן אמפירי שמשימות בינה מלאכותית סוכניות צורכות, בממוצע, עד פי 1,000 יותר אסימונים ממשימות הנמקה קוד פשוטות או צ'אט קוד.

המאמר זיהה ממצא קריטי במיוחד: מודלים אינם מסוגלים מבחינה מבנית לחזות את עלויות האסימונים שלהם. עבור משימות זהות, צריכת האסימונים בפועל של אותו סוכן יכולה להשתנות פי 30. וצריכה גבוהה יותר של אסימונים אינה בהכרח אומרת תוצאות באיכות גבוהה יותר - הדיוק מגיע לעתים קרובות לשיאו בשימוש בינוני באסימונים ומתייצב ברמות צריכה גבוהות יותר.

סטוכסטיות מובנית זו הופכת את תקצוב האסימונים לפי לוגיקה פיננסית קלאסית לכמעט בלתי אפשרי - אלא אם כן יוצרים מסגרות מבניות באמצעות מערכות בינה מלאכותית מנוהלות השולטות בזרימת העלויות באופן עצמאי מהתנהגות המודל.

טוקניזציה: כאשר תמריצי ביצועים הופכים מעוותים

מקרה 500 מיליון הטוקנים אינו מקרה בודד. הוא משולב בתופעה רחבה יותר שכעת יש לה שם משלה: מקסום טוקנים. משמעות הדבר היא ניפוח מכוון של צריכת טוקנים - לא מתוך צורך מהותי, אלא כדי לעמוד במדדי ביצועים פנימיים, לטפס בסולם התאגידי, או פשוט לנצל את חוסר הדיוק של מדידות פרודוקטיביות המונעות על ידי בינה מלאכותית.

אמזון הציגה מערכת דירוג פנימית בשם "KiroRank" עבור פלטפורמת המפתחים Kiro שלה, אשר העריכה עובדים על סמך השימוש שלהם בבינה מלאכותית. המטרה הראשונית הייתה ראויה לשבח: לקדם אימוץ בינה מלאכותית ולהדגיש שיטות עבודה מומלצות. התוצאה הלא מכוונת: עובדים החלו להקצות לסוכני בינה מלאכותית משימות חסרות טעם רק כדי להגדיל את מספר האסימונים שלהם ולטפס בדירוג. סגן נשיא בכיר באמזון, דייב טרדוול, הסביר לאחר מכן לעובדים כי בעוד שלוח המובילים פותח בכוונות טובות, הוא הביא לעלויות נוספות מיותרות. המסר שלו היה חד משמעי: "אל תשתמשו בבינה מלאכותית לשם השימוש בה". המערכת נסגרה. כקריטריון הערכה חדש, אמזון הציגה "פריסות מנורמלות" - מדד שמודד לא ספירת אסימונים, אלא את המספר בפועל של פריסות קוד שימושיות שנוצרו.

מטה השיקה מועצת מנהיגות דומה לעובדים בשם "קלאודונומיקס" כמה שבועות קודם לכן. הדפוס חוזר על עצמו באופן שיטתי: ברגע שצריכת אסימונים הופכת למדד מדיד, העובדים מבצעים אופטימיזציה לצריכת אסימונים - ולא ליצירת ערך.

אובר סיפקה ראיות נוספות להיקף הבעיה. מנהל הטכנולוגיה הראשי, פראבין נפאלי נאגה, אישר ל-The Information כי אובר כבר מיצתה את כל תקציב הבינה המלאכותית שלה לשנת 2026 עד אפריל - ארבעה חודשים בלבד לאחר תחילת השנה. הדבר נבע מההתרחבות המהירה של קלוד קוד לכ-5,000 מהנדסים, דינמיקה שהציפה לחלוטין את המודלים הפיננסיים הפנימיים של החברה. אובר כבר הוציאה 3.4 מיליארד דולר על מחקר ופיתוח בשנת 2025 - עלייה של תשעה אחוזים לעומת השנה הקודמת. לכן, אסון התקציב לא היה בעיית משאבים, אלא בעיית ממשל.

אנדרו מקדונלד, מנהל התפעול הראשי של אובר, הצהיר בפומבי את מה שרבים ממנהיגי העסקים דנים בו באופן פנימי אך לעיתים רחוקות מבטאים אותו בצורה כה ישירה: לצריכה גבוהה של אסימונים אין מתאם מוכח עם תוצאות מועילות עבור הלקוחות. גם אובר השתמשה בלוחות מובילים פנימיים כדי לקדם אימוץ בינה מלאכותית - עם אותה תוצאה מעוותת כמו אמזון.

תעשייה תחת לחץ עלויות: מקרים מרהיבים נוספים

המקרה של קלוד, שסך 500 מיליון דולר, הוא המקרה הבודד המרהיב ביותר, אך בשום אופן לא היחיד. מאי 2026 לבדו הביא עמו סדרה של אסונות עלות סנסציוניים אשר יחד מציירים תמונה מבנית.

המפתח פיטר שטיינברגר, יוצר כלי הסוכן הוויראלי של בינה מלאכותית OpenClaw, פרסם צילום מסך של לוח המחוונים של ה-API של OpenAI: צריכת אסימונים בסך 1,305,088.81 דולר במשך 30 יום, המחולקים על פני 603 מיליארד אסימונים באמצעות 7.6 מיליון בקשות API, שנוצרו על ידי כ-100 מופעי קודקס המנוהלים על ידי צוות של שלושה אנשים. שטיינברגר עובד כעת ישירות ב-OpenAI ולא שילם באופן אישי סכום זה - OpenAI כיסתה את העלויות כחלק מהסכם מימון. אף על פי כן, מקרה זה מדגים את היקף העלויות שסביבות פיתוח מונחות-סוכנים יכולות להגיע אליהן.

באפריל 2026, יועץ בינה מלאכותית אוסטרלי בשם ג'סי דייויס קיבל חשבון של גוגל קלאוד בסך 25,672.86 דולר אוסטרלי (כ-18,391 דולר אמריקאי) - למרות שתקציב החשבון שלו היה 10 דולר אוסטרלי בלבד. המתקפה בוצעה באמצעות מפתח API זמין לציבור המאוחסן כמשתנה טקסט רגיל בסביבת מכולה. תשעה תכונות אבטחה של גוגל קלאוד היו יכולות למנוע את האירוע הזה - אולם כולן הושבתו כברירת מחדל. כדי להחמיר את המצב, גוגל שדרגה אוטומטית את החשבון לרמה גבוהה יותר עם מגבלת הוצאה של 20,000 עד 100,000 דולר אמריקאי ללא הודעה מוקדמת לאחר חריגה מסף ה-1,000 דולר.

מיקרוסופט החלה לצמצם את רישיונות הקוד הפנימיים שלה של Claude לאחר שהעלויות החודשיות למהנדס עלו ל-500 עד 2,000 דולר. החברה מעבירה את המהנדסים שלה ל-GitHub Copilot CLI כחלופה חסכונית יותר.

מנכ"ל OpenAI, סם אלטמן, הודה בפומבי שהוא שומע באופן קבוע ממנהיגים עסקיים: "ההוצאות שלנו ממשיכות לעלות, אנשים מרגישים פרודוקטיביים - אבל איפה ההכנסות, איפה עליות הפריון בפועל?"

🤖🚀 פלטפורמת בינה מלאכותית מנוהלת: פתרונות בינה מלאכותית מהירים, בטוחים וחכמים יותר עם UNFRAME.AI

פלטפורמת בינה מלאכותית מנוהלת - תמונה: Xpert.Digital

כאן תלמדו כיצד החברה שלכם יכולה ליישם פתרונות בינה מלאכותית מותאמים אישית במהירות, בצורה מאובטחת וללא חסמי כניסה גבוהים.

פלטפורמת בינה מלאכותית מנוהלת היא הפתרון השלם והחסר דאגות שלכם לבינה מלאכותית. במקום להתמודד עם טכנולוגיה מורכבת, תשתית יקרה ותהליכי פיתוח ארוכים, אתם מקבלים פתרון מוכן מראש המותאם לצרכים שלכם משותף מתמחה - לעתים קרובות תוך מספר ימים בלבד.

היתרונות המרכזיים במבט חטוף:

⚡ יישום מהיר: מרעיון ליישום מוכן לשימוש תוך ימים, לא חודשים. אנו מספקים פתרונות מעשיים היוצרים ערך מוסף מיידי.

🔒 אבטחת מידע מקסימלית: המידע הרגיש שלך נשאר אצלך. אנו מבטיחים עיבוד מאובטח ותואם ללא שיתוף מידע עם צדדים שלישיים.

💸 אין סיכון פיננסי: אתם משלמים רק על תוצאות. השקעות גבוהות מראש בחומרה, תוכנה או כוח אדם מבוטלות לחלוטין.

🎯 התמקדו בעסק הליבה שלכם: התרכזו במה שאתם עושים הכי טוב. אנחנו דואגים לכל תהליך היישום הטכני, התפעול והתחזוקה של פתרון הבינה המלאכותית שלכם.

📈 עמיד לעתיד וניתן להרחבה: הבינה המלאכותית שלכם גדלה איתכם. אנו מבטיחים אופטימיזציה וגמישות מתמשכת, ומתאימים את המודלים לדרישות חדשות בצורה גמישה.

מידע נוסף כאן:

פלטפורמת בינה מלאכותית מנוהלת

בינה מלאכותית מנוהלת כאחריות תאגידית: כיצד להגן על התקציב והתאימות

מה המשמעות של בינה מלאכותית מנוהלת - ומדוע היא הייתה מונעת את הנזק הזה

בהקשר עסקי, המונח "בינה מלאכותית מנוהלת" מתייחס לגישה מובנית ומבוססת פלטפורמה לשליטה, ניטור וניהול של כל פעילויות הבינה המלאכותית בארגון. בניגוד לגישה ישירה בלתי מבוקרת ל-API, בינה מלאכותית מנוהלת מציבה שכבת בקרה אדמיניסטרטיבית בין העובדים לבין מודלי השפה הבסיסיים.

במערכת בינה מלאכותית מנוהלת שהוטמעה במלואה, התרחיש של 500 מיליון דולר לעולם לא היה יכול להתרחש - מכמה סיבות טכניות וארגוניות.

ראשית, מגבלות מבוססות הוצאות ברמת הפרויקט, הצוות או המשתמש מאפשרות צמצום אוטומטי או הפסקה מוחלטת של תעבורת ה-API לאחר שמושגים מגבלות תקציב מוגדרות מראש. גוגל קלאוד הכירה בכך והכריזה על הצגת "מגבלות הוצאות" עבור ג'מיני, Cloud Run ושירותים אחרים בכנס Next שלה באפריל 2026 - מגבלות שלא רק מתריעות בפני משתמשים אלא גם משהות באופן פעיל את התעבורה.

שנית, ניטור בזמן אמת מפורט ברמת המשתמש, הצוות וזרימת העבודה מספק אותות אנומליה מוקדמים לפני שהעלויות עלולות לעלות בקצב איטי. אקשאט בובנה, מנהל טכנולוגיית ראשי (CTO) מודאלי, מעריך שכ-50 אחוז מצריכת האסימונים הפנימית בחברות היא חסרת תועלת לחלוטין - הבעיה כיום היא חוסר היכולת להבחין בין המחצית חסרת הערך לחצי היצרני. מערכות בינה מלאכותית מנוהלות מספקות בדיוק את ההבחנה הזו באמצעות ייחוס שימוש מפורט.

שלישית, ניהול גישה מבוסס תפקידים מאפשר הבחנה בין קבוצות משתמשים: משימות שגרתיות מנותבות למודלים פחות יקרים (כגון קלוד הייקו), בעוד שזרימות עבודה עתירות חישוב מבוצעות על מודלים חזקים יותר, אך יקרים יותר. אנתרופיק עצמה ממליצה במפורש על הקצאת משימות רגישה למודל כאסטרטגיית עלות בתיעוד התמחור הרשמי שלה: הייקו למשימות פשוטות, סונט לרוב עומסי העבודה של הייצור, ואופוס רק למשימות ההיגיון המורכבות ביותר.

רביעית, מנגנוני אחסון במטמון של הנחיות מגנים מפני לולאות צריכת אסימונים מיותרות: בלוקי הקשר חוזרים, כגון הנחיות מערכת או מדיניות חברה, אינם צריכים להיטען מחדש עם כל בקשה. עבור זרימות עבודה של Agentic שטוענות את אותו הקשר מאות פעמים ביום, הדבר יכול להפחית את עלויות האסימונים ב-60 עד 80 אחוז.

חמישית, עיבוד אצווה מספק חיסכון עצום בעלויות עבור משימות שאינן קריטיות לזמן: Batch API של Anthropic מציע הנחות של עד 50 אחוז בהשוואה לבקשות סינכרוניות. במערכת בינה מלאכותית מנוהלת, אופטימיזציות כאלה מיושמות באופן אוטומטי, מה שמבטל את הצורך של מפתחים בודדים לקבל החלטות ידניות.

פער הממשל המבני: מדוע חברות אינן מוכנות

השאלה שעולה אינה טכנית, אלא ארגונית: מדוע תאגידים עם אלפי עובדים, תקציבי IT של מיליארדי דולרים ומבני ניהול ענן מתוחכמים לא הצליחו ליישם את מנגנוני בקרת העלויות הפשוטים ביותר עבור בינה מלאכותית?

התשובה טמונה בפער זמן מבני. מושגי ניהול ענן כמו FinOps - הגישה הממושמעת והחוצת-תפקודים לניהול הוצאות ענן - התפתחו במשך שנים רבות כאשר עלויות המחשוב היו צפויות וניתנות להרחבה לינארית. מודלים של תמחור אסימוני בינה מלאכותית מתנהגים בצורה שונה באופן מהותי: הם לא ליניאריים, לא דטרמיניסטיים, וזרימות עבודה מונעות על ידי סוכנים מייצרות עלויות שאינן צפויות ואינן אינטואיטיביות.

דו"ח מצב FinOps לשנת 2026 מאשר כי הוצאות הבינה המלאכותית התפתחו מתקציבים ניסיוניים לתשתיות ליבה, וכי כמעט כל צוותי FinOps כיום חולקים אחריות על עומסי עבודה של בינה מלאכותית. במקביל, חסרים מדדים מבוססים לתשואה על ההשקעה: על פי סקר חי בפסגת קרן FinOps, הבעיה הגדולה ביותר עבור מנהיגים עסקיים אינה סכום עלויות הבינה המלאכותית, אלא חוסר היכולת להדגים את ערכה.

מבנה התמחור של Anthropic סיבך את העניינים עוד יותר. באפריל 2026, Anthropic ביצעה רפורמה מהותית במודל הארגוני שלה: במקום דמי מנוי קבועים המבוססים על מושב, כעת יש מחירי מושבים נומינליים נמוכים יותר (למשל, 20 דולר לחודש למשתמשים טכניים של Claude Code), בשילוב עם התחייבויות צריכה מחייבות מראש. הנחות ה-API הקודמות של 10 עד 15 אחוזים עבור רוכשים בכמויות גדולות בוטלו. מבנה זה מעביר את סיכון הצריכה לחלוטין לארגון: חברות משלמות עבור כמויות מחויבות ללא קשר לצריכה בפועל, בעוד שצריכה בלתי מבוקרת מעבר להתחייבות מחויבת במחיר מלא.

גרטנר צופה כי יותר מ-40 אחוזים מכלל פרויקטי הבינה המלאכותית של Agentic יופסקו עד סוף 2027 - בעיקר עקב מבני ממשל לא מספקים.

ניהול בינה מלאכותית כצורך אסטרטגי בתאגיד

ההשלכות של מקרים אלה ברורות: ניהול בינה מלאכותית אינו עוד פעילות תקורה עבור מחלקת ה-IT, אלא אחריות תאגידית אסטרטגית. חברות המיישמות מבני בינה מלאכותית מנוהלים משיגות מספר יתרונות מכריעים על פני פריסות לא מפוקחות.

שקיפות עלויות ובקרת הוצאות מהוות את הבסיס. ארגונים מובילים כבר מסתמכים על מגבלות הוצאות מחמירות, ניהול גישה מבוסס תפקידים, לוחות מחוונים לניטור בזמן אמת ומדיניות המחייבת מודלים חסכוניים יותר למשימות שגרתיות. Databricks ממליצה במפורש על מעקות בטיחות בזמן תכנון ובזמן ריצה בהנחיות הממשל שלה: מגבלות טוקנים מוגדרות מראש, מגבלות אורך הקשר, כללי אחסון במטמון ומערכות לזיהוי אנומליות שמתערבות לפני שזרימות עבודה מתגברות באופן בלתי נשלט.

מדידה מבוססת ערך מחליפה מדדים מבוססי אסימונים. המעבר של אמזון מ-KiroRank ל"פריסות מנורמלות" - מדידת פריסות קוד משמעותיות במקום כמויות אסימונים גולמיות - מצביע על הדרך קדימה: לא צריכה, אלא התוצאה המופקת היא המדד הרלוונטי. שינוי זה במדדים אינו הערת שוליים טכנית, אלא הערכה מחודשת מהותית של מהי פרודוקטיביות של בינה מלאכותית.

כלים ייעודיים, במקום מערכות לשימוש כללי, מאפשרים הפחתות משמעותיות בעלויות מבלי לפגוע באיכות. עבור משימות מוגדרות וחוזרות על עצמן, פתרונות ייעודיים ומותאמים למשימות זולים לעתים קרובות פי 10 עד 100 ממודל אוניברסלי. פסגת קרן FinOps ניסחה זאת כעיקרון מרכזי: ראשית, יש לקבוע האם המשימה בכלל דורשת בינה מלאכותית; לאחר מכן, יש לקבוע איזה מודל הוא היעיל ביותר מבחינת עלות; ורק לאחר מכן לבצע אופטימיזציה.

ארכיטקטורות שערים של בינה מלאכותית מרכזיות את השליטה. פלטפורמות כמו Bifrost (Maxim AI) משמשות כשערי גישה מרכזיים המנתבים, מנטרים ואוכפים בקרות מדיניות על כל תעבורת הבינה המלאכותית של הארגון. ארכיטקטורות כאלה מאפשרות לארגונים לנהל מגבלות הוצאות, ניתוב מודלים, מסנני פרטיות ודרישות תאימות במיקום מרכזי אחד - ולרשום באופן מלא את כל פעילויות הבינה המלאכותית למטרות ביקורת.

הכלכלה של עידן האסימונים: כללים חדשים למימון ארגוני

המקרה של 500 מיליון הדולר מסמן נקודת מפנה באופן שבו יש לבחון יחד מימון תאגידי ותשתית בינה מלאכותית. מודלים של תמחור מבוססי אסימונים אינם מתנהגים כמו רישיונות תוכנה מסורתיים: אין דמי חבר שנתיים קבועים, אין היקף מוגדר בבירור ואין תקרת צריכה טבעית.

הבדל מהותי זה גובר על תהליכי תקצוב תאגידיים מסורתיים. מנהלי כספים, המורגלים למידול עלויות תוכנה כהוצאות קבועות, מתמודדים עם מודל עלויות משתנות שניתן להרחיב באופן אקספוננציאלי. ההוצאות הגלובליות על בינה מלאכותית צפויות להגיע ל-2.52 טריליון דולר עד 2026 - עלייה של 44 אחוזים משנה לשנה. קנה מידה זה הופך פריסות ארגוניות בלתי מבוקרות לסיכון מערכתי.

מייקל ברי, הידוע באיתותי האזהרה המוקדמים שלו מפני משברים בשוק, תיאר את מקסום האסימונים כ"צריכת יתר המונעת על ידי מכסות, לוחות מובילים והנהלה" ו"שלב מטורף, חפוז וזמני". הוא צופה ששלב זה אינו בר קיימא. בין אם התזמון שלו יתברר כנכון ובין אם לאו, הלחץ המבני להסתגל כבר בעיצומו.

הפרדיגמה של גישה בלתי מבוקרת ודמוקרטית לבינה מלאכותית כמאיץ חדשנות מתוקנת כעת על ידי מציאות של חריגות עלויות אדירות. מה שנותר הוא מודל בוגר יותר: גישה רחבה, אך עם גבולות מוגדרים, יעדים מדידים ומנגנוני בקרה מוסדיים - בקיצור, בינה מלאכותית מנוהלת במלוא מובנה.

מה חברות צריכות לעשות עכשיו

המקרים המתוארים מאפשרים מסקנות תפעוליות מיידיות עבור חברות המשתמשות בבינה מלאכותית בקנה מידה ארגוני.

העדיפות הראשונה היא יישום מיידי של מגבלות הוצאות מחמירות ברמת המשתמש, הצוות והפרויקט. Anthropic, Google Cloud ו-OpenAI מציעים מנגנוני בקרה ארגוניים שיש להגדיר. הבעיה העיקרית כמעט בכל המקרים הידועים לא הייתה היעדרם מתיק המוצרים, אלא דווקא הכישלון בהגדרתם.

במקביל, יש למדוד קו בסיס של צריכת אסימונים בפועל במשך 30 יום לפני פריסת או הרחבת זרימות העבודה של Agentic. ללא קו בסיס זה, אין נקודת ייחוס לאנומליות. מערכות לזיהוי אנומליות המפעילות התראות אוטומטיות ב-25, 50 ו-75 אחוז מהתקציב החודשי מספקות את שכבת האבטחה השנייה.

יש להמיר את הגדרת המדד לפרודוקטיביות של בינה מלאכותית מכמויות סמליות למדדי תוצאות. אמזון הציגה מודל בר-קיימא עם "פריסות מנורמלות". יש להעריך מחדש השקעות בבינה מלאכותית שאינן ניתנות למעקב אחר תוצאות עסקיות מדודות.

פריסת בינה מלאכותית סוכנית דורשת ניהול מפורש ומדורג בשלבים: קבוצות פיילוט, מקרי שימוש מוגדרים בבירור, מגבלות עלות לכל זרימת עבודה וסקירות סדירות לפני פריסה רחבה יותר. יכולת ההרחבה של בינה מלאכותית סוכנית היא יתרון - אך היא גם סיכון עלות אם היא משתחררת ללא מעקות בטיחות.

מסקנה: 500 מיליון דולר עבור שיעור שהיה זמין בחינם

המקרה של 500 מיליון הדולר הוא מרהיב בהיקפו, אך הסיבה לו בנאלית: איש לא לחץ על כפתור. התשתית הטכנית לבקרת עלויות הייתה קיימת, אך התצורה חסרה. מה שחסר היה אסטרטגיית בינה מלאכותית מנוהלת - מסגרת מוסדית המשלבת גישה לבינה מלאכותית עם משילות בינה מלאכותית.

המסר למנהיגים עסקיים ברור: גישה נדיבה לכלי בינה מלאכותית ללא מסגרת ממשל תאגידי אינה סימן לאמון בעובדים - זוהי רשלנות פיסקלית. המקרים של אובר, אמזון, מיקרוסופט והתאגיד האנונימי עם ההשקעה של חצי מיליארד דולר אינם מתארים יחד את בעיות ההתחלתיות של טכנולוגיה חדשה. הם מתארים את הכישלון השיטתי בשילוב טכנולוגיה חדשה עם עקרונות מוכחים של ממשל תאגידי.

בינה מלאכותית מנוהלת היא התשובה לפער הזה. לא כמגבלה של חדשנות, אלא כתנאי לקיימותה.

ייעוץ - תכנון - יישום