מנהלי כספים משמיעים אזעקה: העלויות הבלתי נשלטות של סוכני בינה מלאכותית חדשים

Konrad Wolfenstein

לפני 7 שעות

לא עוד מוני אסימונים: מדוע חברות צריכות לשלם רק עבור תוצאות בינה מלאכותית אמיתיות מעתה והלאה – תמונה: Xpert.Digital

לא עוד מוני אסימונים: מדוע חברות צריכות לשלם רק עבור תוצאות בינה מלאכותית אמיתיות מעתה והלאה

בינה מלאכותית גנרטיבית נמצאת במשבר מהותי - לא בגלל שהטכנולוגיה כושלת, אלא בגלל שהארכיטקטורה המסחרית שלה קורסת.

ענקיות טכנולוגיה כמו מיקרוסופט, אובר וגיטהאב כבר נוקטות בפעולות דרסטיות: תקציבים שנתיים לכלי בינה מלאכותית הולכים ומצטמצמים תוך חודשים עקב השימוש בסוכנים אוטונומיים, בעוד שרווחי הפרודוקטיביות הצפויים לרוב אינם ניתנים למדידה. האשם הוא המעבר כלל-תעשייתי למודלים של חיוב מבוססי אסימונים. תחת מסווה של "שלם על מה שאתה משתמש", ספקים מעבירים את מלוא הסיכון הפיננסי ללקוחות הארגוניים שלהם, וגובים תשלום רק עבור כוח המחשוב עצמו - ללא קשר לשאלה האם הבינה המלאכותית פותרת נכון משימה או מספקת ערך כלכלי אמיתי. מאמר זה מנתח את הסיכונים הנסתרים של טרנספורמציית התמחור הנוכחית של בינה מלאכותית, מסביר את המתח הגורלי בין בקרת תקציב לאימוץ בינה מלאכותית, ומדגים מדוע תמחור מבוסס תוצאות הוא הפתרון היחיד בר-קיימא לעתיד הבינה המלאכותית הארגונית.

קשור לזה:

UNFRAME.AI: תמחור מבוסס אסימונים שבור. מודלים מבוססי תוצאות מתקנים את זה

מי משלם כשבינה מלאכותית לא מספקת כלום? חשבון נפש של תעשייה שלא הבינה את יצירת הערך שלה

מודל העסקים של בינה מלאכותית גנרטיבית נמצא במשבר מהותי. לא בגלל שהטכנולוגיה עצמה נכשלת, אלא בגלל שהאופן שבו היא מחויבת הופך את ההיגיון הכלכלי על פיו: חברות נושאות בכל הסיכון הפיננסי - הספק גובה ללא קשר לתוצאה. במאי 2026, מיקרוסופט ביטלה רישיונות פנימיים של קלוד קוד עבור אלפי עובדים בחטיבת החוויות והמכשירים שלה. אובר מיצתה את כל תקציב הבינה המלאכותית שלה לשנת 2026 תוך ארבעה חודשים מכיוון ש-5,000 מהנדסים עבדו באופן אינטנסיבי עם קלוד קוד, ויצרו עלויות חודשיות של 500 עד 2,000 דולר לאדם. גיטהאב, פלטפורמת המפתחים הגדולה בעולם שבבעלות מיקרוסופט, ביטלה את התמחור בתעריף קבוע ב-1 ביוני 2026 ועברה למערכת אשראי מבוססת אסימונים. שלושת האירועים הללו בתוך מספר שבועות אינם צירוף מקרים - הם תסמינים של פגם מבני הטבוע עמוק בארכיטקטורת התמחור של תעשיית הבינה המלאכותית.

סוף עידן הסובסידיות: כאשר השוק מגלה את המחיר

השלב הראשון של בינה מלאכותית גנרטיבית סובסד במידה רבה. ספקים כמו Anthropic, OpenAI ומיקרוסופט הציעו את שירותיהם במחיר נמוך משמעותית מעלויות התשתית בפועל על מנת לצבור נתח שוק, להבין את התנהגות המשתמשים ולבנות מערכות אקולוגיות למפתחים. עמלות קבועות לעוזרי קידוד, צ'אט ללא הגבלה עבור סכומים חודשיים חד-ספרתיים, ובדיקות ארגוניות נדיבות על חשבון הספק - כל זה התאפשר מכיוון שהון סיכון מימן את הפרש המחירים ומכיוון שהעלויות האמיתיות של שימוש בזרימות עבודה מבוססות סוכנים טרם היו ידועות.

שלב זה הסתיים באופן מובהק. גיטהאב נימקה במפורש את המעבר לחיוב מבוסס אסימונים בטענה ששימוש מבוסס סוכנים הפך לנורמה ועלויות המחשוב הנלוות פשוט אינן יכולות עוד לעמוד במודלים הקודמים של תעריף קבוע. החברה ניסחה זאת בבוטות: שאלת צ'אט קצרה וסשן קידוד אוטונומי בן מספר שעות עלו בעבר אותו דבר - זה לא היה בר קיימא. מפתחים שיכלו בעבר לעבוד מבוסס סוכנים ללא הגבלות תמורת 10 עד 39 דולר לחודש ראו את עלויותיהם עולות מ-50 דולר בלבד ליותר מ-3,000 דולר לחודש לאחר המעבר. שרשור הקהילה שהכריז על השינוי גרף כמעט 900 קולות נגד.

גרטנר צופה הוצאות גלובליות על בינה מלאכותית של 2.52 טריליון דולר בשנת 2026, עלייה של 44 אחוזים משנה לשנה. עם הוצאות גלובליות בסדר גודל כזה, השאלה מי נושא בעלויות ומי קוצר את הפירות אינה עוד דיון אקדמי, אלא שאלה מהותית של ממשל תאגידי. הוצאות תשתית בינה מלאכותית לבדן צפויות לטפס ל-1.37 טריליון דולר בשנת 2026. יחד עם זאת, על פי מחקר של MIT מיולי 2025, כ-95 אחוזים מפרויקטי הפיילוט של GenAI ברחבי הארגון לא הצליחו לספק אפקט רווח והפסד מדיד. סתירה זו - הוצאות גוברות, חוסר תשואה - היא ליבת הבעיה.

חמש קבוצות סיכון שמודלים של תמחור אסימונים מעבירים לחברה

מאחורי הביטוי התמים "שלם עבור מה שאתה משתמש" מסתתר מעבר שיטתי של חמש קבוצות סיכון שונות מהספק ללקוח העסקי. כל מי שמבין את המנגנון הזה מבין מדוע חיוב אסימוני אינו שיטת חיוב ניטרלית, אלא חיסרון מבני עבור הקונה.

סיכון תקציבי: הספק שולט ביחידה, לא הקונה

בעזרת מודל תמחור מבוסס אסימונים, החברה מתחייבת לתקציב שנתי עבור יחידת עלות שאת מחירה יכול הספק לשנות בכל עת וצריכתה מתנהגת באופן לא ליניארי עם עלייה בשימוש. לדוגמה, במאי 2026, Anthropic הודיעה כי מנויים לכלי סוכנים ואינטגרציות צד שלישי יקבלו קצבאות חודשיות נפרדות המחויבות בתעריפי API סטנדרטיים. זוהי התאמת מחיר חד-צדדית שמפחיתה באופן מיידי מערכו של תקציב קיים. אובר חוותה זאת ממקור ראשון: תקציב שחושב לשנים עשר חודשים אזל תוך ארבעה. אימוץ לא היה הבעיה - אלא למעשה סימן להצלחה. הבעיה הייתה שיחידת ה"אסימון" גדלה באופן אקספוננציאלי ברגע שמיושמים זרימות עבודה מבוססות סוכנים, בעוד שהתקציב תוכנן באופן ליניארי.

סיכון אימוץ: שימוש ויצירת ערך מנותקים

מערכת מבוססת אסימונים גובה תשלום עבור כוח מחשוב, לא עבור תוצאות. מודל המשתמש ב-100,000 אסימונים ומספק תשובה שגויה עולה בדיוק כמו מודל המשתמש ב-100,000 אסימונים ומספק תשובה נכונה. ניתוק זה של עלויות ותועלות הוא הבעיה הכלכלית הבסיסית. משמעות הדבר היא שחברה יכולה לבנות זרימת עבודה סביב מערכת מבוססת אסימונים, להפעיל את זרימת העבודה הזו ולשלם עבורה - מבלי לראות ערך מוסף מדיד כלשהו. העובדה ש-42 אחוז מהחברות נטשו את רוב יוזמות הבינה המלאכותית שלהן בשנת 2025, עלייה דרמטית מ-17 אחוז בשנה הקודמת, היא, לאור זאת, פחות בעיה טכנולוגית ויותר בעיית תמחור. ארכיטקטורת התמריצים הפגומה מובילה להשקעות שגויות שמתבררות רק לאחר חודשים של פעילות.

סיכון תחזית: שונות בלתי נשלטת בתכנון עלויות

עבור מנהלי כספים, חיוב אסימונים הוא קטגוריית הוצאה שמתנהגת כמו שגיאות גידור מטבע: היא אינה ניתנת למידול ביסודה משום שיותר מדי משתנים חיצוניים משפיעים על החיוב. כל מקרה שימוש חדש, כל משתמש פנימי חדש, כל שינוי בהתנהגות המודל, כל הגדלה בגודל חלון ההקשר - כל זה דוחף את החשבון לכיוון בלתי צפוי. לכך מתווסף מה שנקרא "התפשטות סוכנים": כאשר חברות פורסות זרימות עבודה מבוססות סוכנים במחלקות שונות, חוסר הוודאות מתרבה. כל סוכן חדש מוסיף ערך נוסף לפנקס האסימונים, ללא כל ערובה לתשואה. עם Claude Opus 4.7, Anthropic הציגה קפיצת גרסה שבשל שרשראות חשיבה מורחבות, צורכת כ-30 אחוז יותר אסימונים מקודמתה - עלייה של 30 אחוז בעלויות בן לילה, ללא אף עסקה חדשה או הזמנת לקוח חדשה שתצדיק זאת.

סיכון ממשל: הגנה על נתונים ותאימות גדלות עם הצריכה

בתעשיות מוסדרות - שירותים פיננסיים, שירותי בריאות, ביטוח - לכל קריאה לאסימון יש ממד של משילות: נתוני החברה מנותבים דרך תשתית הסקה של צד שלישי עם כל קריאה ל-API. משמעות הדבר היא שככל שנצרכים יותר אסימונים, כך יותר נתונים עוזבים את היקף האבטחה הפנימי. בסביבה המווסתת על ידי GDPR, SOC 2, HIPAA וחוק הבינה המלאכותית של האיחוד האירופי, הדבר מייצר עלויות תאימות, חשיפה לביקורת וסיכוני אחריות שעולים עם עוצמת השימוש. חיוב אסימונים וריבונות נתונים נמצאים אפוא במתח מבני: אלו המשתמשים ביותר בינה מלאכותית נוטלים אוטומטית סיכון רגולטורי רב יותר - בעיית תמריצים שמעכבת שימוש מאובטח וניתן להרחבה בבינה מלאכותית.

סיכון תוצאה: שתיקתם של ספקי בינה מלאכותית בנוגע להשפעה

הסיכון הכי פחות דנו בו הוא הסיכון הכי משמעותי. מודלים של תמחור אסימונים מודדים צריכה, לא יצירת ערך. הספק מקבל תשלום ללא קשר לשאלה האם לתוכנית הבינה המלאכותית של החברה יש השפעה מדידה על רווח והפסד או שהיא מצטרפת לרשימה הארוכה של פיילוטים של GenAI תאגידיים שלא הצליחו לייצר תשואה מדידה. מחקר של MIT מציב נתון זה על 95 אחוזים. במילים אחרות, ברוב המכריע של המקרים, החברה משלמת מבלי לקבל כל ערך כלכלי שניתן לאמת - ולספק אין תמריץ הקשור למודל העסקי לשנות זאת.

היגיון התמחור של התעשייה: שוק שלא ידע את ערכו שלו

שורש משבר המחירים הנוכחי טמון במקורותיו של שוק GenAI. התעשייה שיווקה את מוצריה לפני שהבינה את עלות השימוש האמיתית שלהם בסביבות ארגוניות פרודוקטיביות. מודלים של תמחור קבוע ותמחור מבוססי אסימונים נתפסו כאסטרטגיות כניסה לשוק, ולא כמבנים מסחריים בני קיימא. GitHub עצמו הודה כי מודלים קיימים של תעריף קבוע ספגו את עלויות ההסקה בפועל וכי מנגנון זה אינו בר קיימא עבור ספקים בטווח הארוך.

זה יצר מצב פרדוקסלי: ככל שהאימוץ מוצלח יותר, כך גדל הסיכון להפסד עבור הספק, וכך גדל הסיכון התקציבי עבור החברה. אובר היא הדוגמה החיה ביותר: אימוץ קוד של קלוד גדל מ-32 ל-84 אחוזים בקרב המפתחים, 70 אחוזים מהקוד המבוצע נוצר על ידי בינה מלאכותית, ורווחי הפרודוקטיביות היו אמיתיים ומדידים. ובכל זאת, פרבין נפאלי נאגה, מנהל הטכנולוגיה הראשי של אובר, תיאר את המצב כך: "חזרתי לשולחן השרטוט כי התקציב שחשבתי שהוא הכרחי כבר נוצל". הטכנולוגיה עבדה. מודל התמחור לא.

זה גם מסביר מדוע מיקרוסופט החליטה לבטל את רישיונות Claude Code עבור חטיבת Experiences & Devices שלה ולהעביר מפתחים ל-GitHub Copilot CLI. הסיבה הרשמית שניתנה היא "איחוד שרשרת כלים" - באופן פנימי, זו הייתה החלטה פיננסית. אלפי מהנדסים שפיתחו Windows, Microsoft 365, Teams, Outlook ו-Surface השתמשו רבות ב-Claude Code מאז השקת הפיילוט שלו בדצמבר 2025, ועלויות ה-token מיצו את התקציב השנתי הרבה לפני סוף השנה. מיקרוסופט, החברה שהשקיעה 13 מיליארד דולר ב-OpenAI ומפעילה את הענן עליו פועלות רוב מעבדות ה-front-end של בינה מלאכותית, בחנה את המספרים והחליטה על סמך עלות, ולא על סמך ערך נתפס.

מודלים של תמחור מוכווני תוצאות: ארכיטקטורה מסחרית שונה, ללא הנחה

המונח תמחור מבוסס תוצאות לעתים קרובות אינו מובן נכון בשוק. לא מדובר במחירי אסימונים זולים יותר, חבילות הנחה או תשלום דחוי. זוהי ארכיטקטורה מסחרית שונה במהותה: הספק מקבל תשלום עבור כל משימה שהושלמה - אם ורק אם תוצאה עסקית מוגדרת מאומתת בתהליך עבודה מוגדר. לא עבור המאמץ החישובי שנגרם לאורך הדרך.

במשך עשרות שנים, תוכנות ארגוניות פעלו על פי עיקרון של מערכת ו-SLA: הספק אחראי על כלכלת היחידה ומבטיח שהפתרון מספק את התוצאות המובטחות. מערכות ERP, פלטפורמות CRM, תוכנות חשבונאות - אף אחת מהקטגוריות הללו לא חויבה מעולם על סמך גישה למסד נתונים, קריאות API או מחזורי חישוב. הן מחייבות על סמך משתמשים, מודולים או תוצאות ביצועים. תמחור בינה מלאכותית חייב לעמוד באותו סטנדרט.

עם זאת, מודל התמחור המבוסס על תוצאות הוא בר-קיימא מבחינה כלכלית רק אם הספק יכול לספוג את השונות בעצמו - כלומר, אם בנה יעילות פלטפורמה המאפשרת לו להפנים את הסיכון. רוב הספקים אינם יכולים לעשות זאת. עלויות הייצור שלהם הן אותו מונה אסימוני שהחברה נושאת - והם פשוט מגלגלים את המונה הלאה. תמחור המבוסס על תוצאות דורש מהספק לקשר את הכנסתו שלו לתוצאה. זהו פרופיל סיכון שונה באופן מהותי - ומסביר מדוע מודל תמחור זה עדיין נדיר בשוק.

🤖🚀 פלטפורמת בינה מלאכותית מנוהלת: פתרונות בינה מלאכותית מהירים, בטוחים וחכמים יותר עם UNFRAME.AI

פלטפורמת בינה מלאכותית מנוהלת - תמונה: Xpert.Digital

כאן תלמדו כיצד החברה שלכם יכולה ליישם פתרונות בינה מלאכותית מותאמים אישית במהירות, בצורה מאובטחת וללא חסמי כניסה גבוהים.

פלטפורמת בינה מלאכותית מנוהלת היא הפתרון השלם והחסר דאגות שלכם לבינה מלאכותית. במקום להתמודד עם טכנולוגיה מורכבת, תשתית יקרה ותהליכי פיתוח ארוכים, אתם מקבלים פתרון מוכן מראש המותאם לצרכים שלכם משותף מתמחה - לעתים קרובות תוך מספר ימים בלבד.

היתרונות המרכזיים במבט חטוף:

⚡ יישום מהיר: מרעיון ליישום מוכן לשימוש תוך ימים, לא חודשים. אנו מספקים פתרונות מעשיים היוצרים ערך מוסף מיידי.

🔒 אבטחת מידע מקסימלית: המידע הרגיש שלך נשאר אצלך. אנו מבטיחים עיבוד מאובטח ותואם ללא שיתוף מידע עם צדדים שלישיים.

💸 אין סיכון פיננסי: אתם משלמים רק על תוצאות. השקעות גבוהות מראש בחומרה, תוכנה או כוח אדם מבוטלות לחלוטין.

🎯 התמקדו בעסק הליבה שלכם: התרכזו במה שאתם עושים הכי טוב. אנחנו דואגים לכל תהליך היישום הטכני, התפעול והתחזוקה של פתרון הבינה המלאכותית שלכם.

📈 עמיד לעתיד וניתן להרחבה: הבינה המלאכותית שלכם גדלה איתכם. אנו מבטיחים אופטימיזציה וגמישות מתמשכת, ומתאימים את המודלים לדרישות חדשות בצורה גמישה.

מידע נוסף כאן:

פלטפורמת בינה מלאכותית מנוהלת

ריבונות נתונים לעומת היפר-סקיילרים: מי ינצח בקרב על תשתית הבינה המלאכותית?

מודל מעשי: כיצד פועלת אספקת בינה מלאכותית מוכוונת תוצאות

פלטפורמות המיישמות באופן עקבי את עקרון מבוסס התוצאות פועלות לפי היגיון מעורבות שונה. במקום להשכיר תשתית ופשוט להריץ את המונה, הן מזהות תחילה את זרימת העבודה בעלת הערך הגבוה ביותר עבור מקרה השימוש של החברה - כלומר, התהליך שיכול לספק השפעה מדידה במהירות הגבוהה ביותר. לאחר מכן, פתרון מוכן לייצור נפרס בתוך התשתית של החברה: בענן הארגוני, מקומי, בענן פרטי, או כהצעת SaaS מנוהלת במלואה, כאשר הנתונים לעולם לא עוזבים את היקף החברה. התשלום מתחיל רק לאחר שהתוצאה זמינה והלקוח מרוצה.

למודל זה השלכות מרחיקות לכת על שיתוף סיכונים. הוא מאלץ את הספק למקד את משאביו במקרי שימוש שמייצרים ערך אמיתיים ולא באלו שצורכים טוקנים רבים. הוא יוצר יישור אינטרסים ישיר בין הספק ללקוח: שניהם מרוויחים כאשר הבינה המלאכותית אכן פועלת; אף אחד מהם לא מרוויח על חשבון השני כאשר היא לא פועלת. עבור תעשיות מפוקחות, ההנחה שהנתונים אינם עוזבים את היקף החברה מספקת גם ארכיטקטורת תאימות התואמת ל-GDPR, SOC 2, HIPAA וחוק הבינה המלאכותית של האיחוד האירופי.

יתרון מרכזי של פלטפורמות מיושמות היטב וממוקדות תוצאות הוא מבנה הידע המצטבר שלהן: כל זרימת עבודה שהושלמה בהצלחה בנויה על בסיס ידע פנימי משותף שהופך בעל ערך רב יותר עם כל משימה עוקבת. זה עומד בניגוד מוחלט לפריסות מבוססות אסימונים, אשר אמנם צוברות עלויות, אך אינן מעגנות ידע מוסדי בתוך החברה.

נקודת המבט של מנהל הכספים: חיוב אסימונים כבעיית תקציב קטגורית

עבור אנשי מקצוע בתחום הפיננסים, חיוב באמצעות טוקן מייצג סוג חדש לחלוטין של הוצאה תפעולית שעבורה לא קיימים מבני ממשל מבוססים. עלויות ענן - מחשוב, אחסון, רשת - עברו מקצועיות בחמש עשרה השנים האחרונות. FinOps כדיסציפלינה הוליד שיטות, כלים ויחידות ארגוניות שהופכות את הוצאות הענן לחיזוי ובקרה. עדיין חסרה מקבילה מלאה לעלויות זמן ריצה של סוכני בינה מלאכותית.

צריכת אסימונים אינה משתנה בהתאם למספר המשתמשים, אלא בהתאם לשאיפת ההנחיות, אורך חלונות ההקשר, מספר הסוכנים הפועלים בו זמנית ומורכבות שרשראות ההיגיון. משמעות הדבר היא שחברה המעבירה 100 מהנדסים מהשלמה אוטומטית פשוטה לזרימות עבודה מבוססות סוכנים יכולה להכפיל את מאמץ הבינה המלאכותית החודשי שלה פי חמישה עד עשרים - מבלי להוסיף אפילו משתמש חדש אחד. הנחות תכנון סטנדרטיות המבוססות על מספר משתמשים או נפחי פעילויות פגומות מבחינה מבנית בהקשר זה.

יש לכך השלכות קונקרטיות על תכנון התקציב. מבנה ההוצאות דורש מנגנוני בקרה דומים לאלה של אנרגיה: מדידה בזמן אמת, התראות סף, מכסות צוות ומגבלות קשות ברמת הסוכן. חברות שלא ייישמו את אלה לפני תחילת האימוץ יתמודדו עם ההשלכות כאשר התקציב כבר ינוצל - כמו אובר. לחברה לא היו מגבלות לפי צוות, לא מעקב מרכזי ולא נראות בזמן אמת של הצריכה עד שמנהל הטכנולוגיה הראשי דיווח בטרם עת על התקציב השנתי כמנוצל.

דינמיקת שוק: למי יש את הכוח בשינוי המחירים הזה

טרנספורמציית המחירים הנוכחית אינה סימטרית. לחברות גדולות כמו מיקרוסופט, גוגל ואמזון יש מינוף מבני שמבדיל אותן מספקיות קטנות יותר: הן שולטות בערוצי הפצה, חוזים ארגוניים, תשתיות ענן וכלי פיתוח. מיקרוסופט לא סגרה את Claude Code משום ש-Copilot טובה יותר - סקרים פנימיים הראו שמפתחים העדיפו את Claude Code. החברה סגרה אותו משום שהוא שולט בהפצה ואינו יכול לשלוט או למנף אסטרטגית את עלויות האסימונים עבור מוצר מתחרה.

דינמיקה זו משמעותית לפירוש טרנספורמציית המחירים בכללותה. עבור חברות היפר-סקיילר, המעבר מתעריפים קבועים והכנסת חיוב טוקנים אינו רפורמה במחירים - אלא אופטימיזציה של הכנסות. אלו השולטים בתשתית שעליה פועלים המודלים, שמפעילים את מערכות החיוב ומחזיקים בחוזים הארגוניים נהנים באופן מבני מחיוב מבוסס צריכה. המודל הנגדי - תמחור מוכוון תוצאות - מסכן את עמדות ההכנסות הללו משום שהוא מאלץ את הספק לשאת בסיכון במקום להעביר אותו הלאה.

עבור עסקים בינוניים ותאגידים שאינם נמנים עם חברות ההיפר-סקיילר, זוהי סוגיית כוח משמעותית בכל הנוגע לחידוש החוזה הבא. על פי ניתוח של ג'יי.פי מורגן, הלחץ על תשתית הבינה המלאכותית עלול ליצור חיכוך כלכלי לפני שהתשואות המובטחות יתממשו. אלו שלא ינהלו משא ומתן פעיל על חלוקת הסיכונים בחוזה הבינה המלאכותית הבא יקבלו עמדה סטנדרטית שאינה נוחה להם מבחינה מבנית.

המסר מכלכלת השקעות: אם יעילות אינה מטרה, היא הופכת לבעיה

יש טיעון נגדי לביקורת על העלויות של חיוב מבוסס טוקנים, טיעון שיש להתייחס אליו ברצינות. באובר, בינה מלאכותית ייצרה 70 אחוז מהקוד המבוצע ו-11 אחוז מכלל עדכוני ה-backend החיים. מהנדס בסן פרנסיסקו עולה לחברה משמעותית יותר בשנה מאשר 2,000 דולר לחודש בעלויות טוקנים. אם קידוד המופעל על ידי בינה מלאכותית יגדיל את הפרודוקטיביות אפילו באחוז חד-ספרתי מהמשאב היקר ביותר של החברה, התשואה על ההשקעה עשויה לעלות על העלויות.

הטיעון אינו שגוי - הוא אינו שלם. ראשית, הוא נכון רק אם עליות הפרודוקטיביות ניתנות לכימות וניתנות לייחוס סיבתית לערכת הכלים, דבר שנמדד לעיתים רחוקות באופן שיטתי ברוב החברות. שנית, הוא מניח מראש שזמן ההנדסה שנחסך מתורגם לחיסכון בעלויות או להכנסות נוספות המיוחסות ישירות - ולא, כמו בארגונים רבים, פשוט מוביל לעבודה נוספת, אשר בתורה צורכת יותר טוקנים ממערכת הבינה המלאכותית. שלישית, ההשוואה תקפה רק אם תוצאת עבודת הבינה המלאכותית מאומתת: קוד שנוצר אך לא משמש באופן פרודוקטיבי אינו שווה ערך לערך של עבודת הנדסה בכירה.

לכן, הטיעון הבסיסי לתמחור ממוקד תוצאות נותר תקף: אם התשואה אמיתית, הספק יכול לבסס אותה חוזית ולקשר את הכנסתו אליה. אם הוא לא יכול או לא רוצה לעשות זאת, יש לכך סיבות מבניות, הפועלות לרעת הקונה.

השלכות אסטרטגיות על הנהלת החברה

אירועי המחצית הראשונה של 2026 יספקו להנהלת החברה מסקנות תפעוליות ברורות.

ראשית, בקרת הוצאות המונעת על ידי בינה מלאכותית דורשת דיסציפלינה ייעודית של FinOps, אשר חייבת להיות בנויה באופן דומה ל-FinOps בענן אך דורשת מתודולוגיות משלה. צריכת אסימונים אינה לינארית, ספציפית לסוכן ותלויה בגרסת המודל. לוחות מחוונים אינם מספיקים; מה שדרוש הם מגבלות תקציב בזמן אמת ברמת הצוות והסוכן, מנגנוני ביטול אוטומטיים בעת חריגה מספי חשבונות, ויומני ביקורת ברמת הריצה הבודדת.

שנית, פרויקטים פיילוט המשתמשים בחיוב אסימוני אינם מספקים תחזיות אמינות לעלויות הייצור. פרויקט פיילוט שעולה 1,000 אירו לחודש יכול להגדיל את השימוש המקורי שלו בסביבת ייצור עד פי 100, ובכך לחרוג מהמשאבים המתוקצבים. תכנון הוצאות בינה מלאכותית חייב להתבסס על הנחות ייצור, ולא על שימוש בפרויקט פיילוט.

שלישית, לכל חידוש חוזה עם ספקי בינה מלאכותית יש ממד משא ומתן אסטרטגי שכרגע אינו מנוצל מספיק. השאלה שכל חברה צריכה לשאול את ספק הבינה המלאכותית שלה בפגישה הבאה היא פשוטה ומדויקת: כמה אשלם אם זה לא יעבוד? ספק שאינו מוכן לחלוק את הסיכון השלילי נמצא בניגוד עניינים עם הקונה שלא ניתן להתעלם ממנו בתהליך רכש רציני.

רביעית, ריבונות נתונים היא משתנה עלות וסיכון מובחן, לא רק סוגיית תאימות. חברות בתעשיות מוסדרות המשתמשות בשירותים מבוססי אסימונים בענן הציבורי צוברות מאמצי תאימות, חשיפה לביקורת וסיכוני אחריות פוטנציאליים עם כל יחידת שימוש. בינה מלאכותית ריבונית - כלומר, תשתית בינה מלאכותית המופעלת בתוך היקף החברה עצמה - תגיע לשוויון טכנולוגי עם מודלים של חזית ענן עד 2026: על פי מדד הבינה המלאכותית HAI 2026 של סטנפורד, פער הביצועים בין המודלים הטובים ביותר בעלי משקל פתוח לבין המערכות הקנייניות המתקדמות ביותר יצטמצם לממוצע של שלושה חודשים.

תחזית: מה המשמעות של טרנספורמציית המחירים לשנת 2027

השוק נמצא בתנודה. המעבר מתעריפים קבועים לחיוב טוקנים הוא ניצחון לטווח קצר עבור הספקים - ההכנסות עולות עם השימוש. בטווח הבינוני, לעומת זאת, זהו זרז לשלוש התפתחויות מקבילות שישנו באופן מהותי את מבנה המחירים.

ראשית, הלחץ התחרותי יגבר עקב מודלים של קוד פתוח. אם עלויות טוקנים קנייניות עבור פריסות סוכנויות ברחבי הארגון יגיעו לשש ספרות בשנה, ומודלים בעלי משקל פתוח יספקו ביצועים דומים על חומרה מקומית, חישוב עלות הבעלות הכוללת יטה לטובת תשתית מקומית - במיוחד עבור חברות אירופאיות שמעדיפות תאימות לתקנות ה-GDPR ולריבונות נתונים.

שנית, מודלים של תמחור מוכווני תוצאות יצמחו בשוק משום שהם מעניקים ללקוחות ארגוניים עמדת משא ומתן שחיוב באמצעות טוקן, מעצם הגדרתו, אינו מציע. למרות שרק למעטים מהספקים כיום יש את יעילות הפלטפורמה להציע מודל זה בצורה רווחית, התחרות תכריח חיקוי.

שלישית, ניהול בינה מלאכותית - כולל מדידת החזר ההשקעה (ROI) של בינה מלאכותית, מעקב אחר תרומות ליצירת ערך והגדרה חוזית של מדדי הצלחה - יהפוך לתחום עסקי נפרד, בהשוואה להגנה על נתונים או אבטחת סייבר. גרטנר צופה כי ההוצאות העולמיות על בינה מלאכותית יגיעו ל-3.34 טריליון דולר עד 2027. בקנה מידה זה, מנהלים בחברות לא יקבלו עוד בינה מלאכותית כקטגוריית תקציב ללא מדדי הצלחה ניתנים לאימות.

השאלה המכרעת אינה האם חיוב מבוסס אסימונים יוחלף במודלים מוכווני תוצאות - ההיגיון הכלכלי מצביע על כך שזה יקרה. השאלה היא האם חברות יעצבו באופן פעיל את המעבר הזה או יאפשרו לו להיכפות עליהן באופן פסיבי על ידי חשבונות הולכים וגדלים. אלו שמתאימים כעת את ארכיטקטורת החוזים של השקעות הבינה המלאכותית שלהם מושכים בקצה הנכון של החבל.

ייעוץ - תכנון - יישום