Скандал з Llama 4 від Meta: чому маніпульовані бенчмарки загрожують усій індустрії штучного інтелекту

Konrad Wolfenstein

7 місяців тому

Скандал з Llama 4 від Meta: чому маніпульовані бенчмарки загрожують усій індустрії штучного інтелекту

Скандал з Llama 4 від Meta: Чому маніпулювання бенчмарками загрожує всій індустрії штучного інтелекту – Зображення: Xpert.Digital

ЛеКун проти Цукерберга: внутрішня боротьба за владу, яка запечатує кінець чистих досліджень штучного інтелекту

Тремтіння в Кремнієвій долині: чому конфлікт на Meta сповіщає про кінець золотої лихоманки в галузі штучного інтелекту

Рідко трапляється, щоб внутрішня робота технологічної компанії приховувала стан цілої галузі. Але саме це відбувається в Meta Platforms. Те, що почалося як чутки про розбіжності в розробці мовної моделі Llama 4, переросло у фундаментальну кризу, яка виходить далеко за межі кампусу в Менло-Парку. В її основі лежить запеклий конфлікт між науковою доброчесністю та жорстоким тиском ринків капіталу, уособленим у неминучому відході легенди штучного інтелекту Яна ЛеКуна та агресивній реструктуризації під керівництвом Марка Цукерберга.

Новина про те, що показники флагманської моделі Llama 4, очевидно, були підлаштовані, щоб не відставати від OpenAI та Google, – це більше, ніж просто PR-катастрофа. Це попереджувальний знак для галузі, яка, можливо, зросла занадто швидко і тепер досягає своїх технологічних та етичних меж. Чи ми вже досягли плато технології LLM? Чи витрачаються мільярди доларів на обладнання для масштабування архітектури, яка веде в глухий кут? І що це означає для глобальних інновацій, коли дослідницькі лабораторії перетворюються на звичайні фабрики з виробництва продукції?

Наступний аналіз аналізує цей історичний розрив у трьох вимірах: ми розглядаємо **економічні механізми**, які призвели до підриву довіри, ставимо під сумнів **технологічні дебати** навколо меж генеративного штучного інтелекту та аналізуємо **геополітичний зсув**, спричинений цією внутрішньою культурною війною. Дізнайтеся, чому справа Мета проти ЛеКуна знаменує собою вододіл, який має насторожити інвесторів, технологічних лідерів та Європу.

Глухий кут на 100 мільярдів доларів: Чому провідні дослідники кажуть, що програми магістра права ніколи не досягнуть справжнього інтелекту

Нещодавні події навколо Meta Platforms, відхід Яна Лекуна та суперечки навколо мовної моделі Llama 4 знаменують собою набагато більше, ніж просто внутрішні потрясіння в технологічному гіганті. Ми спостерігаємо історичний розрив у розвитку штучного інтелекту, який матиме значні наслідки для світової технологічної економіки, інвестиційних стратегій у Кремнієвій долині та геополітичного розподілу інноваційної сили. Протягом тривалого часу симбіоз академічної досконалості, представлений командою Лекуна «Фундаментальні дослідження штучного інтелекту» (FAIR), та комерційної масштабованості Meta вважався золотим стандартом галузі. Здається, що ця модель зараз зазнала краху.

Аналіз цієї ситуації вимагає глибокого занурення на трьох рівнях: структури економічних стимулів, які призвели до ймовірної маніпуляції даними, фундаментальні технологічні дебати щодо життєздатності моделей великих мов (LLM) та організаційна трансформація дослідницьких підрозділів у фабрики продуктів. Те, що відбувається в Meta, є симптомом галузі, яка, можливо, зросла занадто швидко і зараз досягає меж фізики, доступності та наукової доброчесності. Коли компанія розміром з Meta, яка позиціонує себе як еталон штучного інтелекту з відкритим кодом, змушена прикрашати орієнтири, щоб залишатися актуальною в конкуренції з OpenAI, Google та Anthropic, це вказує на небезпечний перегрів ринку. Це ставить питання про те, чи досягли ми вже плато продуктивності для цієї конкретної технологічної архітектури, і чи призвели масові капіталовкладення останніх років до технологічного глухого кута.

Ерозія довіри: коли закон Гудхарта зустрічається з мільярдними інвестиціями

Викриття щодо маніпульованих результатів бенчмарків Llama 4, з економічної точки зору, є класичним прикладом дії закону Гудхарта. Цей закон стверджує, що показник перестає бути хорошим показником, як тільки він стає метою. У гіперконкурентному середовищі генеративного штучного інтелекту такі бенчмарки, як MMLU або HumanEval, вже не є просто академічними мірилами, а валютою, в якій торгуються ринкова вартість, ціни на акції та довіра інвесторів. Коли Янн ЛеКун визнає, що результати були підроблені шляхом оптимізації певних моделей для конкретних тестів, це показує величезний тиск, під яким працюють команди розробників. Йдеться вже не про наукову істину, а про підтримку наративного домінування на Уолл-стріт.

Це порушення довіри має серйозні наслідки для екосистеми корпоративного програмного забезпечення та B2B-додатків. Компанії, які базують свою цифрову трансформацію на припущенні, що моделі з відкритим кодом, такі як Llama, являють собою надійну та прозору альтернативу власницьким моделям, таким як GPT-4, повинні переглянути свій аналіз ризиків. Якщо дані про продуктивність базової моделі не відображають реальності у виробництві, компанії, що впроваджують штучний інтелект, несуть реальні витрати через несправності, підвищені потреби в налаштуванні та неефективні процеси. В епоху штучного інтелекту цілісність бази даних є еквівалентом кредитоспроможності у фінансовому секторі. Втрата довіри до Meta може призвести до того, що ІТ-директори та технічні директори по всьому світу повернуться до закритих, контрактно забезпечених моделей, що потенційно може відкинути весь рух з відкритим кодом у секторі штучного інтелекту на роки назад.

Крім того, цей інцидент підкреслює обмеження сучасних методологій оцінювання. Ми досягли точки, коли моделі настільки складні, а бенчмарки настільки статичні, що «перенавчання» – запам'ятовування тестових питань штучним інтелектом – стає нормою. З економічної точки зору, це неправильний розподіл ресурсів. Замість того, щоб інвестувати капітал у покращення загальних можливостей систем щодо вирішення проблем, він спрямовується на оптимізацію для синтетичних тестових сценаріїв. Це штучно завищує сприйняту продуктивність технології та призводить до бульбашки в оцінках стартапів штучного інтелекту та цінах акцій залучених технологічних гігантів. Таким чином, визнання ЛеКуна є тим уколом, який, хоча ще не лопає цю бульбашку, значно її здуває.

Від дослідницького оазису до фабрики продуктів: жорстока реорганізація владних відносин

Реакція Марка Цукерберга на порушення в Llama 4 та пов'язану з цим маргіналізацію підрозділу GenAI знаменує кінець епохи в Meta. Протягом понад десятиліття компанія підтримувала FAIR, дослідницький підрозділ, який функціонував радше як університет, ніж як продуктовий підрозділ. Ця ера «блакитних досліджень», де наукові прориви можна було здійснювати без прямого тиску прибутку, закінчилася. Економічні реалії війн ШІ тепер диктують безжальную орієнтацію на продукт. Гнів Цукерберга та подальша втрата довіри є показниками величезного стресу, під яким працює керівництво. Meta інвестувала мільярди в обладнання (кластери NVIDIA H100) і тепер має виправдати акціонерам, як ці витрати окупляться.

Організаційні зміни відтісняють фундаментальних дослідників на узбіччя та піднімають менеджерів продуктів та інженерів, які спеціалізуються на швидкому впровадженні, до центрів влади. Це призводить до класичної «витоку мізків». Найкращі дослідники, чия мотивація внутрішньо зумовлена науковою цікавістю, не можуть бути утримані в середовищі, оптимізованому для квартальних результатів та випусків продуктів. Відтік, який описує ЛеКун, – це не просто втрата персоналу, а втрата інституційних знань. В економіці знань людський капітал є вирішальним фактором виробництва. Якщо Meta втратить цей капітал, вона втратить свою здатність до інновацій у довгостроковій перспективі, навіть якщо вона може здаватися більш ефективною в короткостроковій перспективі завдяки агресивним циклам продуктів.

Цей розвиток подій також слід розглядати на тлі загальної технологічної рецесії та програм підвищення ефективності. «Рік ефективності», проголошений Цукербергом, не пощадив і відділ штучного інтелекту. Романтизм ранніх років розвитку ШІ поступається місцем жорсткій індустріалізації. Для решти працівників це означає культурний перехід від «Рухайтеся швидко та ламайте справи» до «Рухайтеся швидко та не потрапляйте». Психологічна безпека, необхідна для того, щоб робити помилки та навчатися на них — наріжний камінь усієї наукової роботи — була серйозно пошкоджена рішенням кримінального суду проти команди Llama-4. Ті, хто боїться пропустити контрольні показники, будуть більш схильні маніпулювати ними, ніж визнавати, що технологічний підхід досягає своїх меж.

Новий вимір цифрової трансформації з «керованим ШІ» (штучним інтелектом) – платформа та рішення B2B | Xpert Consulting

Новий вимір цифрової трансформації з «керованим ШІ» (штучним інтелектом) – платформа та рішення B2B | Xpert Consulting - Зображення: Xpert.Digital

Тут ви дізнаєтеся, як ваша компанія може швидко, безпечно та без високих бар'єрів входу впроваджувати індивідуальні рішення на основі штучного інтелекту.

Керована платформа штучного інтелекту — це ваше комплексне та безтурботне рішення для штучного інтелекту. Замість того, щоб мати справу зі складними технологіями, дорогою інфраструктурою та тривалими процесами розробки, ви отримуєте готове рішення, адаптоване до ваших потреб, від спеціалізованого партнера — часто всього за кілька днів.

Основні переваги з першого погляду:

⚡ Швидке впровадження: від ідеї до готового до використання застосунку за лічені дні, а не місяці. Ми пропонуємо практичні рішення, які створюють негайну додану цінність.

🔒 Максимальна безпека даних: Ваші конфіденційні дані залишаються з вами. Ми гарантуємо безпечну та відповідність вимогам обробку без передачі даних третім особам.

💸 Без фінансових ризиків: Ви платите лише за результат. Повністю виключаються значні початкові інвестиції в обладнання, програмне забезпечення чи персонал.

🎯 Зосередьтеся на своєму основному бізнесі: Зосередьтеся на тому, що ви робите найкраще. Ми подбаємо про повне технічне впровадження, експлуатацію та обслуговування вашого рішення на базі штучного інтелекту.

📈 Орієнтований на майбутнє та масштабований: Ваш ШІ зростає разом з вами. Ми забезпечуємо постійну оптимізацію та масштабованість, а також гнучко адаптуємо моделі до нових вимог.

Більше інформації тут:

Кероване рішення на основі штучного інтелекту – промислові послуги зі штучним інтелектом: ключ до конкурентоспроможності в секторах послуг, промисловості та машинобудування

За лаштунками світу штучного інтелекту: хибні обіцянки та запекла боротьба за владу

Культурний колапс: конфлікт між академічною автономією та метушнею Кремнієвої долини

Призначення Александра Ванга, засновника Scale AI, керівником нової лабораторії моделей штучного інтелекту Frontier є символічним актом. Ван втілює архетип молодого, агресивного підприємця Кремнієвої долини: швидкого, орієнтованого на дані, прагматичного та менш зацікавленого в академічних нагородах, ніж у домінуванні на ринку. Його компанія Scale AI зростала, виконуючи «брудну роботу» з розробки ШІ — маркування даних за допомогою легіонів низькооплачуваних працівників. Те, що цей підхід тепер стоїть вище академічної аристократії Яна ЛеКуна, являє собою масштабний культурний зсув. Це сигналізує про те, що Мета більше не бачить майбутнє ШІ в теорії, а в величезному обсязі даних та швидкості ітерацій.

Критика ЛеКуном недосвідченості Ванга та його нерозуміння потреб провідних дослідників розкриває глибокий розрив між двома поколіннями та двома філософіями. З одного боку, стара гвардія розглядає ШІ як наукову дисципліну, що вимагає терпіння та інтелектуальної чесності. З іншого боку, нове покоління «аферистів зі ШІ», для яких дослідження є лише засобом для досягнення мети масштабування продукту. Коли ЛеКун каже, що не можна вказувати такому досліднику, як він сам, що робити, він захищає принцип академічної свободи в корпоративному середовищі. Однак Мета вирішив, що ця свобода — це розкіш, яку вони більше не можуть собі дозволити або не хочуть собі дозволити в сучасному конкурентному середовищі.

З економічної точки зору, стратегія переманювання найкращих талантів у конкурентів за допомогою пакетів вартістю 100 мільйонів доларів – це палиця з двома кінцями. Вона призводить до інфляції заробітної плати в секторі до рівнів, які навряд чи можна вважати сталими навіть для великих технологічних компаній. Водночас дослідження в галузі організаційної психології показують, що одних лише грошових стимулів недостатньо для мотивації творчої досконалості. Якщо культурне середовище токсичне або сприймається як таке, що пригнічує інтелектуальну діяльність, навіть астрономічні зарплати не зупинять плинність кадрів. Ставка Мети на Ванга – це ставка на те, що інновації можна змусити впроваджувати за допомогою тиску керівництва та грошей. Однак історія технологічної галузі сповнена прикладів, коли цей підхід зазнав невдачі, оскільки він ігнорує тонку динаміку високопродуктивних команд.

Технологічна дилема: чому саме масштабування не призводить до суперінтелекту

Мабуть, найважливішим аспектом суперечки між ЛеКуном та Метою є їхня фундаментальна розбіжність щодо технологічного плану розвитку. Теза ЛеКуна про те, що великі мовні моделі являють собою глухий кут на шляху до загального штучного інтелекту (ЗШІ), є радикальною, але набирає все більшої популярності. Магістри права базуються на статистичному прогнозуванні наступного токена. Їм бракує внутрішнього розуміння причинності, фізики чи логіки. Вони імітують розуміння, відтворюючи закономірності зі своїх навчальних даних. ЛеКун стверджує, що хоча додавання все більшої кількості даних та обчислювальної потужності дає кращу мовну модель, воно ніколи не призводить до системи, яка справді «думає» або розуміє світ.

Ця критика вражає саму суть поточної інвестиційної стратегії всього сектору. Якщо ЛеКун має рацію, то сотні мільярдів доларів, які зараз вкладаються у будівництво дедалі більших центрів обробки даних та навчання дедалі більших «Трансформерів», є величезним хибним інвестуванням. Тоді ми опинимося на S-подібній кривій, де гранична вигода від кожного додатково інвестованого долара зменшується експоненціально. Той факт, що Llama 4, очевидно, намагалася чесно перевершити бенчмарки, може бути ранньою емпіричною ознакою того, що ми наближаємося до цієї точки зменшення прибутковості. Галузь перебуває у стані «LLM-піллінгу», майже релігійного переконання, що масштаб вирішує всі проблеми («Масштаб — це все, що вам потрібно»).

Для Meta позиція LeCun шкодить бізнесу. Компанія продає рекламу та намагається монетизувати свої платформи за допомогою агентів штучного інтелекту, заснованих саме на цій технології LLM. Коли її власний головний науковець публічно заявляє про обмеженість цієї технології, це підриває наратив, який Цукерберг розповідає інвесторам. Однак важливо розуміти, що LeCun не заперечує корисність LLM для конкретних завдань, а радше їхню придатність як архітектури для справжнього інтелекту. З економічної точки зору це означає, що ми можемо побачити диверсифікацію архітектур штучного інтелекту. Компанії, які зараз покладаються виключно на LLM, можуть через п'ять років опинитися на еквіваленті парового двигуна, тоді як їхні конкуренти вже розробляють двигун внутрішнього згоряння.

Відродження світових моделей: ставка Європи на альтернативну архітектуру штучного інтелекту

Заснування ЛеКуном «Advanced Machine Intelligence Labs» та його зосередження на V-JEPA (Joint Embedding Predictive Architecture) – це спроба знайти вихід із глухого кута. Концепція «Світових моделей» базується на ідеї, що ШІ повинен вивчити, як працює фізичний світ, подібно до того, як дитина навчається через спостереження та взаємодію задовго до того, як вона опанує мову. Навчаючись на відео та просторових даних, система має на меті побудувати внутрішню модель світу, яка дозволяє планувати, логічно міркувати та мати постійну пам'ять – можливості, яких значною мірою бракує в сучасних програмах магістратури з машинного інтелекту (LLM).

Економічні наслідки такого підходу величезні. Моделі світу теоретично можуть вимагати значно менше навчальних даних, ніж програми LLM, оскільки вони вивчають принципи, а не просто запам'ятовують текстові шаблони. Це знизить бар'єри для входу в розробку ШІ та зменшить залежність від гігантських текстових корпусів, які наразі викликають юридичні проблеми та проблеми з авторським правом. Крім того, цей підхід обіцяє більш надійні та безпечні системи ШІ, оскільки вони не галюцинують, а радше базують свої прогнози на послідовній моделі світу. Якщо AMI Labs досягне успіху, це може революціонізувати структуру витрат в галузі ШІ, змістивши фокус з масивної обчислювальної потужності на більш інтелектуальну архітектуру.

Не слід недооцінювати геополітичний вимір. Рішення ЛеКуна тісно пов'язати нову лабораторію з Францією та його пряме спілкування з президентом Макроном свідчать про те, що Європа розглядає це як можливість відновити технологічний суверенітет. Значною мірою пропустивши перший цикл генеративного ШІ (в якому домінували американські компанії) – за винятком таких яскравих моментів, як Mistral – зосередження Європи на «наступному поколінні» архітектури ШІ може представляти собою стратегічну нішу. Франція агресивно позиціонує себе як центр досліджень ШІ, і повернення ЛеКуна (принаймні інтелектуально та організаційно) є величезною перемогою для європейської екосистеми. Це спроба створити «момент Airbus» для ШІ: європейську альтернативу американським монополістам, засновану на фундаментальній науковій досконалості, а не на чистій ринковій силі.

Початок консолідації після хайпу?

Конфлікт між ЛеКуном та Метою є симптомом кінця фази генеративного штучного інтелекту «Дикого Заходу». Ми вступаємо у фазу консолідації та суворих перевірок реальності. Оманливий бенчмаркінг показує, що технологія розвивається не так швидко, як обіцяє маркетинг. Внутрішня культурна війна в Меті демонструє, що інтеграція передових досліджень у корпорації, орієнтовані на прибуток, залишається невирішеною організаційною проблемою. А заснування AMI Labs показує, що наукова еліта починає емансипуватися від домінуючих парадигм Кремнієвої долини.

Для бізнес-лідерів та осіб, що приймають рішення, цей аналіз дає три чіткі рекомендації. По-перше, здоровий скептицизм щодо бенчмарків постачальників є життєво важливим; внутрішнє тестування, орієнтоване на застосування, є важливим. По-друге, ставка на єдину архітектуру штучного інтелекту (LLM) є ризиком концентрації; технологічна диверсифікація та моніторинг альтернативних підходів, таких як світові моделі, повинні бути частиною довгострокової ІТ-стратегії. По-третє, управління талантами у сфері штучного інтелекту вимагає більше, ніж грошей; воно вимагає культури, яка цінує наукову доброчесність. Ті, хто ігнорує це, можуть бути здатні запускати продукти в короткостроковій перспективі, але зрештою відстануть у справжніх інноваціях. Таким чином, справа Meta проти LeCun є уроком корпоративного управління в епоху експоненціальних технологій.

Ваш глобальний партнер з маркетингу та розвитку бізнесу

☑️ Наша ділова мова – англійська або німецька

☑️ НОВИНКА: Листування вашою рідною мовою!

Konrad Wolfenstein

Я та моя команда раді бути вашим особистим консультантом.

Ви можете зв'язатися зі мною, заповнивши контактну форму тут wolfenstein@xpert.digital:, або просто зателефонувавши мені за номером +49 7348 4088 965. Моя адреса електронної пошти

Я з нетерпінням чекаю нашого спільного проєкту.

☑️ Підтримка МСП у стратегії, консалтингу, плануванні та впровадженні

☑️ Створення або переорієнтація цифрової стратегії та діджиталізації

☑️ Розширення та оптимізація процесів міжнародних продажів

☑️ Глобальні та цифрові торгові платформи B2B

☑️ Розвиток бізнесу Pioneer / Маркетинг / PR / Виставки

🎯🎯🎯 Скористайтеся перевагами великого, п'ятикратного досвіду Xpert.Digital в одному комплексному пакеті послуг | Розробка бізнес-аналітики, дослідження та розробки, XR, зв'язки з громадськістю та оптимізація цифрової видимості

Скористайтеся перевагами великого, п'ятикратного досвіду Xpert.Digital у комплексному пакеті послуг | Дослідження та розробки, XR, PR та оптимізація цифрової видимості - Зображення: Xpert.Digital

Xpert.Digital має глибокі знання в різних галузях. Це дозволяє нам розробляти індивідуальні стратегії, точно узгоджені з вимогами та викликами вашого конкретного сегмента ринку. Завдяки постійному аналізу ринкових тенденцій та моніторингу розвитку галузі ми можемо діяти проактивно та пропонувати інноваційні рішення. Поєднання досвіду та знань створює додаткову цінність та надає нашим клієнтам вирішальну конкурентну перевагу.

Більше інформації тут: