Китай і DeepSeek | Штучний інтелект: Як нова архітектура змінює ринок чіпів

Konrad Wolfenstein

5 місяців тому

Китай та DeepSeek | Штучний інтелект: мільярди інвестицій марні? Як нова архітектура змінює ринок чіпів

Китай та DeepSeek | Штучний інтелект: мільярди інвестицій марні? Як нова архітектура струшує ринок чіпів – Зображення: Xpert.Digital

Ефект бумеранга: як санкції США сприяли прориву ШІ в Китаї

294 000 доларів замість 100 мільйонів доларів: правда про цінову війну DeepSeek

Останній реліз китайської компанії DeepSeek, що займається штучним інтелектом, порушує фундаментальні питання щодо майбутнього штучного інтелекту. Наприкінці грудня 2025 року компанія представила новий метод навчання (під назвою Manifold-Constrained Hyper-Connections), який має потенціал змінити всю галузь. Поки західні технологічні гіганти інвестують сотні мільярдів доларів у масивні центри обробки даних та спеціалізовані чіпи, DeepSeek демонструє альтернативний шлях, заснований на архітектурній витонченості, а не на чистих капіталовкладеннях. Цей розвиток може похитнути економічні основи індустрії штучного інтелекту та започаткувати трансформацію, де успіх чи невдача визначатиметься не простою наявністю ресурсів, а інженерною експертизою.

Китайський підхід виник не з вибору, а з необхідності. Обмеження на експорт, запроваджені Сполученими Штатами, завадили китайським компаніям отримати доступ до найпотужніших чіпів штучного інтелекту Nvidia. Те, що спочатку здавалося стратегічним недоліком, стало прискорювачем альтернативних шляхів розвитку. DeepSeek мала досягти максимальної продуктивності з обмеженим обладнанням, створюючи методи, які тепер кидають виклик структурі витрат усієї галузі. Випуск моделі R1 у січні 2025 року, яка конкурувала з топовими американськими моделями, але була розроблена за значно меншу вартість, викликав шок на фондових ринках і змусив аналітиків у всьому світі переглянути свої моделі оцінки.

Пов'язано з цим:

DeepSeek V3.2: Конкурент на рівні GPT-5 та Gemini-3 ТА можливість розгортання локально на ваших власних системах! Кінець гігабітним центрам обробки даних зі штучним інтелектом?

Від гіперзв'язків до математичної стабільності

Технічна основа нового методу DeepSeek полягає в подальшому розвитку мереж у рамках штучного інтелекту. Традиційні нейронні мережі використовують так звані залишкові з'єднання – своєрідний «скорочений шлях», через який інформація передається між шарами мережі. Ці мости дозволяють навчати глибші мережі, запобігаючи згасанню сигналів навчання по дорозі. «Гіперз'єднання» DeepSeek розширюють цю концепцію, розширюючи потік інформації між шарами та дозволяючи створювати більш гнучкі шаблони. Це призводить до покращення продуктивності, але має суттєвий недолік: додаткова складність погіршує стабільність, оскільки інформація більше не передається так надійно, як за класичних з'єднань.

За допомогою традиційних скорочень інформація залишається практично незмінною під час передачі мережею, що призводить до стабільного навчання. Нові гіперз'єднання жертвують цією характеристикою заради більшої можливості навчання, але це призводить до значних коливань під час навчання великих моделей. DeepSeek в експериментах спостерігав, що рівень помилок несподівано зростав приблизно після 12 000 кроків навчання – явна ознака нестабільності. Керуючі сигнали для процесу навчання поводилися хаотично, що робило масштабування до потужніших моделей практично неможливим. Одночасно ширші з'єднання збільшували трафік даних, оскільки більше інформації доводилося переміщувати між пам'яттю та процесором.

Рішення DeepSeek проектує ці складні зв'язки в контрольований математичний простір («многовид») з фіксованими правилами. Цей математичний трюк відновлює стабільність, зберігаючи переваги більш насиченого обміну інформацією. Цей простір визначається спеціальними матрицями, де значення балансуються для підтримки загальної стабільності. Хоча це обмеження може здатися технічним, воно має далекосяжні практичні наслідки: воно гарантує, що сигнали не втрачаються і не зростають неконтрольовано під час їх проходження мережею.

Практичні випробування з моделлю з 27 мільярдами параметрів підтвердили її ефективність. Як стандартна, так і стабілізована гіперзв'язки перевершили базову модель, але стабілізована версія постійно досягала найкращих результатів. Стабільність навчання значно покращилася. У той час як стандартна модель демонструвала значні втрати після 12 000 кроків, навчання з новим методом проходило плавно та точно повторювало поведінку стабільної базової моделі. Сигнали навчання залишалися в межах норми протягом усього процесу, що вказує на фундаментальне вирішення проблеми стабільності.

Збільшення продуктивності не обходиться безцінь, але вартість напрочуд помірна. Метод збільшує обчислювальні зусилля приблизно на 6,7 відсотка порівняно зі стандартом. Ці незначні додаткові зусилля є незначними порівняно зі значним покращенням продуктивності, що робить метод однією з найефективніших стратегій у сучасних дослідженнях. DeepSeek також запровадив ретельну оптимізацію інфраструктури для зменшення навантаження на шляхи передачі даних. Ці оптимізації є критично важливими, оскільки у великих моделях вузьким місцем часто є не сама обчислювальна потужність, а швидкість передачі даних між пам'яттю та процесором.

Пов'язано з цим:

НОВИНКА! DeepSeek OCR – тихий тріумф Китаю: як штучний інтелект з відкритим кодом підриває домінування США у сфері чіпів

Економічна реальність, що стоїть за заголовками

Публічне обговорення витрат DeepSeek з самого початку було сповнене непорозумінь. Коли компанія представила свою модель R1 у січні 2025 року, циркулювали цифри, що свідчили про витрати на навчання базової моделі V3 на суму менше шести мільйонів доларів. Цю суму часто порівнювали з оціночними ста мільйонами доларів для GPT-4 від OpenAI, створюючи враження, що DeepSeek досягла двадцятип'ятикратної переваги у вартості. У вересні 2025 року DeepSeek опублікувала статтю в журналі Nature, в якій зазначалося, що витрати на навчання для R1 становили лише 294 000 доларів. Ця цифра знову домінувала у висвітленні ЗМІ та посилила сприйняття фундаментальної переваги у вартості.

Однак, детальніший аналіз показує складнішу картину. 294 000 доларів США стосуються виключно так званої фази після навчання, під час якої вже інтелектуальна модель удосконалюється за допомогою практики та зворотного зв'язку. Фактичні загальні витрати перевищують 5,87 мільйона доларів США лише за обчислювальний час, на додаток до інвестицій в обладнання приблизно на 51 мільйон доларів США. Ці цифри все ще не включають витрати на дослідження, підготовку даних, персонал та невдалі експерименти. Якщо врахувати ці фактори, фактичні витрати на розробку знаходяться в діапазоні, який, хоча й нижчий за порівнянні показники на Заході, не досягає разючих масштабів часто цитованих цифр.

Структуру витрат на розробку ШІ за своєю суттю важко зрозуміти. OpenAI ніколи не публікував точних цифр для GPT-4. Часто цитована оцінка в 100 мільйонів доларів походить від Сема Альтмана, який у 2023 році говорив про значно вищі витрати на базове навчання моделей. Аналогічні оцінки для новіших моделей, таких як GPT-4o, свідчать про те, що витрати значно знизилися завдяки сучасним методам, таким як спеціалізовані експертні мережі, ефективніші методи та оптимізована інфраструктура. Деякі аналізи оцінюють витрати на навчання для GPT-4o в діапазоні від 5 до 16 мільйонів доларів, що означало б, що різниця у вартості порівняно з DeepSeek значно менша, ніж сприймається публічно.

Тим не менш, досягнення DeepSeek залишається вражаючим. Компанія навчила свою модель V3 майже 2,8 мільйона годин роботи графічного процесора на 2048 чіпах H800 протягом двох місяців. H800 — це зменшена версія Nvidia H100 для китайського ринку, швидкість передачі даних якої значно знижена для дотримання експортних правил США. Ці чіпи значно менш потужні, ніж оригінали, що використовуються в західних центрах обробки даних, або навіть новіші процесори Blackwell. Той факт, що DeepSeek змогла розробити конкурентоспроможні моделі з таким обмеженим обладнанням, є справжнім проривом.

Архітектура «суміші експертів» відіграє центральну роль. DeepSeek V3 має загалом 671 мільярд параметрів, але активує лише 37 мільярдів обчислень на слово. Це означає, що лише частина моделі фактично працює над кожним запитом. Модель складається з багатьох спеціалізованих «експертів» та спільного пулу знань, причому для кожного кроку вибирається лише кілька спеціалістів. Така конструкція дозволяє значно збільшити знання моделі без пропорційного збільшення обчислювальних витрат. Кожен експерт може спеціалізуватися на певних темах, що призводить до кращої продуктивності та більшої ефективності.

Проблема такого експертного підходу полягає в балансуванні навантаження. Якщо деякі експерти постійно затребувані, а інші залишаються бездіяльними, виникають проблеми з ефективністю. Традиційні підходи використовують так звані «штрафні функції», які змушують модель використовувати всіх експертів однаково. Однак цей метод часто призводить до гірших відповідей, оскільки не завжди вибирається найкращий експерт. DeepSeek реалізував розумну стратегію балансування навантаження без таких штучних штрафів, забезпечуючи збалансоване використання експертів без шкоди для якості. Це нововведення мало вирішальне значення для успішного масштабування моделі.

Стратегічний імператив Китаю щодо інновацій

Розробку DeepSeek не можна розуміти окремо від геополітичного контексту. У жовтні 2022 року Сполучені Штати різко посилили експортний контроль над чіпами штучного інтелекту та виробничим обладнанням до Китаю. Ці заходи мали на меті обмежити здатність Китаю розробляти передові системи штучного інтелекту та їх військове застосування. Nvidia була змушена розробляти чіпи, спеціально модифіковані для китайського ринку. A800 та H800 з'явилися як зменшені версії топових моделей зі зниженою швидкістю, достатньою лише для дотримання експортних обмежень США.

У 2023 році США знову посилили контроль, заблокувавши навіть ці тимчасові рішення. Водночас було запроваджено обмеження на експорт високопродуктивної пам'яті, критично важливого компонента сучасних чіпів штучного інтелекту. Ці заходи змусили китайські компанії розробляти альтернативи або вдаватися до старішого, менш ефективного обладнання. Huawei, колись світовий лідер у телекомунікаціях, фактично був відрізаний від доступу до західних технологій чіпів і змушений розробляти власні рішення. Хоча процесори Huawei Ascend досягають лише частки продуктивності на чіп порівняно з Nvidia, вони можуть частково компенсувати це за рахунок величезного обсягу.

Показники виробництва ілюструють цю проблему. Очікується, що Huawei виробить близько 200 000 чіпів штучного інтелекту у 2025 році, тоді як Китай зміг легально імпортувати приблизно один мільйон модифікованих чіпів Nvidia за той самий період. Крім того, розрив у продуктивності зростає. Аналізи показують, що найкращі американські чіпи наразі приблизно в п'ять разів потужніші за найкращі пропозиції Huawei, і очікується, що цей розрив різко зросте до 2027 року. Навіть якби Huawei значно збільшила своє виробництво, компанія все одно не наблизилася б до обчислювальної потужності, яку Nvidia постачає по всьому світу до 2027 року.

Ці обмеження змусили китайських розробників стати радикально ефективними. Засновник DeepSeek Лян Веньфен усвідомив цю потребу на ранній стадії та ще у 2021 році, до посилення контролю, придбав десять тисяч графічних процесорів Nvidia A100. Ця прогресивна інвестиція дала DeepSeek вирішальну перевагу над конкурентами, які згодом мали доступ лише до гіршого обладнання. Колишній менеджер хедж-фонду застосував ту саму стратегічну передбачливість, яка зробила його успішним у фінансовому секторі. Його фонд High-Flyer керував мільярдами та був однією з найтехнологічно розвинених фінансових компаній Китаю.

Заснування DeepSeek у липні 2023 року було більше, ніж просто експериментом. Лян розглядав розвиток штучного інтелекту як ключовий технологічний проект століття та хотів вивести Китай на передовий план. В інтерв'ю він пояснив, що молоді стартапи у сфері штучного інтелекту мають хороші можливості конкурувати з відомими корпораціями, оскільки ринок переживає фундаментальну трансформацію. Вирішальним фактором, стверджував він, було не дотримання старих правил, а здатність гнучко адаптуватися до змін та реагувати на них.

Ця філософія знайшла відображення в підході DeepSeek до розробки. З самого початку компанія зосереджувалася на досягненні максимальних результатів з обмеженими ресурсами. У той час як західні компанії, такі як OpenAI та Anthropic, інвестували мільярди у дедалі більші моделі та масивні центри обробки даних, DeepSeek оптимізував архітектуру, навчання та програми для підвищення ефективності. Модель R1 вражаюче продемонструвала цю стратегію. Вона досягла результатів у математичних завданнях, порівнянних з найкращими американськими моделями, але вимагала архітектури, яка споживала значно менше обчислювальної потужності на відповідь.

Новий вимір цифрової трансформації з «керованим ШІ» (штучним інтелектом) – платформа та рішення B2B | Xpert Consulting

Новий вимір цифрової трансформації з «керованим ШІ» (штучним інтелектом) – платформа та рішення B2B | Xpert Consulting - Зображення: Xpert.Digital

Тут ви дізнаєтеся, як ваша компанія може швидко, безпечно та без високих бар'єрів входу впроваджувати індивідуальні рішення на основі штучного інтелекту.

Керована платформа штучного інтелекту — це ваше комплексне та безтурботне рішення для штучного інтелекту. Замість того, щоб мати справу зі складними технологіями, дорогою інфраструктурою та тривалими процесами розробки, ви отримуєте готове рішення, адаптоване до ваших потреб, від спеціалізованого партнера — часто всього за кілька днів.

Основні переваги з першого погляду:

⚡ Швидке впровадження: від ідеї до готового до використання застосунку за лічені дні, а не місяці. Ми пропонуємо практичні рішення, які створюють негайну додану цінність.

🔒 Максимальна безпека даних: Ваші конфіденційні дані залишаються з вами. Ми гарантуємо безпечну та відповідність вимогам обробку без передачі даних третім особам.

💸 Без фінансових ризиків: Ви платите лише за результат. Повністю виключаються значні початкові інвестиції в обладнання, програмне забезпечення чи персонал.

🎯 Зосередьтеся на своєму основному бізнесі: Зосередьтеся на тому, що ви робите найкраще. Ми подбаємо про повне технічне впровадження, експлуатацію та обслуговування вашого рішення на базі штучного інтелекту.

📈 Орієнтований на майбутнє та масштабований: Ваш ШІ зростає разом з вами. Ми забезпечуємо постійну оптимізацію та масштабованість, а також гнучко адаптуємо моделі до нових вимог.

Більше інформації тут:

Кероване рішення на основі штучного інтелекту – промислові послуги зі штучним інтелектом: ключ до конкурентоспроможності в секторах послуг, промисловості та машинобудування

Кінець домінування ШІ: Як стартап зриває плани Nvidia та OpenAI

Системні збої та реакція ринку

Випуск DeepSeek R1 у січні 2025 року викликав шок далеко за межі технічних кіл. Фондовий ринок відреагував збитками для компаній, які значно інвестували в інфраструктуру штучного інтелекту. Nvidia, вартість якої значною мірою базувалася на припущенні, що попит на її дорогі чіпи продовжуватиме зростати, втратила вартість протягом кількох днів. Інвестори поставили під сумнів, чи були взагалі необхідні заявлені витрати на сотні мільярдів доларів, якщо китайський стартап міг досягти порівнянних результатів, витрачаючи лише частину цієї суми.

Реакція китайських технологічних гігантів була негайною та рішучою. ByteDance, Tencent, Baidu та Alibaba різко знизили ціни на свої послуги штучного інтелекту. Модель ByteDance Doubao стала майже на 99 відсотків дешевшою порівняно з минулим роком. Це зниження цін призвело до масового сплеску використання. Щоденні запити зросли зі 120 мільярдів до понад 500 мільярдів протягом кількох місяців. Загальний ринок послуг штучного інтелекту в Китаї оцінювався у відносно невеликі суми, що свідчить про надзвичайно низьку маржу, враховуючи величезний обсяг використання.

Ці цифри ілюструють проблему: конкуренція зміщується з якості ШІ на ефективність та ціну інфраструктури. Alibaba Cloud, лідер ринку в Китаї, тим не менш, оголосив про мільярдні інвестиції в інфраструктуру ШІ. ByteDance також планує масштабні закупівлі чіпів. Tencent, яка дещо відставала в закупівлях чіпів, компенсує це за рахунок орендованих обчислювальних потужностей та використання ефективної технології DeepSeek.

Консолідація ринку прискорюється. Експерти прогнозують, що коло китайських постачальників штучного інтелекту звузиться до кількох основних гравців. Переможцями стануть ті, хто зробить свою технологію стандартом, поєднуючи продуктивність із практичним застосуванням. Цей процес відображає розвиток в інших технологічних секторах, де період швидких інновацій змінюється консолідацією, і виживають лише компанії, що мають найкраще поєднання технологій, масштабу та ринкової сили.

Подібна тенденція спостерігається і на Заході. Домінування OpenAI помітно зменшується. Частка ринку ChatGPT значно впала, тоді як Google Gemini здобув позиції. Цей зсув — більше, ніж просто статистичне коливання. Він сигналізує про те, що перевага «першого виходу на ринок» зменшується, тоді як конкуренти з усталеними платформами наздоганяють. Google може інтегрувати свій ШІ безпосередньо в Пошук та Android, що являє собою структурну перевагу над постачальником чистого ШІ.

Ціноутворення відображає цю динаміку. Західні постачальники, такі як Anthropic та OpenAI, також знизили свої ціни та запровадили ефективніші варіанти моделей. Ціна за мільйон оброблених слів різко впала за останні два роки. Цей розвиток подій свідчить про те, що ШІ стає товаром масового ринку. Щойно кілька постачальників запропонують подібну якість, ціна стане вирішальним фактором, що зменшить прибутки та зробить масштаб ще важливішим.

Пов'язано з цим:

Що краще: децентралізована, федеративна, антикрихка інфраструктура штучного інтелекту, гігафабрика штучного інтелекту чи гіпермасштабований центр обробки даних зі штучним інтелектом?

Межі революції міркувань

Паралельно зі зростанням ефективності відбувся розвиток, який спочатку здавалося наступним великим проривом. Так звані «моделі міркувань», які потребують більше часу для обмірковування проблем і чіткого опрацювання їхніх кроків, досягли вражаючих результатів. o1 від OpenAI, R1 від DeepSeek та подібні моделі продемонстрували вражаючі можливості в математиці та програмуванні. Ідея проста: якщо дати моделі більше часу на «думки» та дозволити їй сформулювати шлях рішення, відповіді мають покращитися.

Однак у червні 2025 року Apple опублікувала дослідження, яке виявило обмеження. Дослідники протестували найсучасніші моделі з логічними головоломками, складність яких можна було точно контролювати. Результати були тривожними: моделі демонстрували суперечливу поведінку. Їхні обчислювальні зусилля спочатку зростали зі складністю, але потім у певний момент знову зменшувались, хоча у них було достатньо часу – і рішення ставали неправильними.

У дослідженні було визначено три фази. Для простих задач моделі звичайної мови часто були кращими та економічнішими, ніж моделі «мислення». Для задач середньої складності процеси мислення пропонували явні переваги. Однак для дуже складних задач обидва типи моделей повністю виходили з ладу. Вони не лише зазнали невдачі з невеликим відривом, але й були нездатні знайти навіть віддалено правильні рішення.

Особливо тривожило те, що навіть надання правильної формули рішення майже не допомогло. Моделі все одно не давали результатів на подібних рівнях складності. Це свідчить про те, що проблеми глибші: моделі намагаються чітко виконувати логічні кроки та перевіряти власні міркування.

Аналіз «протоколів мислення» виявив закономірності. Для простих проблем моделі знаходили рішення на ранній стадії, але потім продовжували заглиблюватися в непотрібні деталі. При високій складності вони часто збивались з неправильного шляху. Поза певним рівнем складності вони вже взагалі не могли генерувати правильні підходи. Вони часто фіксувалися на ранніх, неправильних ідеях і витрачали свій обчислювальний час на їх обґрунтування замість виправлення помилки.

Інше дослідження попереджало, що вдосконалення цих моделей може незабаром зупинитися. Хоча вони досягають кращих результатів у тестах завдяки величезним обчислювальним зусиллям, це робить їх повільними та дорогими. Економічні наслідки є значними: експлуатація «мислювальних» моделей коштує у багато разів дорожче, ніж стандартних версій. Якщо ці моделі не зможуть забезпечити очікувані прориви та досягнуть своїх меж, виникає питання, чи виправдані високі інвестиції. Висновок про те, що простіші моделі часто є ефективнішими, свідчить про те, що в майбутньому необхідно буде точніше вибирати, який інструмент найкраще підходить для якого завдання.

Пов'язано з цим:

Автономний фізичний штучний інтелект (APAI): тиха революція децентралізованого інтелекту

Інфраструктурна гонка та енергетичний голод

Незважаючи на більш ефективне програмне забезпечення, споживання ресурсів у галузі зростає. Прогнози показують, що попит на електроенергію в центрах обробки даних різко зросте до кінця десятиліття. Частка застосувань штучного інтелекту в глобальному споживанні електроенергії в центрах обробки даних може подвоїтися. Для задоволення цього попиту інвестуються величезні суми — трильйони доларів по всьому світу. Такі ініціативи, як «Зоряна брама» OpenAI та її партнерів, або європейські інвестиційні програми, відображають масштаб цієї проблеми.

Регіональний розподіл змінюється. Хоча Азія та Північна Америка зараз є лідерами, більшість нових потужностей буде побудовано в США. Європа також планує масштабне розширення, що може значно збільшити попит на електроенергію на континенті.

Водночас зростає щільність потужності в центрах обробки даних. Оскільки чіпи штучного інтелекту генерують величезну кількість тепла в невеликому просторі, охолодження стає дедалі складнішим завданням. Традиційних систем кондиціонування повітря часто вже недостатньо, тому потрібні складні системи рідинного охолодження, які, своєю чергою, є дорогими та складними.

Ринок демонструє ознаки перегріву. Збільшується використання центрів обробки даних, що призводить до зростання цін. Очікується, що ця тенденція не покращиться, доки не буде завершено більше будівельних проектів або зростання попиту на штучний інтелект не сповільниться. Однак, якщо ефективні методи, такі як DeepSeek, стануть поширеними, потреба в нових центрах обробки даних може бути меншою, ніж очікувалося. Це поставить під сумнів заплановані масштабні інвестиції та призведе до надлишку потужностей – ризику для тих, хто зробив ставку на стабільно зростаючий попит на обладнання.

Національні стратегії та технологічний суверенітет

Розвиток DeepSeek тісно пов'язаний з прагненням Китаю до незалежності. П'ятирічні плани надали пріоритет напівпровідникам, і мета самозабезпечення досягається з величезними зусиллями. Нові правила змушують китайських виробників мікросхем використовувати більше обладнання вітчизняного виробництва. Державний фонд інвестує еквівалент майже 50 мільярдів доларів у місцеву індустрію мікросхем, щоб зменшити залежність від Заходу.

Ця політика має ефект, у деяких випадках не такий, як очікувалося. Раніше китайські заводи віддавали перевагу американському обладнанню. Однак через санкції США вони більше не мали вибору та були змушені працювати з вітчизняними постачальниками, що прискорило їхній розвиток. Китай незабаром зможе контролювати значну частку світового виробництва простіших мікросхем, що використовуються в автомобілях та побутовій техніці.

Однак, розрив залишається значним, коли йдеться про високоякісний штучний інтелект. Чіпи Huawei не можуть конкурувати з чіпами Nvidia за продуктивністю, а обсяги виробництва надто низькі. Навіть значне збільшення виробництва не зможе скоротити розрив протягом багатьох років. Оскільки попит на обчислювальну потужність зростає швидше, ніж китайське виробництво, дефіцит, ймовірно, лише погіршиться.

Це вимагає креативних рішень. Успіх DeepSeek також ґрунтується на своєчасному придбанні чіпів Nvidia. Інші вдаються до контрабандних маршрутів або непрямих методів. Уряд реагує контрзаходами, такими як обмеження експорту рідкоземельних елементів та розслідування діяльності західних технологічних компаній. Тиск на китайські корпорації щодо купівлі чіпів вітчизняного виробництва зростає, навіть якщо вони технічно неповноцінні.

Регуляторний ландшафт та глобальне управління

Поки США та Китай беруть участь у технологічній гонці, ЄС зосереджується на регулюванні. «Закон про штучний інтелект» – це перший у світі комплексний закон про штучний інтелект. Він забороняє особливо ризиковані програми та встановлює суворі правила для потужних моделей штучного інтелекту. Порушення тягнуть за собою значні штрафи.

Європейський підхід намагається встановити етичні стандарти, не придушуючи інновації. Критики побоюються невигідних умов для європейських компаній, тоді як прихильники бачать довгострокову перевагу з точки зору довіри та безпеки. Однак у світовому масштабі регулювання залишається неоднорідним. США покладаються на добровільні зобов'язання, тоді як Китай надає пріоритет державному контролю. Ця фрагментація ускладнює встановлення спільних стандартів.

Питання безпеки штучного інтелекту виходить на перший план. Експерти попереджають про ризики, пов'язані з надлюдським інтелектом. Терміни досягнення такого «штучного загального інтелекту» (ШЗІ) скоротилися. Провідні розробники говорять вже не про десятиліття, а лише про кілька років. Чи це реалістично, чи це просто маркетинговий ажіотаж, ще належить з'ясувати, але галузь готується до цього.

Невдалі моделі та стратегічна переорієнтація

Затримка випуску наступної моделі DeepSeek, R2, показує, що успіх не гарантований. Спочатку планувався попередній випуск, але зіткнувся з проблемами. Спроби навчити модель на китайських чіпах Huawei, очевидно, зазнали невдачі, незважаючи на допомогу інженерів Huawei.

Таким чином, компанія продовжує використовувати свої існуючі запаси Nvidia для навчання, але дедалі більше змушена покладатися на Huawei для застосування моделей – політично обумовлений компроміс. Затримки призвели до тимчасового зниження інтересу користувачів, оскільки конкуренція не сиділа склавши руки.

Ще однією проблемою є дані. Досягнення наступного рівня вимагає більшої кількості та кращих навчальних даних. В англомовних країнах вони легко доступні онлайн. У Китаї доступ до високоякісних даних складніший, частково через цензуру, а частково тому, що значна частина контенту не є загальнодоступною. У поєднанні з неякісним обладнанням це уповільнює розробку. Якщо навчання займає більше часу та стає складнішим, перевага у вартості зменшується.

Структурні зміни в індустрії штучного інтелекту

Галузь стикається з трансформацією. Попереднє гасло «більше — це краще» — більше даних, більше чіпів, більше грошей — досягає своїх меж або стає непомірно дорогим. DeepSeek продемонстрував, що інтелектуальна архітектура може бути важливішою за чисту потужність.

Це має наслідки для інвесторів. Ті, хто вклав мільярди в обладнання, можуть зіткнутися з проблемами, якщо більш ефективне програмне забезпечення зменшить попит. Водночас нові гравці мають шанс, оскільки для участі більше не обов'язково потрібні статки.

Оскільки продуктивність штучного інтелекту стає дедалі дешевшою та більш схожою, сама модель вже не є єдиним фактором; важливо те, наскільки добре вона інтегрована в продукти. Google та Microsoft мають тут перевагу, оскільки в них вже є користувачі. Стартапи, що займаються виключно штучним інтелектом, стикаються з більшими викликами. Програмне забезпечення з відкритим кодом або вільно доступне програмне забезпечення відіграє дедалі важливішу роль. Моделі, подібні до моделей DeepSeek або Meta, доступні кожному, що прискорює інновації.

Водночас інвестори задаються питанням, коли гроші почнуть повертатися. ChatGPT має багато користувачів, але коштує цілий статок. Великих прибутків ще далеко. На ринку праці з'являються нові робочі місця для експертів зі штучного інтелекту, водночас автоматизуються прості офісні завдання – суспільна проблема, для якої досі немає простих рішень.

Після ажіотажу навколо ШІ: тепер починається справжня битва за монетизацію

Інновації DeepSeek знаменують собою поворотний момент. Вони доводять, що технології світового класу можна створювати навіть з обмеженими ресурсами. Це ставить під сумнів припущення, що перемогти можуть лише найбагатші корпорації США. Це зміщує конкуренцію з «У кого найбільше грошей?» на «У кого найкращі інженери?».

Геополітично очевидно, що санкції можуть уповільнити прогрес, але вони також можуть форсувати інновації. Китай будує власну промисловість під тиском. Економічно ми лише на початку. Ціни падають, а моделі стають товарами повсякденного вжитку. Ті, хто хоче перемогти в майбутньому, повинні не лише створювати хороший штучний інтелект, але й вміти заробляти на ньому гроші.

Технічні перешкоди залишаються. Сучасні методи досягають своїх меж, і чи справді ми побачимо людський інтелект найближчим часом, невідомо. Наступні кілька років покажуть, чи подолає галузь ці перешкоди, чи ажіотаж навколо нього зникне. Можливо, найважливіший урок DeepSeek зовсім не технічний, а стратегічний: завжди є інший шлях, якщо ви змушені його шукати.

Ваш глобальний партнер з маркетингу та розвитку бізнесу

☑️ Наша ділова мова – англійська або німецька

☑️ НОВИНКА: Листування вашою рідною мовою!

Konrad Wolfenstein

Я та моя команда раді бути вашим особистим консультантом.

Ви можете зв'язатися зі мною, заповнивши контактну форму тут wolfenstein@xpert.digital:, або просто зателефонувавши мені за номером +49 7348 4088 965. Моя адреса електронної пошти

Я з нетерпінням чекаю нашого спільного проєкту.

☑️ Підтримка МСП у стратегії, консалтингу, плануванні та впровадженні

☑️ Створення або переорієнтація цифрової стратегії та діджиталізації

☑️ Розширення та оптимізація процесів міжнародних продажів

☑️ Глобальні та цифрові торгові платформи B2B

☑️ Розвиток бізнесу Pioneer / Маркетинг / PR / Виставки

🎯🎯🎯 Скористайтеся перевагами великого, п'ятикратного досвіду Xpert.Digital в одному комплексному пакеті послуг | Розробка бізнес-аналітики, дослідження та розробки, XR, зв'язки з громадськістю та оптимізація цифрової видимості

Скористайтеся перевагами великого, п'ятикратного досвіду Xpert.Digital у комплексному пакеті послуг | Дослідження та розробки, XR, PR та оптимізація цифрової видимості - Зображення: Xpert.Digital

Xpert.Digital має глибокі знання в різних галузях. Це дозволяє нам розробляти індивідуальні стратегії, точно узгоджені з вимогами та викликами вашого конкретного сегмента ринку. Завдяки постійному аналізу ринкових тенденцій та моніторингу розвитку галузі ми можемо діяти проактивно та пропонувати інноваційні рішення. Поєднання досвіду та знань створює додаткову цінність та надає нашим клієнтам вирішальну конкурентну перевагу.

Більше інформації тут: