Тајни краљ вештачке интелигенције: Како Alibaba-ин Qwen3.5 конкурише OpenAI-ју и Google-у
Xpert прелиминарно издање
Избор језика 📢
Објављено: 15. марта 2026. / Ажурирано: 15. марта 2026. – Аутор: Konrad Wolfenstein

Тајни краљ вештачке интелигенције: Како Alibaba-ин Qwen3.5 даје OpenAI-ју и Google-у конкуренцију – Слика: Xpert.Digital
Бесплатно уместо премиум: Кинески генијални потез отвореног кода против ChatGPT-а и компаније.
700 милиона преузимања: Тиха револуција Qwen AI коју су сви превидели
Из сенке: Како је Квен постала доминантна платформа
Дуго времена, OpenAI и Google су сматрани неприкосновеним владарима света вештачке интелигенције, али се иза кулиса дешава фундаментална промена парадигме. Објављивањем породице модела Qwen3.5, кинески технолошки гигант Alibaba не само да доводи у питање доминацију етаблираних западних играча, већ и потпуно редефинише правила игре за вештачку интелигенцију. Кроз радикални архитектонски редизајн, Qwen3.5 решава проблем ресурса класичних Трансформер модела и пружа невиђене перформансе уз драстично смањен рачунарски напор. Стратегија је једноставна колико и агресивна: Веома моћни, изворно мултимодални модели отвореног кода доступни су бесплатно – чак и компактне верзије нуде перформансе на локалном хардверу које ни на који начин нису инфериорне у односу на гигантске комерцијалне системе. Овај потез је много више од пуког техничког ажурирања. То је геополитички маневар који напада профитне марже глобалног тржишта вештачке интелигенције и истовремено уводи еру масовних, аутономних вештачких агената („Agentic AI“). Детаљна анализа показује како је Alibaba постигао овај подвиг и шта референтне бројке заиста значе за будућност индустрије.
У вези са овим:
- Кинеска офанзива отвореног кода у вештачкој интелигенцији: Како слободни софтвер уништава вишемилијардерски бизнис Силицијумске долине
Алибабина тиха револуција: Како породица Qwen3.5 поново преговара о светском поретку заснованом на вештачкој интелигенцији
Кинески напад на отворени код погађа OpenAI и Google тамо где највише боли – у њиховој архитектури
Када је Alibaba објавио серију модела Qwen3 у априлу 2025. године, реакција западног технолошког новинарства била је пригушена. Додуше моћан, али на крају крајева само један од многих модела на све претрпанијем тржишту – то је била пресуда. Оно што је ова непристрасна процена превидела јесте да Qwen више није нишни пројекат, већ је на путу да постане најшире коришћена платформа за вештачку интелигенцију отвореног кода на свету. У јануару 2026. године, Qwen тим је пријавио 700 милиона преузимања на Hugging Face-у, постигавши позицију која је чак надмашила Метин Llama, дуги низ година неспорни референтни број за језичке моделе отвореног кода. Бројке су говориле саме за себе: у децембру 2025. године, месечна преузимања Qwen-а премашила су комбиновани број следећих осам најпопуларнијих модела – укључујући Meta, DeepSeek, OpenAI, Mistral и Nvidia.
Ова популарност није случајна. Бројке одражавају стратешку одлуку коју Alibaba доследно следи од 2023. године: да објављује Qwen моделе раније, чешће и у више варијација од својих конкурената. До данас, Alibaba је учинила скоро 400 модела из Qwen пакета доступним као отворени код и генерисала је више од 180.000 изведених верзија. Чак се и врхунске истраживачке групе ослањају на Qwen: Тим око пионира вештачке интелигенције Феи-Феи Лија тренирао је свој хваљени s1 инференцијски модел на Qwen-у са релативно скромним ресурсима. DeepSeek, кинеска лабораторија за моделирање која је изазвала глобалну сензацију са R1 почетком 2025. године, објавила је шест модела заснованих на заједници – од којих су четири заснована на Qwen-у.
У најважнијем показатељу заједнице вештачке интелигенције отвореног кода, Qwen је тако достигао позицију коју истраживачи тржишта сматрају готово непоколебљивим мрежним ефектом: Они који граде на Qwen-у имају користи од огромног екосистема деривативних модела, финог подешавања, оптимизација и подршке заједнице. Они који се такмиче против Qwen-а истовремено се такмиче против замајца мрежних ефеката. Ова структурна снага чини позадину на основу које се мора проценити серија модела Qwen3.5.
Архитектонска опклада: Зашто Qwen3.5 размишља другачије од својих претходника
Кључна разлика између породице Qwen3.5 и њених претходника не лежи у једноставном повећању параметара, већ у фундаменталној промени архитектонске парадигме. Класични трансформаторски модели – од GPT-4 преко Llama до оригиналног Qwen3 – ослањају се на такозвани механизам самопажње, који се математички скалира са квадратном сложеношћу. То значи да удвостручавање дужине контекста учетворостручује рачунарски напор. Ово је уско грло које чини дугачке документе, опсежне кодне базе или вишечасовне историје разговора толико захтевним за ресурсе језичких модела.
Qwen није решио овај проблем постепеним оптимизацијама, као што је DeepSeek урадио са својом Multi-Head Latent Attention технологијом, већ радикалнијим архитектонским ремонтом. Језгро нове архитектуре је структура Hybrid Mixture of Experts: Од свака четири трансформаторска блока, три су замењена Gated Delta Networks – варијантом линеарне пажње заснованом на теоријском раду „Gated Delta Networks: Improving Mamba2 with Delta Rule“. Само сваки четврти блок остаје класичан слој пуне пажње за прецизне задатке. Резултат је рачунарска сложеност која расте само линеарно са дужином контекста – категорична разлика од квадратног скалирања класичних трансформатора.
Последице ове одлуке су значајне. У пракси, линеарно скалирање значи да са истом рачунарском снагом, модел може да обрађује знатно дуже текстове и производи токене брже од густог модела упоредиве интелигенције. Qwen3.5-Plus, хостована верзија преко Alibaba Cloud-а, подржава контекстуални прозор од милион токена – капацитет који је, пре само две године, био резервисан искључиво за специјализоване архитектонске приступе попут Клодове уставне вештачке интелигенције. Истовремено, хибридна архитектура драстично смањује захтеве за VRAM меморијом: Док класични густи модел са 400 милијарди параметара захтева више од 800 GB GPU меморије, Qwen3.5-397B-A17B се сналази са 48 до 96 GB на квантизованим системима.
Нова димензија дигиталне трансформације са „Управљаном вештачком интелигенцијом“ - платформа и B2B решење | Xpert Consulting

Нова димензија дигиталне трансформације са „Управљаном вештачком интелигенцијом“ – платформа и B2B решење | Xpert Consulting - Слика: Xpert.Digital
Овде ћете сазнати како ваша компанија може брзо, безбедно и без високих баријера за улазак имплементирати прилагођена решења за вештачку интелигенцију.
Управљана AI платформа је ваше свеобухватно и безбрижно решење за вештачку интелигенцију. Уместо да се бавите сложеном технологијом, скупом инфраструктуром и дуготрајним процесима развоја, добијате готово решење прилагођено вашим потребама од специјализованог партнера – често у року од само неколико дана.
Кључне предности на први поглед:
⚡ Брза имплементација: Од идеје до апликације спремне за употребу за дане, а не месеци. Нудимо практична решења која стварају тренутну додату вредност.
🔒 Максимална безбедност података: Ваши осетљиви подаци остају код вас. Гарантујемо безбедну и усклађену обраду без дељења података са трећим лицима.
💸 Без финансијског ризика: Плаћате само за резултате. Велика почетна улагања у хардвер, софтвер или особље су потпуно елиминисана.
🎯 Фокусирајте се на свој основни посао: Концентришите се на оно што најбоље радите. Ми се бринемо о целокупној техничкој имплементацији, раду и одржавању вашег вештачке интелигенције.
📈 Спремно за будућност и скалабилно: Ваша вештачка интелигенција расте са вама. Обезбеђујемо континуирану оптимизацију и скалабилност и флексибилно прилагођавамо моделе новим захтевима.
Више информација овде:
Кинеска нова вештачка интелигенција побеђује Гугл и ОпенАИ за делић величине
Ватромет моделске серије: Од 397 милијарди до 0,8 милијарди параметара
Стратегија објављивања породице Qwen3.5 пратила је добро прорачунат ритам. Водећи модел, Qwen3.5-397B-A17B, започео је рад непосредно пре Кинеске нове године: 397 милијарди укупних параметара, од којих је само 17 милијарди активно по токену. Ова архитектура са оскудном мешавином стручњака изазвала је запрепашћење у првом практичном тесту, јер је стопа активације мања од пет процената значила да је, упркос својој огромној укупној величини, модел постигао латенцију знатно мањег модела.
Убрзо након тога уследио је прави ватромет: Qwen3.5-122B-A10B и Qwen3.5-35B-A3B као SMoE модели за апликације високих перформанси, и густи Qwen3.5-27B као свестрани модел за кориснике који дају предност високом квалитету појединачних задатака у односу на чисту брзину инференције. Прве евалуације заједнице откриле су изненађујућу слику: модел 27B, иако мањи по параметрима од SMoE варијанти, постигао је боље резултате у бројним бенчмарковима – што је показатељ да сложенији процес обуке за ретке архитектуре још увек није у потпуности оптимизован и да има даљи потенцијал.
Међутим, највећу пометњу изазвало је накнадно објављивање мањих модела: Qwen3.5-9B, Qwen3.5-4B, Qwen3.5-2B и Qwen3.5-0.8B. Ови модели су посебно дизајнирани за употребу на стандардним рачунарима и пружају густину перформанси која је практично без преседана у историји компактних језичких модела. Qwen3.5-9B је постигао резултат од 81,7 поена у GPQA Diamond бенчмарку, који тестира академско резоновање на нивоу постдипломских студија — надмашивши OpenAI-јев GPT-oss-120B са 80,1 поеном, модел са више од тринаест пута већим бројем параметара. У бенчмарку визуелног резоновања MMMU-Pro, модел 9B је постигао 70,1 поен у поређењу са Gemini 2.5 Flash-Lite са 59,7. Модел 4B је такође изазвао пометњу: на Video-MME (са титловима) постигао је 83,5 поена, далеко испред Google-ових 74,6.
У вези са овим:
- Трка вештачке интелигенције: Alibaba представља нови водећи модел и врши притисак на конкуренте – Истраживање
Мултимодалност као стандард: Крај суфикса VL
Стратешки значајан, симболичан корак у породици Qwen3.5 је уклањање скраћенице „VL“ из назива модела. Раније је „VL“ (Vision Language) означавао моделе способне за обраду слика – могућност која се увек третирала као додатна карактеристика. У генерацији 3.5, сви модели без изузетка су изворно мултимодални: текст, слике и видео записи се не обрађују путем низводних адаптера, већ се интегришу од темеља кроз рано фузијско обучавање.
Овај корак је више него само козметички. Он сигнализира стратешко репозиционирање: Qwen више не види мултимодалност као премиум карактеристику за одабране варијанте модела, већ као основни захтев за сваки модерни језички модел. Техничка имплементација коришћењем Early Fusion-а значи да се разумевање слике и језика учи у заједничком репрезентативном простору – са предношћу што модел може дубоко повезати визуелно и лингвистичко знање уместо да их само површно комбинује. Qwen 3.5 такође подржава 201 језик и дијалект, у поређењу са 119 у претходној генерацији.
Геополитика у коду: Шта кинеска офанзива отвореног кода значи за глобално тржиште вештачке интелигенције
Иза овог технолошког напретка крије се геополитичка димензија која се често превиђа у западним медијима. Кинеска индустрија вештачке интелигенције је 2025. и 2026. године следила стратегију која би се могла описати као „потцењивање отвореног кода“: модели са перформансама упоредивим са најскупљим комерцијалним добављачима објављени су бесплатно, уз лиценцу која је дозвољавала комерцијалну употребу. Резултат је систематска девалвација премије цене коју OpenAI, Anthropic и Google наплаћују за своје водеће производе.
Алибаба експлицитно позиционира Qwen3.5 као конкурента GPT-5.2 и Claude 4.5 Opus. У интерним бенчмарковима, Qwen3.5 је надмашио оба модела на IFBench-у, тесту који мери квалитет праћења инструкција. На HMMT бенчмарку за резоновање, Qwen3.5 је надмашио Claude 4.5 Opus, али је заостајао за GPT-5.2. Овај нијансирани пејзаж перформанси је карактеристичан: Qwen3.5 није несумњиво лидер ни у једној појединачној категорији, али је конкурентан у свим областима — и све то уз потпуно отворени код.
Реакција тржишта на ову ситуацију је већ очигледна. Програмери, посебно у компанијама осетљивим на ресурсе, окрећу се Qwen дериватима јер су укупни трошкови власништва над радикалним закључивањем на њиховом сопственом хардверу драстично нижи од трошкова API-ја комерцијалних добављача. Ово је кључна предност за B2B купце који желе да скалирају AI решења без плаћања по токену. Притисак цена који на тржиште врше кинески модели отвореног кода већ је подстакао OpenAI да позиционира приступачније производне линије попут GPT-5 mini – директан одговор на конкуренцију Qwen-а.
Референтне вредности без мита: Шта бројке заиста говоре
Озбиљна евалуација Qwen3.5 бенчмаркова захтева критичку дистанцу. Alibaba је пријавио своја поређења перформанси као „самостално пријављена“ – чињеница коју је CNBC експлицитно напоменуо, што захтева независну верификацију. Штавише, бенчмаркови нису неутралне мере: модели се могу претходно обучавати на подацима сличним бенчмарковима, што доводи до прекомерног прилагођавања одређеним форматима тестова, а да то не резултира стварним повећањем перформанси у стварној употреби. Тестови које је спровела заједница у недељама након објављивања сликају помешану, али све у свему импресивну слику.
Резултати су посебно робусни када се примене на бенчмаркове који захтевају активно резоновање и не могу се решити пуким чињеничним претраживањем. GPQA Diamond бенчмарк, који поставља питања из биологије, физике и хемије на докторском нивоу, сматра се посебно отпорним на манипулацију. Чињеница да Qwen3.5-9B овде надмашује модел са 120 милијарди параметара, према тренутним истраживањима, није артефакт мерења, већ израз ефекта повећања ефикасности нове архитектуре у комбинацији са квалитетнијим подацима за обуку. Qwen је користио FP8 цевовод и асинхрони оквир за учење са појачањем за обуку – техничке одлуке које повећавају ефикасност података и чине обуку стабилнијом.
У вези са овим:
Агентска вештачка интелигенција и следећа фаза развоја Qwen платформе
Алибаба позиционира Qwen3.5 не само као још један модел ћаскања, већ експлицитно као темељну архитектуру за „еру агентске вештачке интелигенције“. Ову изјаву поткрепљују значајни технички докази: Обука за учење са појачањем је скалирана на милионе агентских окружења са све сложенијом расподелом задатака – методологија која се фокусира на стварно, вишестепено извршавање задатака, а не на статичку репродукцију знања. Qwen3.5-Plus нуди коришћење изворних алата путем Алибаба облака и адаптивни систем коришћења алата који омогућава агентима да независно приступају спољним API-јима, базама података и упитима за претрагу.
Чињеница да језички модел са 17 милијарди активних параметара може да обави ове задатке са конкурентним квалитетом представља фундаменталну промену у економији апликација вештачке интелигенције заснованих на агентима. Претходни приступи су захтевали велике, скупе моделе као мозак агента, што је значајно повећавало оперативне трошкове за продужене аутономне задатке. Qwen3.5-9B, који ради локално на хардверу са једним врхунским графичким процесором, чини системе вештачке интелигенције засноване на агентима доступним ширем средњем тржишту и програмерима без буџета за облак. Ова динамика демократизације могла би значајно убрзати путању усвајања агената вештачке интелигенције у средњим компанијама.
Консалтинг - Планирање - Имплементација
Било би ми драго да вам будем лични саветник.
контактирати на wolfenstein ∂ xpert.digital
Само ме позовите на +49 89 89 674 804 (Минхен) .






















