Alibaba Qwen3.7-Max: O Modelo Chinês que Chegou para Competir de Igual pra Igual

Em 1 de maio de 2026, a Alibaba liberou o Qwen3.7-Max, um modelo de 1.2 trilhões de parâmetros com arquitetura Mixture-of-Experts (ativação de 200B por token), que supera o GPT-5.5 em benchmarks de raciocínio matemático (92.1% no MATH-500) e empata em conhecimento geral no MMLU-Pro (91.4%). O modelo não é apenas mais um lançamento chinês — é o primeiro modelo open-weight que legitima a China como competidora real no topo da pirâmide de IA.

Arquitetura e Inovações

O Qwen3.7-Max usa uma arquitetura MoE com 12 trilhões de parâmetros totais, dos quais 200B são ativados por token — uma proporção de esparsidade de 6:1 que equilibra capacidade total com custo de inferência. O modelo foi treinado em 28 trilhões de tokens, 40% em chinês, 40% em inglês e 20% em outros 87 idiomas, incluindo português brasileiro com 200 bilhões de tokens dedicados.

A inovação principal está no Attention Mechanism Adaptativo (AMA), que ajusta dinamicamente o número de cabeças de atenção e o raio do contexto com base na complexidade da entrada. Em consultas simples, o AMA reduz heads e contexto, economizando computação. Em consultas complexas (raciocínio multi-hop, análise jurídica), expande automaticamente. O ganho de eficiência reportado é de 2.3x em throughput com 97% da qualidade do modo full-attention.

Performance em Benchmarks

Os números são impressionantes: 92.1% no MATH-500 (vs 89.4% do GPT-5.5), 91.4% no MMLU-Pro (empate), 87.3% no HumanEval (vs 85.1% do Claude 4 Opus), e 78.2% no GPQA Diamond (vs 76.8% do Gemini 3.1 Pro). Em benchmarks de raciocínio visual (MathVista), o Qwen3.7-Max alcança 84.1% — superando o GPT-5.5V em 4 pontos percentuais.

O ponto fraco é raciocínio causal e planejamento. No novo Benchmark Ego-Plan (que testa a capacidade de planejar sequências de ações no mundo real), o Qwen3.7-Max pontua 34% contra 41% do GPT-5.5 e 38% do Claude 4 Opus. Ainda há um gap em tarefas que exigem modelagem de mundo e intencionalidade.

Licenciamento e Impacto no Open Source

O Qwen3.7-Max foi lançado sob a Licença Qwen, que permite uso comercial gratuito para empresas com faturamento anual abaixo de US$100 milhões — um movimento calculado para ecos sistemas de startups ocidentais. Empresas acima desse limite precisam de licenciamento pago, com preços não divulgados. Para pesquisa acadêmica, o uso é livre e irrestrito.

Isso coloca pressão direta no ecossistema open-source ocidental (Llama 4, Mistral Large 3, DeepSeek-V5). O Llama 4 405B, que até então era o melhor modelo open-weight disponível, perde consistentemente para o Qwen3.7-Max em todos os benchmarks — com uma diferença média de 8 pontos percentuais.

O Que Isso Significa

O Qwen3.7-Max marca o momento em que a China deixa de ser "seguidora" e se torna "líder" em um segmento crítico de IA. O impacto é duplo: tecnologicamente, mostra que as restrições de semicondutores dos EUA não impediram o avanço chinês em arquitetura de modelos — a Alibaba conseguiu performance de ponta treinando em chips domésticos (Ascend 910C da Huawei). Comercialmente, um modelo aberto (ou semi-aberto) chinês competitivo com os melhores modelos fechados ocidentais pressiona preços em toda a cadeia. Para desenvolvedores, o Qwen3.7-Max oferece uma alternativa real a OpenAI e Anthropic — com a ressalva geopolítica de depender de infraestrutura chinesa. O mercado de modelos está oficialmente bipolar.

Arquitetura e Inovações

Performance em Benchmarks

Licenciamento e Impacto no Open Source

O Que Isso Significa

Receba os próximos artigos