Descobre como o ERNIE 4.5 e X1, os últimos modelos de IA da Baidu, estão a tornar acessíveis a IA e a desafiar gigantes como a OpenAI e o DeepSeek.

Índice

A Baidu, uma gigante tecnológica chinesa, anunciou recentemente dois novos modelos de IA, ERNIE 4.5 e ERNIE X1.

O ERNIE 4.5 é um modelo multimodal útil para as tarefas do dia a dia, que compete diretamente com o GPT-4o da OpenAI e o DeepSeek-V3.

O ERNIE X1, por outro lado, é um modelo de raciocínio especializado, desenhado para tarefas avançadas como matemática e programação. Este entrará num mercado altamente competitivo, juntamente com DeepSeek-R1 e o3-mini da OpenAI.

O modelo X1 custa o dobro do DeepSeek-R1, ainda que, supostamente, ofereça um rendimento semelhante. Todavia, até ao momento não vimos nenhuma prova comparativa do X1, pelo que esta afirmação ainda está pendente de verificação.

Por outro lado, o ERNIE 4.5 tem bons resultados nos benchmarks, mas não parece particularmente fácil de utilizar para o público fora da China, o que creio que vai afetar significativamente a sua adoção.

Assim, que serão os novos lançamentos da Baidu outro “momento DeepSeek“? A minha primeira impressão é que não, mas vamos conhecer melhor estes novos modelos.

O Que é o ERNIE 4.5?

O ERNIE 4.5 é o mais recente “foundation model” da Baidu, uma empresa que tem vindo a consolidar a sua posição como líder em IA na China. Mas o que significa “foundation model“? Em termos simples, é uma IA programada para ser incrivelmente versátil, capaz de lidar com uma vasta gama de tarefas e interações do dia a dia, devido ao seu treino com enormes quantidades de dados.

Este não é o primeiro passo da Baidu na IA. A empresa, fundada no ano 2000 como motor de procura líder na China (muitas vezes é chamado de “Google da China“), começou a investir seriamente em IA já há alguns anos. A Baidu esteve a desenvolver o ERNIE (Enhanced Representation through Knowledge Integration, Representação Aumentada por Integração de Conhecimento) desde 2019 e lançou o ERNIE Bot em 2023.

Contudo, o domínio da Baidu no mercado asiático de IA viu-se recentemente sob pressão pelos modelos Qwen do Alibaba e os novos competidores como DeepSeek.

Com o ERNIE 4.5, a Baidu está a competir diretamente com o DeepSeek-V3, Qwen 2.5 Max e GPT-4o da OpenAI.

O que torna o ERNIE 4.5 especial é a sua natureza multimodal, o que significa que ele não se limita a texto, ele pode processar imagens e, possivelmente, até áudio e vídeo.

O Que é o ERNIE X1?

Mas a Baidu não se ficou pelo ERNIE 4.5, juntamente com este modelo, lançaram o ERNIE X1, um modelo de IA de raciocínio, focado no que chamam de “pensamento profundo“. Este modelo é desenhado para tarefas que exigem raciocínio avançado e lógica complexa, como matemática e programação.

Semelhante ao DeepSeek-R1 ou ao o1 da OpenAI, este tipo de modelo demonstra explicitamente o seu processo de pensamento ao utilizador, o que facilita a compreensão de como chega a uma resposta ou solução específica.

As empresas continuam a investir fortemente em modelos centrados no raciocínio, como o ERNIE X1, porque estes modelos focam-se diretamente em tarefas que aportam um claro valor comercial. Segundo dados recentes da Anthropic, as tarefas de raciocínio e programação são os principais casos de uso das empresas e representam uma parte significativa da implementação da IA.

Apesar do rápido desenvolvimento da IA, a adoção empresarial continua a ser baixa a nível mundial e os modelos que se destacam em domínios de raciocínio avançado (matemática, programação, análise avançada) têm mais probabilidades de criar valor comercial tangível, o que aumenta os lucros e acelera a adoção da IA no mercado empresarial.

O principal atrativo da Baidu para o ERNIE X1 é a sua agressiva estratégia de preços. Aqui tens uma rápida comparativa com o DeepSeek-R1 (a informação dos preços é correta a março de 2025):

Comparação de Custos de Modelos IA

Desliza horizontalmente para ver toda a tabela em dispositivos móveis

Modelo	Custo de entrada por 1 milhão de tokens	Custo de saída por 1 milhão de tokens
DeepSeek-R1	$0,135 (com desconto) – $0,55 (padrão)	$0,55 (com desconto) – $2,19 (padrão)
ERNIE X1	$0,28	$1,10

O Plano standard (que inclui o armazenamento na “nuvem” do conteúdo) demonstra que a afirmação da Baidu de que o ERNIE X1 iguala o rendimento do DeepSeek-R1 a metade do preço é válida, em particular com respeito a preços de tokens de saída.

Porém, com os planos com desconto do DeepSeek (que se aplicam entre as 16:30 e as 00:30 UTC de cada dia), aplica-se a afirmação inversa, o ERNIE X1 torna-se o dobro mais caro.

Apesar do preço atrativo, a Baidu ainda não proporcionou os benchmarks detalhados que confirmem o rendimento do ERNIE X1 em relação ao DeepSeek-R1, o que deixa dúvida quanto à sua competitividade no mundo real.

Enquanto esperamos os benchmarks do ERNIE X1, vamos ver mais detalhes sobre o rendimento do ERNIE 4.5.

Benchmarks ERNIE 4.5

A Baidu publicou benchmarks a comparar o ERNIE 4.5 com os principais modelos multimodais e baseados em texto, como o GPT-4o e GPT-4.5 da OpenAI e DeepSeek-V3. Vamos analisar os resultados chave, começando pelas capacidades multimodais.

Multimodal benchmarks

Nos benchmarks multimodais, o ERNIE 4.5 superou o GPT-4o, pois alcançou uma pontuação de 77.77 em comparação aos 73.92 do GPT-4o, uma vantagem de 3,85 pontos.

Em concreto, o ERNIE 4.5 superou o GPT-4o em 6 dos 7 benchmarks avaliados:

CCBench: Avalia o raciocínio de sentido comum em texto e imagens. O ERNIE 4.5 obteve uma pontuação de aproximadamente 81 e superou ligeiramente os aproximadamente 79 do GPT-4o.

OCRBench: Avalia as capacidades de reconhecimento óptico de caracteres, centra-se na extração de texto de imagens. O ERNIE 4.5 obteve uma pontuação de aproximadamente 88, superando os aproximadamente 81 do GPT-4o.

ChartQA: Avalia a compreensão dos dados apresentados em gráficos. O ERNIE 4.5 obteve uma pontuação de aproximadamente 82, ligeiramente superior a do GPT-4o (aproximadamente 81).

MMMU: Mede o raciocínio multimodal em diversos temas. Neste caso, o GPT-4o obteve uma puntuação de ~70, enquanto que o ERNIE 4.5 obteve uma pontuação de ~64, o que indica uma área a melhorar.

MathVista: Avalia o raciocínio matemático em contextos visuais. O ERNIE 4.5 obteve uma pontuação de aproximadamente 69, superando a do GPT-4o (aproximadamente 61).

DocVQA: Avalia a capacidade de responder a perguntas com base em imagens de documentos. O ERNIE 4.5 obteve uma pontuação excelente de ~91, em comparação com os ~85 do GPT-4o.

MVBench: Concentra-se na compreensão temporal em tarefas de vídeo dinâmico, o que requer raciocínio sobre sequências de fotogramas. O ERNIE 4.5 obteve uma pontuação de ~72, o que superou significativamente a do GPT-4o de ~63.

Apenas-Texto benchmarks

Em tarefas de apenas texto, o ERNIE 4.5 alcançou uma pontuação média de 79.6 , ligeiramente à frente do GPT-4.5 de 79.14 e também superou o DeepSeek-V3 (~77).

Estes resultados sugerem que o ERNIE 4.5 é particularmente competitivo na compreensão multimodal de documentos, matemática e benchmarks do idioma chinês. Todavia, o seu menor rendimento nos benchmarks de programação específicos, como LiveCodeBench, coloca em evidência possíveis limitações em tarefas de programação especializadas.

Vamos analisar rapidamente alguns benchmarks chave:

MMLU-Pro: Avalia a aprendizagem multitarefa em diversas disciplinas. O ERNIE 4.5 obteve uma pontuação de aproximadamente 78, ligeiramente abaixo do 79 do GPT-4.5.

GPQA: Avalia a capacidade de responder a perguntas de conhecimento geral. O ERNIE 4.5 obteve uma pontuação de aproximadamente 57, por detrás do GPT-4.5 (aproximadamente 61).

C-Eval: Mede o conhecimento geral e o raciocínio em chinês. O ERNIE 4.5 obteve uma pontuação de ~88, o que superou o GPT-4.5 (~80).

CMMLU: Avalia a compreensão multitarefa em chinês. O ERNIE 4.5 obteve uma pontuação de ~88, à frente dos ~80 do GPT-4.5.

Math-500: Mede a capacidade de um modelo para resolver problemas matemáticos complexos de nível secundário. O ERNIE 4.5 (~82) encontra-se atrás dos líderes DeepSeek-V3 (~88) e GPT-4.5 (~84).

CMath: Avalia a resolução de problemas matemáticos en chinês. O ERNIE 4.5 obteve uma pontuação de ~95, o que superou o DeepSeek-V3 (~85).

LiveCodeBench: Mede as capacidades de programação em tempo real. O ERNIE 4.5 obteve uma pontuação de aproximadamente 35, inferior a do GPT-4.5 (aproximadamente 45), o que indica que há margem para melhorar nas tarefas de programação.

Como Aceder ao ERNIE 4.5 e ao ERNIE X1

Podes experimentar diretamente o ERNIE 4.5 e X1 da Baidu através da aplicação de chatbot oficial disponível no seu site: https://yiyan.baidu.com/.

Contudo, segundo a minha experiência pessoal, existem alguns problemas de uso. Atualmente, a interface está disponível principalmente em chinês, o que dificulta o seu uso para aqueles que não falam este idioma. Se bem que se pode usar a função de tradução automática do navegador, porém, a tradução não é fluida e a experiência de utilizador vê-se afetada.

Além disso, não posso iniciar sessão com o Google nem com o GitHub, um problema que não tenho experimentado com competidores como o DeepSeek ou o Qwen. Ainda assim, tentei criar uma conta, mas não consegui completar o formulário de registro com o meu número de telefone europeu.

Como Aceder ao ERNIE através da API

Para os utilizadores interessados em aceder ao ERNIE 4.5, o acesso à API já está disponível através da plataforma oficial da Baidu, Qianfan. O preço começa em $0,55 por 1 milhão de tokens de entrada e $2,20 por 1 milhão de tokens de saída.

No dia de hoje, o ERNIE X1 ainda não está disponível através da API, mas a Baidu mencionou que estará brevemente.

Além disso, a Baidu anunciou planos para publicar o ERNIE 4.5 em código aberto a partir do dia 30 de junho de 2025. Esta iniciativa segue o exemplo do DeepSeek, o que poderá melhorar a adoção do modelo a nível internacional, pois faz com que o mesmo seja mais acessível e adaptável.

A Baidu também tem a intenção de integrar o ERNIE 4.5 e X1 em vários produtos do seu ecossistema, incluindo Baidu Search e a App Wenxiaoyan, contudo os prazos e os detalhes ainda não foram divulgados.

ERNIE 4.5 e X1 no Futuro da IA na China e no Mundo

O lançamento do ERNIE 4.5 e do ERNIE X1 da Baidu demonstra um padrão notável que se tem verificado na indústria da IA da China, que é priorizar a disrupção sobre o uso imediato.

Diferentemente de empresas como o Google, OpenAI ou Anthropic, que costumam dedicar períodos longos a garantir que os seus produtos cumpram com padrões rigorosos de estabilidade, segurança, privacidade e proteção, as empresas de IA chinesas parecem favorecer a implementação rápida de produtos que sejam atrativos, mas que ainda se encontram numa fase inicial e sem polir.

Igual que a ManusAI e o DeepSeek, os modelos ERNIE da Baidu foram lançados ao mercado com força, com o objetivo principal de revolucionar as estruturas de preços e as premissas competitivas. O modelo ERNIE X1, em particular, posiciona-se expressamente como comparável em desempenho com o DeepSeek-R1 a metade do preço, mesmo que a Baidu ainda não tenha sustentado publicamente estas afirmações com benchmarks detalhados.

E ainda que o ERNIE 4.5 demostre benchmarks realmente competitivos, os utilizadores internacionais como eu ainda encontramos barreiras, em particular no registo complicado e em problemas de acessibilidade linguística.

No geral, os lançamentos do ERNIE 4.5 e ERNIE X1 reforçam a ideia de que as empresas de IA chinesas se sentem cómodas ao sacrificar determinada estabilidade e experiência do utilizador no curto prazo, de forma a impulsionar rapidamente o mercado e provocar conversas em todo o mercado da IA.

Pelo que não se pode negar que este foco é eficaz para obrigar a indústria global de IA a mover-se mais rápido e a pensar de forma diferente sobre o que significa competir no mercado atual.

Um Novo Paradigma Para a IA Global

O lançamento do ERNIE 4.5 e ERNIE X1 pela Baidu representa outro ambicioso passo no competitivo mercado da IA na China. O ERNIE 4.5 demonstra claras fortalezas, especialmente em compreensão multimodal, matemáticas e tarefas de chinês, o que o posiciona com força frente a competidores globais como o GPT-4o e DeepSeek-V3.

Por outro lado, a promessa do ERNIE X1 de oferecer capacidades de raciocínio avançado a metade do preço do DeepSeek-R1 é interessante, mas sem benchmarks, é apenas especulativa.

À medida que estes modelos maduram, será curioso ver se a Baidu e outras empresas chinesas parecidas ajustam o seu foco para alcançar um melhor equilíbrio entre disrupção e estabilidade.

E tu, o que achas do impacto que estes modelos gratuitos poderão ter no mercado global da IA? Partilha os teus pensamentos nos comentários abaixo!

IA & A

Proudly powered by WordPress