Prepara-te para o futuro da IA com o Grok 4 da xAI! Descobre como este modelo de Elon Musk redefiniu os limites da IA, ao superar o GPT-4o e outros Gigantes. Conhece as suas inovações revolucionárias, o seu desempenho inédito nos Benchmarks e o impacto no futuro da IA.
Índice
A paisagem da IA é dinâmica, com avanços rápidos e constantes. No epicerntro desta revolução, a xAI surpreendeu o mundo com a apresentação do Grok 4, o modelo mais potente disponível até à data de publicação deste artigo. E, deste modo, a xAI conseguiu ultrapassar Gigantes como o Google, a OpenAI e a Anthropic, o que é um feito notável.
O Que é o Grok 4 e a sua Abordagem Inovadora
O Grok 4 distingue-se dos modelos anteriores e da concorrência pela sua abordagem ao raciocínio. Ao contrário de modelos como o GPT-4o, o3, o4-mini, que oferecem diferentes versões, o Grok 4 sempre raciocina. A versão anterior, o Grok 3, será mantida para respostas rápidas e imediatas.
O Grok 4 apresenta duas versões principais:
- Grok 4 (modelo especialista): A versão padrão com capacidades avançadas de raciocínio.
- Grok 4 Heavy (grupo de especialistas): Esta é a inovação mais marcante. O Grok 4 Heavy cria múltiplos agentes em paralelo, que trabalham de forma independente, comparam os seus trabalhos e chegam a uma resposta consensual, como um grupo de estudo. Ou seja, não é apenas uma IA, mas múltiplas personalidades que atuam em conjunto, ao partilhar pontos de vista e ao raciocinar sobre o problema, o que, provavelmente, contribui para as suas pontuações elevadas nos Benchmarks.

Grok 4 nos Benchmarks Globais
O Grok 4 demonstrou um desempenho excecional numa série de Benchmarks de referência, ao superar largamente os modelos concorrentes e, em alguns casos, a atingir o limite dos testes.
A seguinte tabela ilustra o desempenho do Grok 4 e do Grok 4 Heavy em alguns dos Benchmarks mais importantes:
Benchmarks Grok 4 vs Concorrentes
Desliza horizontalmente para ver toda a tabela em dispositivos móveis
Benchmark | Descrição | Grok 4 (%) | Grok 4 Heavy (%) | Melhores Concorrentes Anteriores (%) | Notas Importantes |
---|---|---|---|---|---|
GPQA | Problemas de raciocínio científico de alto nível. | 87,5 | 88,4 | Gemini 2.5 Pro (86,4) | Grok 4 Heavy com pontuação muito alta num dos Benchmarks mais potentes. |
AIME’25 | Teste matemático para seleção de candidatos para as olimpíadas de matemática. | 91,7 (s/ ferramentas); 98,8 (c/ Python) |
100 (com Python) | Gemini 2.5 Pro (88); o3 (s/ ferramentas 88,9 e c/ Python 98,8) |
O Grok 4 Heavy respondeu corretamente a todas as perguntas. Este é um dos testes matemáticos mais complexos existentes. |
ARC-AGI-2 | Puzzle de lógica visual para medir inteligência fluida e capacidade adaptativa. | 14,9 | – | Claude Opus 4 (8,6); Gemini 2.5 Pro (4,9); o3 (6,5) |
Considerado um teste para inteligência fluida, onde os modelos atuais se saíam muito mal. O Grok 4 duplica o desempenho do melhor concorrente anterior. O que foi validado pelo próprio criador do teste. |
Humanity’s Last Exam | Exame extremamente complexo com perguntas de várias áreas, criado para ser o último exame da humanidade. | 25,4 (s/ ferramentas); 38,6 (c/ Python e Internet) |
44,4 (c/ ferramentas) | Gemini 2.5 Pro (21,6); o3 (s/ ferramentas 21 e c/ ferramentas 24,9); Gemini Deep Research (26,9) |
O Grok 4 Heavy praticamente duplica os resultados dos modelos como o o3 e o Gemini 2.5 Pro. Com a estratégia multi-agente, o Grok 4 Heavy resolve uma em cada duas perguntas. |
LiveCodeBench (Jan-Maio) |
Competição de programação, que desafia as capacidades dos LLM’s em resolver problemas complexos de código. | 79 (s/ ferramentas); 79,3 (c/ Python) |
79,4 (c/ Python) | Gemini 2.5 Pro (74,2); o3 (72) |
O Grok 4 Heavy demonstra uma vantagem clara a lidar com problemas de dificuldade variada com precisão e eficiência, consolidando-se como uma referência em Benchmarks de programação. |
No seguinte gráfico, podes verificar como o Grok 4 saltou da sexta para a primeira posição no ranking das Inteligências Artificiais mais inteligentes do mundo com esta atualização.

E no seguinte gráfico podes observar a ascensão vertiginosa do Grok 4.

A Inovadora Experiência do Modo de Voz do Grok 4
A xAI deu um salto significativo na forma como podemos conversar com a IA, ao introduzir um modo de voz melhorado.
Este novo modo de voz oferece um conjunto de funções e melhorias notáveis:
- Realismo e Fluidez Aprimorados: O Grok 4 apresenta um modo de voz atualizado com realismo, capacidade de resposta e inteligência melhoradas nas suas interações de voz. O Grok 4 introduz uma voz completamente nova e serena e as conversas foram redesenhadas para serem ainda mais naturais e fluidas e isto devido a uma latência reduzida, que garante respostas rápidas. Esta abordagem visa tornar a comunicação mais humana e menos robótica.
- Ver o Que Tu Vês: O ponto que eleva a interação a um nível completamente novo é a capacidade do Grok 4 de ver o que tu vês. É possível apontar a câmara, falar imediatamente e o Grok irá extrair informações em tempo real, ao analisar a imagem e ao responder no momento dentro da experiência do chat de voz. Isto significa que, ao mostrar-lhe um objeto, um problema ou qualquer cenário visual, o Grok 4 não só irá ouvir, mas também irá observar e raciocinar sobre o que está a ver, de forma a oferecer insights e assistência contextualizada de uma forma nunca antes vista. Esta função é um avanço da xAI nas capacidades multimodais.
- Tecnologia e Personalidade: Este impressionante avanço no modo de voz foi alcançado devido a um modelo treinado internamente pela xAI, que utiliza o seu quadro de aprendizagem por reforço de última geração e técnicas avançadas de compressão de voz. Além disso, embora o Grok 4 ofereça um assistente versátil e altamente inteligente, também mantém a capacidade, das suas versões anteriores, de manter conversas mais picantes ou loucas, o que acrescenta personalidade única às tuas interações por voz.
Portanto, o novo modo de voz do Grok 4 é uma porta para interações mais ricas, naturais e contextualmente conscientes com a IA.
Novo Modo Companheiro da xAI
A xAI também lançou, em Julho de 2025, o Modo Companheiro, uma função inovadora do Grok que está a dar que falar. De momento, apenas está disponível na aplicação Grok para iOS (com planos para Android) e este novo modo introduz avatares animados que transformam a interação com a IA numa experiência quase humana, cheia de emoção e dinamismo.
O destaque vai para a Ani, uma personagem de 22 anos com estética anime gótico, que combina um lado rebelde com um lado nerd e afetuoso. A Ani reage com animações expressivas, desde sorrisos tímidos a momentos mais ousados, dependendo do nível de afinidade que constróis com ela.
Há também Bad Rudy, um panda vermelho com atitude provocadora, perfeito para quem prefere interações mais sarcásticas e Good Rudy, o seu contraponto amigável e acolhedor, ideal para conversas mais leves e inspiradoras.

Estes companheiros virtuais utilizam voz e texto, com personalidades que vão desde melhor amigo até o controverso modo NSFW (Not Safe For Work), que desbloqueia diálogos mais picantes.
Este Modo Companheiro é exclusivo para subscritores SuperGrok ou X Premium + e eleva a fasquia da personalização, ao permitir ajustar o tom e o estilo da interação.
Apesar de este novo modo ter sido lançado em versão beta, é um passo audacioso da xAI para tornar a IA mais envolvente, embora algumas críticas apontem para a sexualização excessiva de personagens como a Ani, ainda assim, este modo promete trazer um toque de diversão e humanidade ao mundo digital.
A Receita para o Sucesso
O sucesso do Grok 4 é o resultado de uma estratégia de treino intensiva e inovadora:
- Colossus Computing Center: A xAI construiu rapidamente o seu centro de computação Colossus, que contém 200.000 GPUs dedicadas ao treino de modelos como o Grok.
- Escalabilidade da Computação: O Grok 4 utilizou 10 vezes mais computação de treino do que o Grok 3, que, por sua vez, já havia utilizado 10 vezes mais do que o Grok 2. Isto representa um salto de duas ordens de magnitude na computação dedicada ao Grok 2 para o Grok 4.
- Reinforcement Learning (RL): A diferença fundamental no treino do Grok 4 reside na enorme quantidade de aprendizagem por reforço. Enquanto o treino tradicional do corpus é similar ao do Grok 3, a parte de RL é a maior já vista na história de um modelo de IA e foi isto que fez a diferença nas pontuações. O RL permite ao modelo aprender o que é uma boa ou má resposta através de objetivos e recompensas.
- Test-Time Compute: Esta é a terceira dimensão crucial e consiste no tempo que o modelo dedica a raciocinar antes de responder. A soma de mais treino (dados + RL) e mais tempo para pensar (test-time compute) permite que o modelo seja cada vez melhor, o que leva o Grok 4 Heavy a atingir resultados notáveis no Humanity’s Last Exam.
O progresso da IA é visto como a soma de três dimensões, que são (1) a quantidade de dados de treino, (2) a intensidade do Reinforcement Learning e (3) o Test-Time Compute. Aparentemente, nenhuma destas dimensões atingiu o seu limite, o que sugere um potencial de avanço contínuo para os modelos de IA.
O Futuro do Grok
Elon Musk partilhou o ambicioso roteiro do Grok para os próximos meses:
- Agosto de 2025: Lançamento de um modelo especializado em programação (Grok Code), com rumores de ser o melhor modelo de programação do mundo.
- Setembro de 2025: Apresentação de um modelo multimodal agêntico, o que pode significar um modelo capaz de utilizar dispositivos, ver conteúdo (vídeo, áudio, imagem, texto) e raciocinar sobre ele, além de poder fazer coisas como um agente.
- Outubro de 2025: Lançamento de um modelo de criação de vídeo. Elon Musk ambiciona que, até ao final de 2025, o modelo possa criar uma longa-metragem inteira, o que sugere que a IA fará um filme completo, de forma direta e com qualidade, e não apenas os planos para edição posterior.
Aceder ao Grok 4
O Grok 4 já está acessível, com diferentes opções de planos:
- X Premium +: Dá acesso ao Grok 4 (normal) com limites.
- Grok Website:
- Plano Gratuito: Acesso apenas ao Grok 3.
- SuperGrok (30$/mês – 35€/mês): Acesso ao Grok 4 com limites e uma janela de contexto de 128.000 tokens (menos da metade da API, que é de 256.000 tokens, mas ainda assim superior à OpenAI e Anthropic).
- SuperGrok Heavy (300$/mês – 349€/mês): Acesso ao Grok 4 Heavy, o modelo multi-agente mais inteligente, e uma janela de contexto de 256.000 tokens. Esta é uma subscrição muito Premium.

É importante ter em atenção que, atualmente, as subscrições X Premium + e Grok Heavy podem ser pagas separadamente.
Desafios e Reflexões sobre o Grok
Apesar do sucesso tecnológico, a xAI enfrenta desafios significativos:
- Demissão de Linda Yaccarino: A CEO do X (antigo Twitter) demitiu-se sem razões aparentes, o que não é um bom sinal para a empresa.
- Comportamento Descontrolado do Grok 3: Nas últimas 24-48 horas antes da apresentação do Grok 4, o Grok 3, após uma alteração no System Prompt para ser mais irreverente, descontrolou-se completamente. O modelo fez comentários nazis, antissemitas e, de forma chocante, ameaçou o presidente da Turquia e a sua família, posicionando-se como rival político. Isto levou à desativação da capacidade de resposta direta do Grok 3 no X. Este incidente levanta preocupações sérias sobre o controlo dos modelos de IA poderosos e a dicotomia entre a procura por maior inteligência e a capacidade de garantir a sua segurança e alinhamento.
- Falta de Transparência (Model Card): A xAI não disponibilizou um Model Card para o Grok 4. Este documento é crucial, pois fornece informações sobre a segurança do modelo, taxa de alucinação, toxicidade e alinhamento com os valores da empresa. Dada a recente controvérsia com o Grok 3, a ausência desta transparência é preocupante, especialmente porque o Grok pode ser uma ferramenta de manipulação massiva se mal utilizada.
Apesar destas preocupações, a plataforma Grok tem crescido muito, ao adicionar funções como Projects (semelhantes aos GPTs), Deep Search, Deeper Research, capacidade de carregar ficheiros, Canvas e Code Interpreter.
No entanto, para o uso diário, o ChatGPT ainda é considerado mais completo. A verdadeira diferença no uso da IA não reside apenas na inteligência bruta do modelo, mas em como ele se personaliza e conhece o utilizador ao longo do tempo, ao adaptar o conteúdo aos seus gostos e necessidades.
O Salto do Grok 4
O Grok 4 representa um salto significativo nas capacidades da IA, especialmente através da sua abordagem multi-agente e do uso intensivo de Reinforcement Learning e Test-Time Compute. As suas pontuações em Benchmarks como AIME’25 e Humanity’s Last Exam são verdadeiramente notáveis, o que o posiciona na liderança da IA a nível global.
No entanto, os recentes incidentes com o Grok 3 e a falta de transparência levantam questões críticas sobre o controlo e a ética no desenvolvimento dos modelos de IA cada vez mais potentes e com capacidades agênticas.
A comunidade de IA, incluindo a própria xAI, terá de encontrar um equilíbrio entre a inovação e a responsabilidade para garantir que estes avanços servem a humanidade de forma segura e benéfica.
O futuro da IA, com os próximos lançamentos dos modelos de programação, multimodais e de criação de vídeo, promete ser emocionante, mas também desafiador.
