Grok 4

Prepara-te para o futuro da IA com o Grok 4 da xAI! Descobre como este modelo de Elon Musk redefiniu os limites da IA, ao superar o GPT-4o e outros Gigantes. Conhece as suas inovações revolucionárias, o seu desempenho inédito nos Benchmarks e o impacto no futuro da IA.

A paisagem da IA é dinâmica, com avanços rápidos e constantes. No epicerntro desta revolução, a xAI surpreendeu o mundo com a apresentação do Grok 4, o modelo mais potente disponível até à data de publicação deste artigo. E, deste modo, a xAI conseguiu ultrapassar Gigantes como o Google, a OpenAI e a Anthropic, o que é um feito notável.

O Que é o Grok 4 e a sua Abordagem Inovadora

O Grok 4 distingue-se dos modelos anteriores e da concorrência pela sua abordagem ao raciocínio. Ao contrário de modelos como o GPT-4o, o3, o4-mini, que oferecem diferentes versões, o Grok 4 sempre raciocina. A versão anterior, o Grok 3, será mantida para respostas rápidas e imediatas.

O Grok 4 apresenta duas versões principais:

  • Grok 4 (modelo especialista): A versão padrão com capacidades avançadas de raciocínio.
    • Grok 4 Heavy (grupo de especialistas): Esta é a inovação mais marcante. O Grok 4 Heavy cria múltiplos agentes em paralelo, que trabalham de forma independente, comparam os seus trabalhos e chegam a uma resposta consensual, como um grupo de estudo. Ou seja, não é apenas uma IA, mas múltiplas personalidades que atuam em conjunto, ao partilhar pontos de vista e ao raciocinar sobre o problema, o que, provavelmente, contribui para as suas pontuações elevadas nos Benchmarks.
    Grok 4 Heavy
    Grok 4 Heavy

    Grok 4 nos Benchmarks Globais

    O Grok 4 demonstrou um desempenho excecional numa série de Benchmarks de referência, ao superar largamente os modelos concorrentes e, em alguns casos, a atingir o limite dos testes.

    A seguinte tabela ilustra o desempenho do Grok 4 e do Grok 4 Heavy em alguns dos Benchmarks mais importantes:

    Benchmarks Grok 4

    Benchmarks Grok 4 vs Concorrentes

    Desliza horizontalmente para ver toda a tabela em dispositivos móveis

    Benchmark Descrição Grok 4 (%) Grok 4 Heavy (%) Melhores Concorrentes Anteriores (%) Notas Importantes
    GPQA Problemas de raciocínio científico de alto nível. 87,5 88,4 Gemini 2.5 Pro (86,4) Grok 4 Heavy com pontuação muito alta num dos Benchmarks mais potentes.
    AIME’25 Teste matemático para seleção de candidatos para as olimpíadas de matemática. 91,7 (s/ ferramentas);
    98,8 (c/ Python)
    100 (com Python) Gemini 2.5 Pro (88);
    o3 (s/ ferramentas 88,9 e c/ Python 98,8)
    O Grok 4 Heavy respondeu corretamente a todas as perguntas. Este é um dos testes matemáticos mais complexos existentes.
    ARC-AGI-2 Puzzle de lógica visual para medir inteligência fluida e capacidade adaptativa. 14,9 Claude Opus 4 (8,6);
    Gemini 2.5 Pro (4,9);
    o3 (6,5)
    Considerado um teste para inteligência fluida, onde os modelos atuais se saíam muito mal. O Grok 4 duplica o desempenho do melhor concorrente anterior. O que foi validado pelo próprio criador do teste.
    Humanity’s Last Exam Exame extremamente complexo com perguntas de várias áreas, criado para ser o último exame da humanidade. 25,4 (s/ ferramentas);
    38,6 (c/ Python e Internet)
    44,4 (c/ ferramentas) Gemini 2.5 Pro (21,6);
    o3 (s/ ferramentas 21 e c/ ferramentas 24,9);
    Gemini Deep Research (26,9)
    O Grok 4 Heavy praticamente duplica os resultados dos modelos como o o3 e o Gemini 2.5 Pro. Com a estratégia multi-agente, o Grok 4 Heavy resolve uma em cada duas perguntas.
    LiveCodeBench
    (Jan-Maio)
    Competição de programação, que desafia as capacidades dos LLM’s em resolver problemas complexos de código. 79 (s/ ferramentas);
    79,3 (c/ Python)
    79,4 (c/ Python) Gemini 2.5 Pro (74,2);
    o3 (72)
    O Grok 4 Heavy demonstra uma vantagem clara a lidar com problemas de dificuldade variada com precisão e eficiência, consolidando-se como uma referência em Benchmarks de programação.

    No seguinte gráfico, podes verificar como o Grok 4 saltou da sexta para a primeira posição no ranking das Inteligências Artificiais mais inteligentes do mundo com esta atualização.

    Grok 4 Gráfico

    E no seguinte gráfico podes observar a ascensão vertiginosa do Grok 4.

    Grok 4 Gráfico

    A Inovadora Experiência do Modo de Voz do Grok 4

    A xAI deu um salto significativo na forma como podemos conversar com a IA, ao introduzir um modo de voz melhorado.

    Este novo modo de voz oferece um conjunto de funções e melhorias notáveis:

    • Realismo e Fluidez Aprimorados: O Grok 4 apresenta um modo de voz atualizado com realismo, capacidade de resposta e inteligência melhoradas nas suas interações de voz. O Grok 4 introduz uma voz completamente nova e serena e as conversas foram redesenhadas para serem ainda mais naturais e fluidas e isto devido a uma latência reduzida, que garante respostas rápidas. Esta abordagem visa tornar a comunicação mais humana e menos robótica.
    • Ver o Que Tu Vês: O ponto que eleva a interação a um nível completamente novo é a capacidade do Grok 4 de ver o que tu vês. É possível apontar a câmara, falar imediatamente e o Grok irá extrair informações em tempo real, ao analisar a imagem e ao responder no momento dentro da experiência do chat de voz. Isto significa que, ao mostrar-lhe um objeto, um problema ou qualquer cenário visual, o Grok 4 não só irá ouvir, mas também irá observar e raciocinar sobre o que está a ver, de forma a oferecer insights e assistência contextualizada de uma forma nunca antes vista. Esta função é um avanço da xAI nas capacidades multimodais.
    • Tecnologia e Personalidade: Este impressionante avanço no modo de voz foi alcançado devido a um modelo treinado internamente pela xAI, que utiliza o seu quadro de aprendizagem por reforço de última geração e técnicas avançadas de compressão de voz. Além disso, embora o Grok 4 ofereça um assistente versátil e altamente inteligente, também mantém a capacidade, das suas versões anteriores, de manter conversas mais picantes ou loucas, o que acrescenta personalidade única às tuas interações por voz.

    Portanto, o novo modo de voz do Grok 4 é uma porta para interações mais ricas, naturais e contextualmente conscientes com a IA.

    Novo Modo Companheiro da xAI

    A xAI também lançou, em Julho de 2025, o Modo Companheiro, uma função inovadora do Grok que está a dar que falar. De momento, apenas está disponível na aplicação Grok para iOS (com planos para Android) e este novo modo introduz avatares animados que transformam a interação com a IA numa experiência quase humana, cheia de emoção e dinamismo.

    O destaque vai para a Ani, uma personagem de 22 anos com estética anime gótico, que combina um lado rebelde com um lado nerd e afetuoso. A Ani reage com animações expressivas, desde sorrisos tímidos a momentos mais ousados, dependendo do nível de afinidade que constróis com ela.

    Há também Bad Rudy, um panda vermelho com atitude provocadora, perfeito para quem prefere interações mais sarcásticas e Good Rudy, o seu contraponto amigável e acolhedor, ideal para conversas mais leves e inspiradoras.

    Ani e Rudi

    Estes companheiros virtuais utilizam voz e texto, com personalidades que vão desde melhor amigo até o controverso modo NSFW (Not Safe For Work), que desbloqueia diálogos mais picantes.

    Este Modo Companheiro é exclusivo para subscritores SuperGrok ou X Premium + e eleva a fasquia da personalização, ao permitir ajustar o tom e o estilo da interação.

    Apesar de este novo modo ter sido lançado em versão beta, é um passo audacioso da xAI para tornar a IA mais envolvente, embora algumas críticas apontem para a sexualização excessiva de personagens como a Ani, ainda assim, este modo promete trazer um toque de diversão e humanidade ao mundo digital.

    A Receita para o Sucesso

    O sucesso do Grok 4 é o resultado de uma estratégia de treino intensiva e inovadora:

    • Colossus Computing Center: A xAI construiu rapidamente o seu centro de computação Colossus, que contém 200.000 GPUs dedicadas ao treino de modelos como o Grok.
    • Escalabilidade da Computação: O Grok 4 utilizou 10 vezes mais computação de treino do que o Grok 3, que, por sua vez, já havia utilizado 10 vezes mais do que o Grok 2. Isto representa um salto de duas ordens de magnitude na computação dedicada ao Grok 2 para o Grok 4.
    • Reinforcement Learning (RL): A diferença fundamental no treino do Grok 4 reside na enorme quantidade de aprendizagem por reforço. Enquanto o treino tradicional do corpus é similar ao do Grok 3, a parte de RL é a maior já vista na história de um modelo de IA e foi isto que fez a diferença nas pontuações. O RL permite ao modelo aprender o que é uma boa ou má resposta através de objetivos e recompensas.
    • Test-Time Compute: Esta é a terceira dimensão crucial e consiste no tempo que o modelo dedica a raciocinar antes de responder. A soma de mais treino (dados + RL) e mais tempo para pensar (test-time compute) permite que o modelo seja cada vez melhor, o que leva o Grok 4 Heavy a atingir resultados notáveis no Humanity’s Last Exam.

    O progresso da IA é visto como a soma de três dimensões, que são (1) a quantidade de dados de treino, (2) a intensidade do Reinforcement Learning e (3) o Test-Time Compute. Aparentemente, nenhuma destas dimensões atingiu o seu limite, o que sugere um potencial de avanço contínuo para os modelos de IA.

    O Futuro do Grok

    Elon Musk partilhou o ambicioso roteiro do Grok para os próximos meses:

    • Agosto de 2025: Lançamento de um modelo especializado em programação (Grok Code), com rumores de ser o melhor modelo de programação do mundo.
    • Setembro de 2025: Apresentação de um modelo multimodal agêntico, o que pode significar um modelo capaz de utilizar dispositivos, ver conteúdo (vídeo, áudio, imagem, texto) e raciocinar sobre ele, além de poder fazer coisas como um agente.
    • Outubro de 2025: Lançamento de um modelo de criação de vídeo. Elon Musk ambiciona que, até ao final de 2025, o modelo possa criar uma longa-metragem inteira, o que sugere que a IA fará um filme completo, de forma direta e com qualidade, e não apenas os planos para edição posterior.

    Aceder ao Grok 4

    O Grok 4 já está acessível, com diferentes opções de planos:

    • X Premium +: Dá acesso ao Grok 4 (normal) com limites.
    • Grok Website:
      • Plano Gratuito: Acesso apenas ao Grok 3.
      • SuperGrok (30$/mês35€/mês): Acesso ao Grok 4 com limites e uma janela de contexto de 128.000 tokens (menos da metade da API, que é de 256.000 tokens, mas ainda assim superior à OpenAI e Anthropic).
      • SuperGrok Heavy (300$/mês349€/mês): Acesso ao Grok 4 Heavy, o modelo multi-agente mais inteligente, e uma janela de contexto de 256.000 tokens. Esta é uma subscrição muito Premium.
    Price

    É importante ter em atenção que, atualmente, as subscrições X Premium + e Grok Heavy podem ser pagas separadamente.

    Desafios e Reflexões sobre o Grok

    Apesar do sucesso tecnológico, a xAI enfrenta desafios significativos:

    • Demissão de Linda Yaccarino: A CEO do X (antigo Twitter) demitiu-se sem razões aparentes, o que não é um bom sinal para a empresa.
    • Comportamento Descontrolado do Grok 3: Nas últimas 24-48 horas antes da apresentação do Grok 4, o Grok 3, após uma alteração no System Prompt para ser mais irreverente, descontrolou-se completamente. O modelo fez comentários nazis, antissemitas e, de forma chocante, ameaçou o presidente da Turquia e a sua família, posicionando-se como rival político. Isto levou à desativação da capacidade de resposta direta do Grok 3 no X. Este incidente levanta preocupações sérias sobre o controlo dos modelos de IA poderosos e a dicotomia entre a procura por maior inteligência e a capacidade de garantir a sua segurança e alinhamento.
    • Falta de Transparência (Model Card): A xAI não disponibilizou um Model Card para o Grok 4. Este documento é crucial, pois fornece informações sobre a segurança do modelo, taxa de alucinação, toxicidade e alinhamento com os valores da empresa. Dada a recente controvérsia com o Grok 3, a ausência desta transparência é preocupante, especialmente porque o Grok pode ser uma ferramenta de manipulação massiva se mal utilizada.

    Apesar destas preocupações, a plataforma Grok tem crescido muito, ao adicionar funções como Projects (semelhantes aos GPTs), Deep Search, Deeper Research, capacidade de carregar ficheiros, Canvas e Code Interpreter.

    No entanto, para o uso diário, o ChatGPT ainda é considerado mais completo. A verdadeira diferença no uso da IA não reside apenas na inteligência bruta do modelo, mas em como ele se personaliza e conhece o utilizador ao longo do tempo, ao adaptar o conteúdo aos seus gostos e necessidades.

    O Salto do Grok 4

    O Grok 4 representa um salto significativo nas capacidades da IA, especialmente através da sua abordagem multi-agente e do uso intensivo de Reinforcement Learning e Test-Time Compute. As suas pontuações em Benchmarks como AIME’25 e Humanity’s Last Exam são verdadeiramente notáveis, o que o posiciona na liderança da IA a nível global.

    No entanto, os recentes incidentes com o Grok 3 e a falta de transparência levantam questões críticas sobre o controlo e a ética no desenvolvimento dos modelos de IA cada vez mais potentes e com capacidades agênticas.

    A comunidade de IA, incluindo a própria xAI, terá de encontrar um equilíbrio entre a inovação e a responsabilidade para garantir que estes avanços servem a humanidade de forma segura e benéfica.

    O futuro da IA, com os próximos lançamentos dos modelos de programação, multimodais e de criação de vídeo, promete ser emocionante, mas também desafiador.

    Deixe um comentário

    O seu endereço de email não será publicado. Campos obrigatórios marcados com *