Google corrige ‘falha’ no Gemini com novo modelo Flash Low que usa menos tokens

A Google acaba de lançar o Gemini 3.5 Flash Low, uma nova variante criada para reduzir drasticamente o consumo de tokens em tarefas simples, depois de uma onda de críticas de developers ao Antigravity.

Nélson Gomes da Costa

25 maio 2026

Adicionar 4gnews como fonte preferida

A Google apresentou oficialmente o Gemini 3.5 Flash Low, uma nova variante do seu modelo de inteligência artificial criada para reduzir o consumo excessivo de tokens em tarefas simples, um problema que vinha a gerar críticas entre developers que utilizam o Antigravity, a plataforma de desenvolvimento agentic da empresa.

Segundo a Google, o novo modelo consegue gerar cerca de 45% menos tokens do que a versão original do Gemini 3.5 Flash, agora renomeada internamente para Gemini 3.5 Flash Medium. O objetivo passa por tornar tarefas mais básicas muito mais eficientes em termos de custo e utilização, especialmente em ambientes de programação e automação.

Google tenta resolver revolta em torno das quotas do Gemini

A decisão surge depois de vários utilizadores denunciarem limites demasiado apertados no Gemini AI Pro e no Antigravity, sobretudo em workloads de software engineering. A Google já tinha aumentado as quotas até nove vezes em atualizações anteriores, mas os problemas persistiram.

Varun Mohan, diretor da Google DeepMind responsável pelo Antigravity, admitiu que a empresa identificou um “ponto cego” na medição de consumo para tarefas mais simples. Segundo o executivo, o Gemini 3.5 Flash foi otimizado para raciocínio avançado e workflows complexos, mas acabou por gastar demasiados tokens em operações básicas.

Além do lançamento do Flash Low, a Google reiniciou temporariamente as quotas de utilização para todos os utilizadores, incluindo planos gratuitos e pagos.

Gemini 3.5 Flash tornou-se peça central da estratégia de IA da Google

O Gemini 3.5 Flash foi apresentado no Google I/O 2026 como o principal modelo ‘rápido’ da empresa, focado em coding, agentes autónomos e tarefas multimodais. A Google afirma que o modelo rivaliza com soluções topo de gama, mantendo velocidades até quatro vezes superiores às de concorrentes frontier.

O modelo já está integrado no Gemini app, Google Search AI Mode, Android Studio e ferramentas empresariais da Google.

Analistas apontam que o lançamento do Flash Low mostra uma mudança importante na estratégia da Google: em vez de apostar apenas em modelos mais poderosos, a empresa começa agora a focar-se fortemente na eficiência operacional e nos custos reais de utilização da IA.

O que muda para developers e utilizadores

Na prática, o Gemini 3.5 Flash Low deverá ser utilizado automaticamente em tarefas menos complexas dentro do Antigravity, libertando recursos para operações mais exigentes. A Google garante que o modelo não reduz contexto nem compromete prompts de sistema, limitando-se a diminuir o ‘nível de esforço’ computacional.

A empresa continua também a preparar o lançamento do Gemini 3.5 Pro, previsto para as próximas semanas, numa altura em que a corrida pela liderança da IA entre Google, OpenAI e Anthropic acelera significativamente.

Google Pixel Watch 4 41 mmmonitoriza saúde, assistência IA, SOS por satélite, carga rápida

372,00 €Amazon

399,00 €-7%

Ver Promoção