A Google apresentou oficialmente o Gemini 3.5 Flash Low, uma nova variante do seu modelo de inteligência artificial criada para reduzir o consumo excessivo de tokens em tarefas simples, um problema que vinha a gerar críticas entre developers que utilizam o Antigravity, a plataforma de desenvolvimento agentic da empresa.
Segundo a Google, o novo modelo consegue gerar cerca de 45% menos tokens do que a versão original do Gemini 3.5 Flash, agora renomeada internamente para Gemini 3.5 Flash Medium. O objetivo passa por tornar tarefas mais básicas muito mais eficientes em termos de custo e utilização, especialmente em ambientes de programação e automação.
Google tenta resolver revolta em torno das quotas do Gemini
A decisão surge depois de vários utilizadores denunciarem limites demasiado apertados no Gemini AI Pro e no Antigravity, sobretudo em workloads de software engineering. A Google já tinha aumentado as quotas até nove vezes em atualizações anteriores, mas os problemas persistiram.
Varun Mohan, diretor da Google DeepMind responsável pelo Antigravity, admitiu que a empresa identificou um “ponto cego” na medição de consumo para tarefas mais simples. Segundo o executivo, o Gemini 3.5 Flash foi otimizado para raciocínio avançado e workflows complexos, mas acabou por gastar demasiados tokens em operações básicas.
Além do lançamento do Flash Low, a Google reiniciou temporariamente as quotas de utilização para todos os utilizadores, incluindo planos gratuitos e pagos.
Gemini 3.5 Flash tornou-se peça central da estratégia de IA da Google
O Gemini 3.5 Flash foi apresentado no Google I/O 2026 como o principal modelo ‘rápido’ da empresa, focado em coding, agentes autónomos e tarefas multimodais. A Google afirma que o modelo rivaliza com soluções topo de gama, mantendo velocidades até quatro vezes superiores às de concorrentes frontier.
O modelo já está integrado no Gemini app, Google Search AI Mode, Android Studio e ferramentas empresariais da Google.
Analistas apontam que o lançamento do Flash Low mostra uma mudança importante na estratégia da Google: em vez de apostar apenas em modelos mais poderosos, a empresa começa agora a focar-se fortemente na eficiência operacional e nos custos reais de utilização da IA.
O que muda para developers e utilizadores
Na prática, o Gemini 3.5 Flash Low deverá ser utilizado automaticamente em tarefas menos complexas dentro do Antigravity, libertando recursos para operações mais exigentes. A Google garante que o modelo não reduz contexto nem compromete prompts de sistema, limitando-se a diminuir o ‘nível de esforço’ computacional.
A empresa continua também a preparar o lançamento do Gemini 3.5 Pro, previsto para as próximas semanas, numa altura em que a corrida pela liderança da IA entre Google, OpenAI e Anthropic acelera significativamente.