O modelo Gemini Flash, do Google, tem registrado adoção crescente por parte de clientes empresariais de inteligência artificial, segundo dados da plataforma de integração de modelos da Vercel e relatos do CEO da empresa, Guillermo Rauch. A aceleração ocorre antes da conferência anual Google I/O, que começa na próxima semana, quando a companhia deve anunciar novos modelos, ferramentas e recursos.
Rauch, encontrado pelo autor durante a conferência de desenvolvedores da Anthropic na semana passada, afirmou que a demanda por IA está “fora de série” e que, entre seus clientes, os modelos do Google têm se destacado. Ele contou ter precisado contatar um alto executivo do Google para solicitar mais tokens Gemini — a unidade básica de uso de IA.
A evidência vem do AI Gateway da Vercel, uma camada que permite a empresas conectar seus aplicativos a diferentes modelos de IA por meio de um único sistema. A ferramenta é usada principalmente por startups de IA, empresas de software e equipes de produtos corporativos que implementam recursos como chatbots, assistentes de programação, ferramentas de busca e copilotos.
Segundo o gráfico divulgado pela Vercel, em março os modelos da Anthropic lideravam em número de tokens processados. No início de abril, o Gemini 3 Flash assumiu a liderança em tokens e manteve a posição ao longo do mês. O Gemini Flash é menos potente que a versão completa do Gemini 3, mas tem custo e latência menores, características que o tornam atraente para uso em larga escala.
“Equipes empresariais tendem a escolher Gemini Flash e Claude Haiku, os menores, mais rápidos e baratos modelos que cada laboratório disponibiliza”, disse Rauch. “O Flash, em particular, está tendo forte adoção B2C porque não alucina muito, utiliza ferramentas de forma eficaz, e é rápido e acessível.”
Rauch também enfatizou que diferentes métricas mostram vencedores distintos: por uso de tokens, o Google liderou em abril; por receita, a Anthropic manteve participação de 61% dos gastos no mês. A participação de gastos com OpenAI triplicou entre março e abril, passando de 4% para 12% após o lançamento das séries de modelos GPT-5.4 e 5.5. Já a fatia de gastos com o Google subiu de 8% para 21% à medida que o uso do Gemini Flash aumentou.
“Um retrato de um único mês não prevê o próximo”, afirmou Rauch, destacando a dinâmica rápida do setor e a variedade de casos de uso que favorecem modelos diferentes.
O comportamento observado na plataforma da Vercel aponta para uma competição em que modelos de menor custo e maior velocidade conquistam volumes elevados, enquanto modelos mais caros dominam trabalhos críticos em qualidade.
Com informações de Businessinsider

