Google Lança Gemini 2.5 Deep Think para o Público
A Google apresentou ao público o Gemini 2.5 Deep Think, um de seus modelos de raciocínio em IA mais avançados, disponível por $250 mensais. Esta nova versão utiliza mais de um agente de IA para gerar respostas criativas e precisas, destacando-se em testes de desempenho.
Desempenho Superior em Testes de Benchmark
De acordo com a Google, o modelo alcançou resultados notáveis em testes de referência em inteligência artificial, superando vários concorrentes. Uma variação do modelo foi premiada com a medalha de ouro na última Olimpíada Internacional de Matemática (IMO), solucionando cinco dos seis problemas propostos. A versão agora acessível, embora mais rápida, também apresenta um desempenho de nível bronze na IMO.
Facilidade de Uso e Acesso
Os inscritos poderão experimentar o "Deep Think" ativando uma opção na barra de prompt na versão Gemini 2.5 Pro no aplicativo Gemini. Este modelo foi antecipado pela Google em sua conferência I/O em maio, mas a versão atual foi aprimorada significativamente com base no feedback de usuários e melhorias nos benchmarks.
Técnicas Inovadoras de Resolução de Problemas
O Gemini 2.5 Deep Think adota técnicas de pensamento paralelo, permitindo que o modelo aborde problemas complexos com uma estratégia semelhante à humana, ponderando diversas perspectivas e soluções em conjunto. Segundo comunicado da empresa, essa abordagem possibilita a geração de ideias simultaneamente, combinando ou revisando-as ao longo do processo.
Avanços em Aprendizado Reforçado
A Google também implementou novas técnicas de aprendizado reforçado, incentivando o modelo a explorar caminhos de raciocínio mais longos, tornando o Deep Think cada vez mais intuitivo na resolução de problemas. Isso, conforme afirmado pela Google, torna o modelo especialmente valioso para programação, desenvolvimento web e pesquisas científicas.
Resultados Promissores na Avaliação de Conhecimento
Em um teste conhecido como Humanity’s Last Exam (HLE), que abrange áreas como matemática, ciência e humanidades, o Gemini 2.5 Deep Think obteve uma pontuação de 34,8%, superando os rivais OpenAI o3 que alcançou 20,3% e Grok 4 com 25,4%. Além disso, a Google planeja compartilhar a versão medalhista de ouro do modelo com um seleto grupo de matemáticos e acadêmicos, buscando utilizar o feedback para melhorias futuras.