A Microsoft apresentou na quarta-feira, 30 de abril, seus novos modelos de IA, os Phi-4, destacando o novo "reasoning plus". Esse modelo inova ao reunir um desempenho comparável a sistemas que contam com 671 bilhões de parâmetros, utilizando apenas 14 bilhões. Desenvolvidos com o foco em matemática, ciências e programação, os Phi-4 estarão disponíveis em breve para desenvolvedores, especialmente em dispositivos que consomem menos energia.
Os modelos Phi-4 incluem variantes como o Phi-4-mini-reasoning com 3,8 bilhões de parâmetros, o Phi-4-reasoning com 14 bilhões e o Phi-4-reasoning-plus. Estas inovações representam um avanço significativo em eficiência computacional. Foram treinados com dados sintéticos proporcionados pelo modelo R1 da DeepSeek e por meio de demonstrações do o3-mini da OpenAI. O uso de técnicas de chain-of-thought permite que os modelos resolvam problemas de forma gradativa e estruturada.
O modelo Phi-4-reasoning-plus teve um desempenho notável, igualando o o3-mini da OpenAI no teste OmniMath e alcançando resultados próximos ao modelo R1 em tarefas específicas, mesmo com uma quantidade de parâmetros 48 vezes menor. A eficácia deste modelo foi interna e criteriosamente demonstrada em questões das olimpíadas matemáticas (AIME) entre 2022 e 2025, além de desafios científicos de nível doutoral.
A arquitetura do modelo de 14 bilhões de parâmetros é fundamentada na estrutura do Transformer. Passou por um processo de:
Projetado com foco em dispositivos edge, o modelo Phi-4-mini-reasoning possibilitará tutoriais embarcados em tablets educacionais. O modelo principal terá aplicações em:
Os novos modelos serão disponibilizados sob a licença MIT, acessíveis através do Hugging Face e Azure, com otimizações para silício especializado, o Phi Silica. A Microsoft destaca que esta abordagem de "open-weight" visa democratizar o acesso à inteligência artificial avançada.
A Microsoft já indicou que está em desenvolvimento o Phi-4-multimodal, anunciado em fevereiro, que buscará integrar o processamento de texto, imagens e até mesmo áudio. Para especialistas, essa estratégia de modelos mais compactos e especializados poderá redefinir os custos operacionais de IA em escalas industriais.