Microsoft libera!
Todos nós sabemos que LLMs gigantes são excelentes. Mas seus tamanhos podem ser um problema para desenvolvedores que não dispõem de hardwares apropriados ($$$$). Por isso, a disponibilização de modelos pequenos e eficientes é sempre um motivo para celebração. E este é justamente o caso do excelente Phi-4, da Microsoft. A novidade super poderosa foi lançada em dezembro passado e liberada como projeto de código aberto agora!
Mas o que é Phi-4?
Desenvolvido por pesquisadores da Microsoft e cientistas de IA, o Phi-4 é um modelo de linguagem pequeno, mas extremamente poderoso. Ele tem “apenas” 14B de tamanho, mas supera vários gigantes em termos de desempenho.
O Phi-4 supera concorrentes maiores em áreas como raciocínio matemático e compreensão de linguagem multitarefa. Ele se destaca particularmente em benchmarks que testam raciocínio avançado e recursos específicos de domínio. O modelo da Microsoft pontua mais de 80% em testes como MATH e MGSM, superando LLMs maiores como Gemini Pro e GPT-4o-mini. Seu desempenho superior em tarefas de raciocínio matemático o torna uma escolha forte para áreas como finanças, engenharia e pesquisa científica.
Por que ele é tão bom?
Com arquitetura compacta, o Phi-4 foi projetado para atender à crescente necessidade de IA de alto desempenho em ambientes com restrição de computação e memória. Para isso, ele conta com uma arquitetura inteligente e com parâmetros muito bem calibrados por um processo de treinamento cuidadoso.
Estruturalmente, o Phi-4 consiste numa rede neural do tipo transformador denso e somente decodificador. Ele foi treinado em mais de 9 trilhões de tokens de conjuntos de dados selecionados e sintéticos. Esse treinamento extensivo permite que o modelo alcance resultados notáveis em tarefas como geração de código funcional.
Bom e de código aberto!
Embora o Phi-4 tenha sido lançado em dezembro passado, apenas agora ele foi liberado sob uma licença MIT! E essa liberação como modelo de código aberto é um marco significativo – principalmente vindo da Microsoft, que não costuma adotar essa postura. Ao disponibilizar todos os pesos e arquitetura do Phi-4 sob uma licença do MIT, a Microsoft está abrindo para as empresas e desenvolvedores usarem a novidade sem precisar de permissão. Como o Phi-4 é um modelo pequeno, ele tem como grande vantagem não precisar de recursos computacionais extensos. Por isso, ele é ideal para ser usado por desenvolvedores e empresas que não possuem muitos recursos, mas querem ter acesso a IAs de ponta.
A liberação do Phi-4 como código aberto não é um evento isolado. Esse movimento se alinha com uma tendência crescente de grandes players da área de IA como Meta e Alibaba Cloud. Cada vez mais, grandes empresas e universidades lançam modelos de IA de código aberto. A justificativa para essa iniciativa é promover a inovação e a transparência. Na prática, ela facilita a adoção das novas tecnologias, pois as torna muito mais acessíveis.
Para os interessados, o Phi-4 (tamanho 14B) pode ser baixado nas plataformas Hugging Face e Ollama.