IA multimodal Janus Pro AI da DeepSeek
Em mais um movimento que deixou muitos na comunidade de inteligência artificial (IA) atordoados, a startup chinesa DeepSeek lançou uma nova família de modelos de IA multimodal de código aberto, apelidada de Janus Pro. A novidade está disponível com licença MIT.
A tecnologia de ponta do Janus Pro superou o DALL-E 3 da OpenAI nos principais benchmarks. E ela já está disponível para download imediato no popular hub de IA Hugging Face.
Para aqueles que podem não estar familiarizados com o burburinho em torno da startup DeepSeek, ela ganhou recentemente as manchetes com seu modelo de linguagem R1. Ele possui desempenho equivalente aos melhores modelos de IA de seus concorrentes, mas custou menos de US$ 6 milhões para ser desenvolvido. Isso gerou um debate acalorado sobre o estado atual da indústria de IA e se empresas como a Nvidia estão sendo deixadas para trás.
Então, o que torna o Janus Pro tão especial? Conforme a DeepSeek, o modelo usa uma “nova estrutura autorregressiva” que desacopla a codificação visual em caminhos separados, mantendo uma arquitetura de transformador única e unificada. Esse design permite que o modelo analise e gere imagens com resolução de 768×768, tornando-o uma ferramenta altamente versátil. A novidade pode ser encontrada em vários tamanhos. O menor modelo da série possui 1 bilhão de parâmetros. O maior tem 7B.

Imagens geradas com Janus Pro (fonte).
Disponível para download
Com toda a euforia gerada em torno dos modelos da startup DeepSeek, não podemos negar a empolgação em torno do Janus Pro. Seu lançamento ocorre em um momento em que a indústria de IA está mudando para abordagens mais colaborativas e de código aberto. A decisão da DeepSeek de disponibilizar seus modelos para downloads imediatos gratuitamente estabelece um novo padrão de transparência na pesquisa de IA.
O que isso significa para o futuro da IA? Só o tempo dirá, mas uma coisa é certa: o Janus Pro é mais um divisor de águas.
Se você quer conhecer a nova IA multimodal da DeepSeek, vá até o Hugging Face e comece a explorar. Baixe uma das versões disponíveis do Janus Pro e experimente seus recursos. Lembre-se de que ainda não há uma maneira imediata de usar interfaces de usuário tradicionais para executar o modelo. Portanto, ele precisa ser acessado num código Python.