QwQ: mais uma novidade no restrito grupo de IAs com raciocínio
O Alibaba, gigante do varejo chinês, segue causando no mundo da IA. Desta vez, em um movimento surpreendente, a empresa introduziu um concorrente de código aberto para o modelo de inteligência artificial (IA) o1 da OpenAI. A novidade foi desenvolvida pela equipe responsável pela linha de modelos Qwen.
Apelidado de QwQ, o Alibaba afirma que esse modelo específico está no mesmo nível dos modelos de raciocínio atuais do criador do ChatGPT. Segundo a empresa, o QwQ foi projetado para navegar nas águas profundas do pensamento, questionamento e compreensão.
LLMs com raciocínio: um grupo com poucos players
Embora já estejamos bem familiarizados com os LLMs tradicionais como ChatGPT-4, Gemini e Claude 3.5, as novas IAs com raciocínio são bem diferentes e mais raras. Elas são modelos treinados usando técnicas como aprendizado por reforço. Entre suas habilidades mais conhecidas estão a capacidade de quebrar problemas complexos em tarefas menores e executar sequências de raciocínios para chegar em soluções. Ou seja, eles são projetados para emular processos cognitivos mais parecidos com os humanos.
Segundo o Alibaba, o novo modelo:
aborda todos os problemas – seja matemática, código ou conhecimento de nosso mundo – com admiração e dúvida genuínas. O QwQ incorpora esse antigo espírito filosófico: ele sabe que não sabe nada, e é exatamente isso que impulsiona sua curiosidade. Antes de se decidir por qualquer resposta, ele se volta para dentro, questionando suas próprias suposições, explorando diferentes caminhos de pensamento, sempre buscando uma verdade mais profunda.
A equipe do Alibaba relata que o novo modelo supera os modelos o1 da OpenAI em três benchmarks, incluindo o benchmark MATH-500, que apresenta à IA problemas matemáticos prolixos.
Modelo de raciocínio de código aberto!
Pela descrição, fica evidente que o QwQ visa rivalizar com o modelo de inteligência artificial o1. Porém, diferentemente do modelo da OpenAI, o novo QwQ-32B foi lançado sob licença Apache 2.0!!! Isso significa que ele pode ser implantado em empreendimentos comerciais. E essa não é a primeira vez que a gigante chinesa faz isso. Só neste ano, a Alibaba já lançou diversos outros LLMs de código aberto e todos de ponta. No entanto, diferentemente das liberações anteriores, o novo modelo é um modelo de raciocínio, que tenta replicar uma solução humana de resolução de problemas.
Modelo com raciocínio com licença Apache 2.0 (link).
Onde encontrar
QwQ está disponível para demonstrações em alguns links listados num post no repo do GitHub da empresa. Ele pode ser encontrado para download aqui.
Mas note: o QwQ é um modelo grande (32B). Portanto, ele não roda em qualquer sistema. Ele está disponível para testes diretamente na plataforma da Hugging Face.
QwQ: modelo experimental
O modelo QwQ-32B ainda é um modelo de pesquisa experimental. Ele demonstra habilidades analíticas promissoras. Mas possui várias limitações importantes. Às vezes ele mistura idiomas e entra em loops de raciocínios recursivos. Ele também precisa adquirir medidas de segurança aprimoradas para garantir um desempenho confiável e seguro. O modelo se destaca em matemática e codificação, mas tem espaço para melhorias em outras áreas. Entre elas, o Alibaba destaca raciocínio de senso comum e compreensão de linguagem diferenciada.
Empresas chinesas na vanguarda tecnológica!
O modelo do Alibaba coloca a China com um player absoluto no mundo dos modelos de IA de última geração, já que esse é o segundo com raciocínio lançado pelo país. O primeiro, desenvolvido pela DeepSeek, foi liberado há poucos dias.