Novos LLMs da Mistral
Como anunciamos recentemente, a startup francesa Mistral acaba de lançar novos modelos de IA. A novidade agora consiste em LLMs que podem ser executados em dispositivos do dia a dia, como laptops e telefones. Esses modelos, conhecidos como “Les Ministraux”, podem ser usados para várias tarefas.
Com esse lançamento, a Mistral, que recentemente levantou US$ 640 milhões em capital de risco, continua a expandir gradualmente seu portfólio de produtos de IA. Atualmente, a empresa já é considerada um dos grandes players do setor. Apenas nos últimos meses, a Mistral lançou, além de outros LLMs, um serviço gratuito para desenvolvedores testarem seus modelos, um SDK para permitir que os clientes ajustem esses modelos e novos modelos de domínios específicos, incluindo um modelo generativo para código chamado Codestral.
LLMs ou SLMs?
Os modelos lançados agora são capacitados para realizar tarefas que incluem desde a geração de textos até a assistência a modelos de IA mais avançados. Existem duas versões disponíveis: Ministral 3B e Ministral 8B. Ambos os modelos seguem a tendência atual de várias empresas, como Google, OpenAI e Microsoft, na adoção de soluções inteligentes menores. Elas prometem ser uma alternativa mais econômica e acessível em comparação aos LLMs gigantes como os GTPs da OpenAI.
A Mistral criou seus novos modelos para atender à demanda por aplicativos de IA privados e eficientes para dispositivos moveis. Eles podem ser usados para várias aplicações. Elas incluem tradução, assistentes inteligentes sem acesso à Internet, análises locais e robótica autônoma.
Licença restritiva e bom desempenho
Os modelos Les Ministraux contam com uma janela de contexto de 128.000 tokens. Isso significa que eles podem ingerir aproximadamente o comprimento de um livro de 50 páginas.
O Ministral 8B está disponível para download na plataforma da Mistral e na plataforma da Hugging Face, mas apenas para fins de pesquisa. Os interessados em usá-lo para outros fins contactar a Mistral para obter uma licença comercial.
Em termos de línguas, os novos LLMs dominam o inglês, espanhol, alemão, francês e italiano.
Os modelos da Mistral são conhecidos por seus excelentes desempenhos. Para as novas versões, a Mistral afirma que o Ministral 3B e o Ministral 8B superam os modelos Llama e Gemma de tamanhos comparáveis. Os desempenhos foram verificados em vários benchmarks tradicionais de IA. A empresa afirma também que eles são melhores do que o Mistral 7B, seu modelo anterior de tamanho equivalente. Porém, o Mistral 7B tem licença Apache 2.0 permissiva, o que o torna muito melhor em nossa opinião 😍!