Imagen 3: imagens de alta qualidade e alta compreensão linguística
Imagen 3 é o mais novo modelo de IA generativa do Google Deep Mind. Ele converte prompts de texto em imagens da mais alta qualidade. Criado a partir do sucesso do modelo anterior, Imagen 2, Image 3 gera imagens com alto nível de detalhes, ricos padrões de iluminação, menos artefatos, e menor tempo de latência segundo seus criadores. O novo modelo também é habilitado para gerar imagens com uma ampla variedade de estilos visuais.
Outra vantagem da novidade é sua melhor compreensão de prompts linguísticos. Essa parece ser uma tendência crescente nos modelos atuais de IA generativa voltados para a geração de imagens. Tengr.ai é outra ferramenta de IA generativa que tem se dedicado bastante ao desenvolvimento de modelos com alta capacidade de compreensão linguística para captar melhor a intenção de seus usuários.
Várias versões e segurança redobrada
O Imagen 3 estará disponível em várias versões, cada uma otimizada para diferentes tipos de tarefas. Elas variam desde a geração de esboços rápidos até a criação de imagens complexas e de alta resolução.
Todas as versões do Imagen 3 foram construídas com as mais recentes inovações de segurança do Google Deep Mind. Como reportamos recentemente, as imagens geradas com as ferramentas da empresa são identificadas com marcas d’água SynthID. As marcas d’água SynthID são inseridas diretamente nos píxeis das imagens, o que as torna detectável para identificação, mas imperceptível ao olho humano.
Além do uso de SynthID, segundo o site da Deep Mind, Imagen 3 foi projetado com rotulagem e filtragem extensiva de dados para minimizar a probabilidade de saídas prejudiciais. O novo modelo também conta com as mais recentes tecnologias de privacidade do Google.
Veja onde encontrar o Imagen 3
O Imagen 3 está disponível em vários locais, incluindo o aplicativo Gemini, ImageFX e VertexIA. Para usar a ferramenta com o Gemini, simplesmente digite o prompt com a solicitação de imagem diretamente no espaço para solicitações.
Nos próximos meses, a empresa promete expandir os recursos populares de edição de imagens do Imagen 2 para o Imagen 3. Além disso, o Imagen 3 deve ser gradativamente implantado em todos os produtos do Google.