Temos novas funcionalidades que começam a ser disponibilizadas, a partir de hoje, e que mostrámos durante a Google I/O. O nosso novo modelo de geração de imagens, Imagen 3, está agora disponível no Gemini, Gemini Advanced, Business e Enterprise.
Gere imagens de alta qualidade com o Imagen 3
Atualizámos as nossas capacidades criativas de geração de imagens e, ao longo dos próximos dias, iremos levar o nosso modelo de geração de imagens mais recente, o Imagen 3, às Aplicações Gemini e expandir a sua disponibilidade para utilizadores em todos os idiomas.
O Imagen 3 estabelece um novo padrão na qualidade de imagem, gerando imagens com apenas algumas palavras. Pode até pedir ao Gemini para criar imagens em vários estilos – como paisagens fotorrealistas, pinturas a óleo com textura ou cenas animadas (whimsical claymation).
O Imagen 3 traz funcionalidades avançadas de geração de imagens que vêm com proteções integradas e em consonância com os nossos princípios de design de produto. Numa vasta gama de benchmarks, o Imagen 3 tem um desempenho favorável em comparação com outros modelos de geração de imagens disponíveis. E tal como acontece com o Imagen 2, utilizamos o SynthID, a nossa ferramenta para assinalar com marcas de água as imagens geradas por IA.
Os nossos princípios de design são claros: do início ao fim, o utilizador mantém o controlo do processo criativo. Se a imagem inicial obtida não corresponder às expectativas, basta pedir ao Gemini o que gostaria de mudar e será gerada uma nova imagem.
Ao longo dos próximos dias, iremos também começar a disponibilizar a geração de imagens de pessoas, com uma versão de acesso prévio para os utilizadores Gemini Advanced, Business e Enterprise, a começar com o inglês. Trabalhámos para fazer melhorias técnicas no produto, bem como com conjuntos de avaliação melhorados, exercícios de red teaming e princípios de produto claros.
Com o Imagen 3, fizemos progressos significativos para proporcionar uma experiência de utilização melhor na geração de imagens de pessoas. Não apoiamos a geração de imagens fotorrealistas de indivíduos identificáveis, representações de menores ou cenas excessivamente sangrentas, violentas ou sexuais. É claro que nem todas as imagens que o Gemini cria serão perfeitas, mas iremos continuar a ouvir o feedback dos utilizadores com acesso prévio no Gemini Advanced à medida que continuamos a melhorar. Iremos implementá-lo gradualmente, com o objetivo de o levar a mais utilizadores e idiomas em breve.
Para estar entre os primeiros a experimentar estas novas funcionalidades, experimente hoje mesmo o Gemini Advanced ou inscreva-se no Gemini for Workspace.
Publicado por Dave Citron, Senior Director, Product Management, Gemini Experiences