A Google oferece novas funcionalidades `Imagen 3`no Gemini, Gemini Advanced, Business e Enterprise

por Nuno Patrício - RTP

A Google disponibiliza, a partir de hoje, novas funcionalidades mostradas durante a Google I/O. O rollout do novo modelo de geração de imagens, Imagen 3 vai passar a estar disponível no Gemini, Gemini Advanced, Business e Enterprise.

A Google disponibiliza, a partir de hoje, novas funcionalidades mostradas durante a Google I/O. O rollout do novo modelo de geração de imagens, Imagen 3 vai passar a estar disponível no Gemini, Gemini Advanced, Business e Enterprise. 

A Google atualizou as capacidades criativas de geração de imagens e, ao longo dos próximos dias, irá levar o modelo de geração de imagens mais recente, o Imagen 3, às Aplicações Gemini e expandir a sua disponibilidade para utilizadores em todos os idiomas.


Exemplo das imagens geradas utilizando prompts – os resultados podem variar.
 - Uma imagem animada de um pequeno dragão a sair de um ovo, num prado iluminado pelo sol, rodeado por borboletas brilhantes curiosas. Cores vibrantes, escalas detalhadas.
- Uma imagem fotorrealista de uma vista de montanha deslumbrante com picos irregulares e cumes cobertos de neve, banhada pelo brilho quente do pôr do sol. Nuvens dramáticas, pintadas em tons vibrantes de laranja, rosa e roxo, cruzam o céu, projetando sombras longas na paisagem acidentada.
 - Imagem de um vestido de baile feito de guardanapos de papel num showroom elegante.

 - Uma pintura abstrata vibrante com as palavras "Dream Big" espalhadas na tela e em cores fortes.

O Imagen 3 estabelece um novo padrão na qualidade de imagem, gerando imagens com apenas algumas palavras. Pode até pedir ao Gemini para criar imagens em vários estilos – como paisagens fotorrealistas, pinturas a óleo com textura ou cenas animadas (whimsical claymation).


Legenda: Imagen 2 vs. Imagen 3

O Imagen 3 traz funcionalidades avançadas de geração de imagens que vêm com proteções integradas e em consonância com os princípios de design de produto. Numa vasta gama de benchmarks, o Imagen 3 tem um desempenho favorável em comparação com outros modelos de geração de imagens disponíveis. E tal como acontece com o Imagen 2, utilizamos o SynthID, a ferramenta digital da Google para assinalar com marcas de água as imagens geradas por IA.

Os princípios de design são claros: do início ao fim, o utilizador mantém o controlo do processo criativo. Se a imagem inicial obtida não corresponder às expectativas, basta pedir ao Gemini o que gostaria de mudar e será gerada uma nova imagem.

Ao longo dos próximos dias, a o sistema Gemini da Google  irá também disponibilizar a geração de imagens de pessoas, com uma versão de acesso prévio para os utilizadores Gemini Advanced, Business e Enterprise, a começar com o inglês. Trabalhámos para fazer melhorias técnicas no produto, bem como com conjuntos de avaliação melhorados, exercícios de red teaming e princípios de produto claros.

A google diz não apoiar  a geração de imagens fotorrealistas de indivíduos identificáveis, representações de menores ou cenas excessivamente sangrentas, violentas ou sexuais. 

"É claro que nem todas as imagens que o Gemini cria serão perfeitas, mas iremos continuar a ouvir o feedback dos utilizadores com acesso prévio no Gemini Advanced à medida que continuamos a melhorar. Iremos implementá-lo gradualmente, com o objetivo de o levar a mais utilizadores e idiomas em breve", refere a multinacional americana.

Para estar entre os primeiros a experimentar estas novas funcionalidades, experimente hoje mesmo o Gemini Advanced ou inscreva-se no Gemini for Workspace.
Tópicos
PUB