Prompt de edição de imagem no chatgpt para estilizar foto como desenho do studio ghibli

Entenda como o ChatGPT faz imagens no estilo do Studio Ghibli 5l34h

Avatar de felipe faustino
Após grande atualização no ChatGPT, funcionalidade ou a permitir geração de imagens mais avançadas. Veja como isso funciona

Em meio a bombástica trend das fotos em estilo de anime, você deve ter se perguntado: como o ChatGPT faz imagens no estilo do Studio Ghibli? Ele não conseguia antes? Bem… acontece que a nova capacidade de imagens generativas da OpenAI é realmente nova e tem tudo a ver com uma grande mudança no funcionamento do modelo de inteligência artificial da empresa. Entenda, neste texto, como o ChatGPT conseguiu replicar a arte do Studio Ghibli e as principais diferenças em relação a outros modelos. 3t363d

Como o ChatGPT cria imagens no estilo Ghibli? 1t6u58

Para entender como o ChatGPT ou a conseguir gerar imagens como as criadas na trend do Studio Ghibli, é necessário saber as principais mudanças trazidas pela OpenAI no modelo GPT-4o, leia a seguir.

O que mudou no modelo GPT-4o? 163u69

Imagem: Reprodução/OpenAI

A geração de imagens no GPT-4o se baseia na arquitetura Transformer, que analisa padrões e associa descrições textuais a elementos visuais. Diferentemente dos “modelos de difusão”, que começam com uma imagem aleatória e a refinam progressivamente, o GPT-4o adota um método autorregressivo, construindo a imagem em etapas sequenciais, o que melhora a coerência visual e a fidelidade ao estilo desejado.

Como a melhora da precisão e na renderização de texto dentro das imagens e na capacidade de entender e seguir prompts detalhados, o ChatGPT aumentou sua capacidade de gerenciamento de número de objetos distintos em uma única cena (até 20, em comparação anteriormente, eram entre 5 e 8 objetos) e consegue manter as relações corretas entre eles.

Em comparação com modelos anteriores, como o DALL-E 3, que utilizavam pipelines (conjunto de etapas ou processos) separados para diferentes tipos de mídia, o GPT-4o adota uma abordagem unificada, permitindo respostas mais rápidas e imagens mais coerentes com os comandos textuais, eliminando a necessidade de múltiplos processos intermediários. Isso significa que o modelo pode interpretar melhor as nuances dos prompts fornecidos pelos usuários, garantindo que a saída visual esteja mais alinhada à intenção original.

Todo esse poder vem com um problema polêmico: com uma maior demanda de processamento gráfico pela explosão da moda na internet, a OpenAI precisou limitar por alguns dias a usabilidade da ferramenta, especialmente para usuários gratuitos do ChatGPT, porque suas GPUs estavam “derretendo”, segundo o CEO da empresa, Sam Altman. Apesar do transtorno, a geração de imagens avançadas já foi liberada pela empresa para usuários do plano gratuito, conforme anunciou o executivo.

Como a atualização possibilita imagens com estilo Ghibli? 1x1ya

Imagem: Arquivo Pessoal/Bruno Martinez

Mas o que isso tudo significa na capacidade da IA em capturar a estética do Studio Ghibli? Acontece que, com a nova atualização, o GPT-4o a a compreender melhor os padrões de estilo, a partir de exemplos massivos de imagens, e aprende a replicar essas características com base nos comandos fornecidos pelo usuário.

Embora a OpenAI não tenha declarado explicitamente se seu conjunto de dados de treinamento incluiu obras de arte específicas do Studio Ghibli, como A Viagem de Chihiro ou O Menino e a Garça – caminhando em uma brecha que diferencia a reprodução de estilo de estúdios e de artistas vivos – a proficiência do modelo em replicar a estética do estúdio sugere fortemente que ele foi exposto a um número grande de exemplos dos filmes e estilos relacionados.

Por meio dessa exposição, o GPT-4o aprende as principais características visuais que definem o estilo do Studio Ghibli, incluindo: a sensação de animação desenhada à mão, lembrando, muitas vezes, a animação tradicional feita em papel; fundos que evocam uma sensação de maravilha e tranquilidade; personagens expressivos tipicamente apresentando olhos grandes e emotivos; uma paleta de cores suave e natural dominada por tons pastel e suaves; ambientes detalhados que frequentemente misturam elementos de fantasia com realismo

Além disso, o GPT-4o também pode processar imagens como entrada, permitindo que os usuários transformem visuais existentes ou os usem como base para gerar novo conteúdo. Dessa forma, além de não precisar dizer todos os detalhes sobre o estilo artístico que desejam reproduzir, os usuários também não precisam descrever a si ou a foto que querem recriar, bastando a inserção de uma foto no chat e pedir para que a IA a reproduza com o estilo da animação – como você pode ver na nossa matéria sobre como fazer imagens no estilo Ghibli com ChatGPT, com dicas de prompts.

Outras IAs conseguem reproduzir o estilo do Studio Ghibli? 201i5t

Criar novas imagens utilizando chatbots não é uma novidade recente, contudo, a capacidade alcançada pela atualização do ChatGPT em analisar e reproduzir os detalhes sugeridos pelo prompt recolocam a IA da OpenAI a frente dos seus principais concorrentes, como Gemini, do Google, Grok, da XAi e Copilot, da Microsoft, no quesito geração de imagens.

Veja a diferença entre uma mesma imagem transformada em desenho com traço inspirado no Studio Ghibli seguindo o mesmo prompt:

Crie uma imagem, inspirada nessa foto, com base no estilo do Studio Ghibli
Diferença entre a qualidade final fica clara, especialmente na geração de letras e símbolos – Imagem: Arquivo Pessoal/Felipe Faustino

Além de captar melhor os detalhes da imagem original, um dos maiores avanços das imagens generativas do GPT-4o fica evidente na capacidade de reproduzir a logomarca e as letras na camisa, grande dificuldade em outros modelos.

Enquanto o Grok consegue, de certa forma, recriar características do estilo do Studio Ghibli, ainda que sofra com o detalhamento da imagem, o Gemini vai completamente na contra-mão, resultando em uma arte genérica. Vale lembrar que o Google já investe em uma atualização das imagens generativas do Gemini, possibilitando criação de imagens complexas e edição de fotos – ferramentas que podem ser testadas através do AI Studio. O Copilot, da Microsoft, não conseguiu responder ao prompt.

Você já testou a ferramenta para entrar na trend do Studio Ghibli? Conta para a gente nos comentários.

Veja também

Texto revisado por Alexandre Marques em 01/04/2025.

Fontes: The Times of India, Hindustan Times, Economic Times

Deixe um comentário Cancelar resposta 3j4g1g
Posts Relacionados 6r1fc

Bespoke AI: Samsung mostra produtos de casa conectada no México 705d4i

Casa inteligente da Samsung na Cidade do México mostra como a vida pode ser mais prática com Inteligência Artificial e o ecossistema SmartThings. Veja todos os produtos
Avatar de bruno martinez
Leia Mais

Veja o que esperar do Galaxy Z Fold7 e Z Flip7 27505k

Novos dobráveis da Samsung chegarão em breve e devem ser mais leves, ter processador do ano e câmeras melhores, com até mesmo uma versão de baixo custo do Z Flip. Veja tudo o que sabemos.
Avatar de victor pacheco
Leia Mais

Compraria? Celular dobrável Honor Magic V3 chega ao Brasil por R$ 20 mil 294rl

Primeiro smartphone dobrável da Honor no país traz ficha técnica relativamente ultraada, mas preço mais alto que iPhone 16 Pro Max e Samsung Galaxy Z Fold 6.
Avatar de diego sousa
Leia Mais