Prompt de edição de imagem no chatgpt para estilizar foto como desenho do studio ghibli

Entenda como o ChatGPT faz imagens no estilo do Studio Ghibli 6dh5q

Avatar de felipe faustino
Após grande atualização no ChatGPT, funcionalidade ou a permitir geração de imagens mais avançadas. Veja como isso funciona

Em meio a bombástica trend das fotos em estilo de anime, você deve ter se perguntado: como o ChatGPT faz imagens no estilo do Studio Ghibli? Ele não conseguia antes? Bem… acontece que a nova capacidade de imagens generativas da OpenAI é realmente nova e tem tudo a ver com uma grande mudança no funcionamento do modelo de inteligência artificial da empresa. Entenda, neste texto, como o ChatGPT conseguiu replicar a arte do Studio Ghibli e as principais diferenças em relação a outros modelos. 414id

Como o ChatGPT cria imagens no estilo Ghibli? 483q5o

Para entender como o ChatGPT ou a conseguir gerar imagens como as criadas na trend do Studio Ghibli, é necessário saber as principais mudanças trazidas pela OpenAI no modelo GPT-4o, leia a seguir.

O que mudou no modelo GPT-4o? 4c534e

Imagem: Reprodução/OpenAI

A geração de imagens no GPT-4o se baseia na arquitetura Transformer, que analisa padrões e associa descrições textuais a elementos visuais. Diferentemente dos “modelos de difusão”, que começam com uma imagem aleatória e a refinam progressivamente, o GPT-4o adota um método autorregressivo, construindo a imagem em etapas sequenciais, o que melhora a coerência visual e a fidelidade ao estilo desejado.

Como a melhora da precisão e na renderização de texto dentro das imagens e na capacidade de entender e seguir prompts detalhados, o ChatGPT aumentou sua capacidade de gerenciamento de número de objetos distintos em uma única cena (até 20, em comparação anteriormente, eram entre 5 e 8 objetos) e consegue manter as relações corretas entre eles.

Em comparação com modelos anteriores, como o DALL-E 3, que utilizavam pipelines (conjunto de etapas ou processos) separados para diferentes tipos de mídia, o GPT-4o adota uma abordagem unificada, permitindo respostas mais rápidas e imagens mais coerentes com os comandos textuais, eliminando a necessidade de múltiplos processos intermediários. Isso significa que o modelo pode interpretar melhor as nuances dos prompts fornecidos pelos usuários, garantindo que a saída visual esteja mais alinhada à intenção original.

Todo esse poder vem com um problema polêmico: com uma maior demanda de processamento gráfico pela explosão da moda na internet, a OpenAI precisou limitar por alguns dias a usabilidade da ferramenta, especialmente para usuários gratuitos do ChatGPT, porque suas GPUs estavam “derretendo”, segundo o CEO da empresa, Sam Altman. Apesar do transtorno, a geração de imagens avançadas já foi liberada pela empresa para usuários do plano gratuito, conforme anunciou o executivo.

Como a atualização possibilita imagens com estilo Ghibli? 2f3q1z

Imagem: Arquivo Pessoal/Bruno Martinez

Mas o que isso tudo significa na capacidade da IA em capturar a estética do Studio Ghibli? Acontece que, com a nova atualização, o GPT-4o a a compreender melhor os padrões de estilo, a partir de exemplos massivos de imagens, e aprende a replicar essas características com base nos comandos fornecidos pelo usuário.

Embora a OpenAI não tenha declarado explicitamente se seu conjunto de dados de treinamento incluiu obras de arte específicas do Studio Ghibli, como A Viagem de Chihiro ou O Menino e a Garça – caminhando em uma brecha que diferencia a reprodução de estilo de estúdios e de artistas vivos – a proficiência do modelo em replicar a estética do estúdio sugere fortemente que ele foi exposto a um número grande de exemplos dos filmes e estilos relacionados.

Por meio dessa exposição, o GPT-4o aprende as principais características visuais que definem o estilo do Studio Ghibli, incluindo: a sensação de animação desenhada à mão, lembrando, muitas vezes, a animação tradicional feita em papel; fundos que evocam uma sensação de maravilha e tranquilidade; personagens expressivos tipicamente apresentando olhos grandes e emotivos; uma paleta de cores suave e natural dominada por tons pastel e suaves; ambientes detalhados que frequentemente misturam elementos de fantasia com realismo

Além disso, o GPT-4o também pode processar imagens como entrada, permitindo que os usuários transformem visuais existentes ou os usem como base para gerar novo conteúdo. Dessa forma, além de não precisar dizer todos os detalhes sobre o estilo artístico que desejam reproduzir, os usuários também não precisam descrever a si ou a foto que querem recriar, bastando a inserção de uma foto no chat e pedir para que a IA a reproduza com o estilo da animação – como você pode ver na nossa matéria sobre como fazer imagens no estilo Ghibli com ChatGPT, com dicas de prompts.

Outras IAs conseguem reproduzir o estilo do Studio Ghibli? 423q

Criar novas imagens utilizando chatbots não é uma novidade recente, contudo, a capacidade alcançada pela atualização do ChatGPT em analisar e reproduzir os detalhes sugeridos pelo prompt recolocam a IA da OpenAI a frente dos seus principais concorrentes, como Gemini, do Google, Grok, da XAi e Copilot, da Microsoft, no quesito geração de imagens.

Veja a diferença entre uma mesma imagem transformada em desenho com traço inspirado no Studio Ghibli seguindo o mesmo prompt:

Crie uma imagem, inspirada nessa foto, com base no estilo do Studio Ghibli
Diferença entre a qualidade final fica clara, especialmente na geração de letras e símbolos – Imagem: Arquivo Pessoal/Felipe Faustino

Além de captar melhor os detalhes da imagem original, um dos maiores avanços das imagens generativas do GPT-4o fica evidente na capacidade de reproduzir a logomarca e as letras na camisa, grande dificuldade em outros modelos.

Enquanto o Grok consegue, de certa forma, recriar características do estilo do Studio Ghibli, ainda que sofra com o detalhamento da imagem, o Gemini vai completamente na contra-mão, resultando em uma arte genérica. Vale lembrar que o Google já investe em uma atualização das imagens generativas do Gemini, possibilitando criação de imagens complexas e edição de fotos – ferramentas que podem ser testadas através do AI Studio. O Copilot, da Microsoft, não conseguiu responder ao prompt.

Você já testou a ferramenta para entrar na trend do Studio Ghibli? Conta para a gente nos comentários.

Veja também

Texto revisado por Alexandre Marques em 01/04/2025.

Fontes: The Times of India, Hindustan Times, Economic Times

Deixe um comentário Cancelar resposta 264j2x
Posts Relacionados 6q1j5c

Monitores Odyssey 3D, Odyssey G9 e Odyssey OLED G8 chegam ao Brasil 6q2i6t

Fabricante traz para o país um novo monitor gamer 3D que dispensa óculos, junto com modelos com tecnologia QD-OLED 4K e Ultra Wide Dual QHD. Confira
Avatar de tiago rodrigues
Leia Mais

Galaxy S25 Edge chega ao Brasil por R$ 8.799. Veja preços e vantagens u1f20

Smartphone ultrafino tem 5,8 mm de espesssura, mesmo processador dos Galaxy S25, câmera principal de 200 MP e até 512 GB. Saiba tudo sobre ele
Avatar de bruno martinez
Leia Mais

GOOGLE I/O 2025: Veja todas as novidades de inteligência artificial anunciadas 1s25t

Empresa mostrou Modo AI nas Buscas, edição de vídeo com som no Veo 3 AI, Gemini Live para todos os Androids e parcerias com a Samsung para criar óculos inteligentes. Confira o resumo
Avatar de victor pacheco
Leia Mais