Índice 3p6a5k
Em meio a bombástica trend das fotos em estilo de anime, você deve ter se perguntado: como o ChatGPT faz imagens no estilo do Studio Ghibli? Ele não conseguia antes? Bem… acontece que a nova capacidade de imagens generativas da OpenAI é realmente nova e tem tudo a ver com uma grande mudança no funcionamento do modelo de inteligência artificial da empresa. Entenda, neste texto, como o ChatGPT conseguiu replicar a arte do Studio Ghibli e as principais diferenças em relação a outros modelos. 414id
Como o ChatGPT cria imagens no estilo Ghibli? 483q5o
Para entender como o ChatGPT ou a conseguir gerar imagens como as criadas na trend do Studio Ghibli, é necessário saber as principais mudanças trazidas pela OpenAI no modelo GPT-4o, leia a seguir.
O que mudou no modelo GPT-4o? 4c534e

A geração de imagens no GPT-4o se baseia na arquitetura Transformer, que analisa padrões e associa descrições textuais a elementos visuais. Diferentemente dos “modelos de difusão”, que começam com uma imagem aleatória e a refinam progressivamente, o GPT-4o adota um método autorregressivo, construindo a imagem em etapas sequenciais, o que melhora a coerência visual e a fidelidade ao estilo desejado.
Como a melhora da precisão e na renderização de texto dentro das imagens e na capacidade de entender e seguir prompts detalhados, o ChatGPT aumentou sua capacidade de gerenciamento de número de objetos distintos em uma única cena (até 20, em comparação anteriormente, eram entre 5 e 8 objetos) e consegue manter as relações corretas entre eles.
Em comparação com modelos anteriores, como o DALL-E 3, que utilizavam pipelines (conjunto de etapas ou processos) separados para diferentes tipos de mídia, o GPT-4o adota uma abordagem unificada, permitindo respostas mais rápidas e imagens mais coerentes com os comandos textuais, eliminando a necessidade de múltiplos processos intermediários. Isso significa que o modelo pode interpretar melhor as nuances dos prompts fornecidos pelos usuários, garantindo que a saída visual esteja mais alinhada à intenção original.
Todo esse poder vem com um problema polêmico: com uma maior demanda de processamento gráfico pela explosão da moda na internet, a OpenAI precisou limitar por alguns dias a usabilidade da ferramenta, especialmente para usuários gratuitos do ChatGPT, porque suas GPUs estavam “derretendo”, segundo o CEO da empresa, Sam Altman. Apesar do transtorno, a geração de imagens avançadas já foi liberada pela empresa para usuários do plano gratuito, conforme anunciou o executivo.
Como a atualização possibilita imagens com estilo Ghibli? 2f3q1z

Mas o que isso tudo significa na capacidade da IA em capturar a estética do Studio Ghibli? Acontece que, com a nova atualização, o GPT-4o a a compreender melhor os padrões de estilo, a partir de exemplos massivos de imagens, e aprende a replicar essas características com base nos comandos fornecidos pelo usuário.
Embora a OpenAI não tenha declarado explicitamente se seu conjunto de dados de treinamento incluiu obras de arte específicas do Studio Ghibli, como A Viagem de Chihiro ou O Menino e a Garça – caminhando em uma brecha que diferencia a reprodução de estilo de estúdios e de artistas vivos – a proficiência do modelo em replicar a estética do estúdio sugere fortemente que ele foi exposto a um número grande de exemplos dos filmes e estilos relacionados.
Por meio dessa exposição, o GPT-4o aprende as principais características visuais que definem o estilo do Studio Ghibli, incluindo: a sensação de animação desenhada à mão, lembrando, muitas vezes, a animação tradicional feita em papel; fundos que evocam uma sensação de maravilha e tranquilidade; personagens expressivos tipicamente apresentando olhos grandes e emotivos; uma paleta de cores suave e natural dominada por tons pastel e suaves; ambientes detalhados que frequentemente misturam elementos de fantasia com realismo
Além disso, o GPT-4o também pode processar imagens como entrada, permitindo que os usuários transformem visuais existentes ou os usem como base para gerar novo conteúdo. Dessa forma, além de não precisar dizer todos os detalhes sobre o estilo artístico que desejam reproduzir, os usuários também não precisam descrever a si ou a foto que querem recriar, bastando a inserção de uma foto no chat e pedir para que a IA a reproduza com o estilo da animação – como você pode ver na nossa matéria sobre como fazer imagens no estilo Ghibli com ChatGPT, com dicas de prompts.
Outras IAs conseguem reproduzir o estilo do Studio Ghibli? 423q
Criar novas imagens utilizando chatbots não é uma novidade recente, contudo, a capacidade alcançada pela atualização do ChatGPT em analisar e reproduzir os detalhes sugeridos pelo prompt recolocam a IA da OpenAI a frente dos seus principais concorrentes, como Gemini, do Google, Grok, da XAi e Copilot, da Microsoft, no quesito geração de imagens.
Veja a diferença entre uma mesma imagem transformada em desenho com traço inspirado no Studio Ghibli seguindo o mesmo prompt:
Crie uma imagem, inspirada nessa foto, com base no estilo do Studio Ghibli

Além de captar melhor os detalhes da imagem original, um dos maiores avanços das imagens generativas do GPT-4o fica evidente na capacidade de reproduzir a logomarca e as letras na camisa, grande dificuldade em outros modelos.
Enquanto o Grok consegue, de certa forma, recriar características do estilo do Studio Ghibli, ainda que sofra com o detalhamento da imagem, o Gemini vai completamente na contra-mão, resultando em uma arte genérica. Vale lembrar que o Google já investe em uma atualização das imagens generativas do Gemini, possibilitando criação de imagens complexas e edição de fotos – ferramentas que podem ser testadas através do AI Studio. O Copilot, da Microsoft, não conseguiu responder ao prompt.
Você já testou a ferramenta para entrar na trend do Studio Ghibli? Conta para a gente nos comentários.
Veja também
Texto revisado por Alexandre Marques em 01/04/2025.
Fontes: The Times of India, Hindustan Times, Economic Times