VEJA-TAMBÉM Mais Lidas i216c

Odyssey 3d é o novo monitor da samsung

Monitores Odyssey 3D, Odyssey G9 e Odyssey OLED G8 chegam ao Brasil 6q2i6t

22 de maio de 2025

Air fryer philco com grande capacidade ideal para famílias

Air Fryer Philco PAF16A 16L: Vale a pena investir na fritadeira 4 em 1? 2e5q2r

21 de maio de 2025

44 visualizações

5 apps para encontrar pontos de carregamento de carro elétrico no brasil

5 apps para encontrar pontos de carregamento de carro elétrico no Brasil 5e334f

21 de maio de 2025

57 visualizações

EM ALTA Tags 6f1g6f

Prompt de edição de imagem no chatgpt para estilizar foto como desenho do studio ghibli

4 minutos de leitura

Entenda como o ChatGPT faz imagens no estilo do Studio Ghibli 6dh5q

Felipe Faustino

1 de abril de 2025

Após grande atualização no ChatGPT, funcionalidade ou a permitir geração de imagens mais avançadas. Veja como isso funciona

Índice 3p6a5k

Em meio a bombástica trend das fotos em estilo de anime, você deve ter se perguntado: como o ChatGPT faz imagens no estilo do Studio Ghibli? Ele não conseguia antes? Bem… acontece que a nova capacidade de imagens generativas da OpenAI é realmente nova e tem tudo a ver com uma grande mudança no funcionamento do modelo de inteligência artificial da empresa. Entenda, neste texto, como o ChatGPT conseguiu replicar a arte do Studio Ghibli e as principais diferenças em relação a outros modelos. 414id

Como o ChatGPT cria imagens no estilo Ghibli? 483q5o

Para entender como o ChatGPT ou a conseguir gerar imagens como as criadas na trend do Studio Ghibli, é necessário saber as principais mudanças trazidas pela OpenAI no modelo GPT-4o, leia a seguir.

O que mudou no modelo GPT-4o? 4c534e

Imagem: Reprodução/OpenAI

A geração de imagens no GPT-4o se baseia na arquitetura Transformer, que analisa padrões e associa descrições textuais a elementos visuais. Diferentemente dos “modelos de difusão”, que começam com uma imagem aleatória e a refinam progressivamente, o GPT-4o adota um método autorregressivo, construindo a imagem em etapas sequenciais, o que melhora a coerência visual e a fidelidade ao estilo desejado.

Como a melhora da precisão e na renderização de texto dentro das imagens e na capacidade de entender e seguir prompts detalhados, o ChatGPT aumentou sua capacidade de gerenciamento de número de objetos distintos em uma única cena (até 20, em comparação anteriormente, eram entre 5 e 8 objetos) e consegue manter as relações corretas entre eles.

Em comparação com modelos anteriores, como o DALL-E 3, que utilizavam pipelines (conjunto de etapas ou processos) separados para diferentes tipos de mídia, o GPT-4o adota uma abordagem unificada, permitindo respostas mais rápidas e imagens mais coerentes com os comandos textuais, eliminando a necessidade de múltiplos processos intermediários. Isso significa que o modelo pode interpretar melhor as nuances dos prompts fornecidos pelos usuários, garantindo que a saída visual esteja mais alinhada à intenção original.

Todo esse poder vem com um problema polêmico: com uma maior demanda de processamento gráfico pela explosão da moda na internet, a OpenAI precisou limitar por alguns dias a usabilidade da ferramenta, especialmente para usuários gratuitos do ChatGPT, porque suas GPUs estavam “derretendo”, segundo o CEO da empresa, Sam Altman. Apesar do transtorno, a geração de imagens avançadas já foi liberada pela empresa para usuários do plano gratuito, conforme anunciou o executivo.

chatgpt image gen now rolled out to all free s!
— Sam Altman (@sama) April 1, 2025

Como a atualização possibilita imagens com estilo Ghibli? 2f3q1z

Imagem: Arquivo Pessoal/Bruno Martinez

Mas o que isso tudo significa na capacidade da IA em capturar a estética do Studio Ghibli? Acontece que, com a nova atualização, o GPT-4o a a compreender melhor os padrões de estilo, a partir de exemplos massivos de imagens, e aprende a replicar essas características com base nos comandos fornecidos pelo usuário.

Embora a OpenAI não tenha declarado explicitamente se seu conjunto de dados de treinamento incluiu obras de arte específicas do Studio Ghibli, como A Viagem de Chihiro ou O Menino e a Garça – caminhando em uma brecha que diferencia a reprodução de estilo de estúdios e de artistas vivos – a proficiência do modelo em replicar a estética do estúdio sugere fortemente que ele foi exposto a um número grande de exemplos dos filmes e estilos relacionados.

Por meio dessa exposição, o GPT-4o aprende as principais características visuais que definem o estilo do Studio Ghibli, incluindo: a sensação de animação desenhada à mão, lembrando, muitas vezes, a animação tradicional feita em papel; fundos que evocam uma sensação de maravilha e tranquilidade; personagens expressivos tipicamente apresentando olhos grandes e emotivos; uma paleta de cores suave e natural dominada por tons pastel e suaves; ambientes detalhados que frequentemente misturam elementos de fantasia com realismo

Além disso, o GPT-4o também pode processar imagens como entrada, permitindo que os usuários transformem visuais existentes ou os usem como base para gerar novo conteúdo. Dessa forma, além de não precisar dizer todos os detalhes sobre o estilo artístico que desejam reproduzir, os usuários também não precisam descrever a si ou a foto que querem recriar, bastando a inserção de uma foto no chat e pedir para que a IA a reproduza com o estilo da animação – como você pode ver na nossa matéria sobre como fazer imagens no estilo Ghibli com ChatGPT, com dicas de prompts.

Outras IAs conseguem reproduzir o estilo do Studio Ghibli? 423q

Criar novas imagens utilizando chatbots não é uma novidade recente, contudo, a capacidade alcançada pela atualização do ChatGPT em analisar e reproduzir os detalhes sugeridos pelo prompt recolocam a IA da OpenAI a frente dos seus principais concorrentes, como Gemini, do Google, Grok, da XAi e Copilot, da Microsoft, no quesito geração de imagens.

Veja a diferença entre uma mesma imagem transformada em desenho com traço inspirado no Studio Ghibli seguindo o mesmo prompt:

Crie uma imagem, inspirada nessa foto, com base no estilo do Studio Ghibli

Diferença entre a qualidade final fica clara, especialmente na geração de letras e símbolos – Imagem: Arquivo Pessoal/Felipe Faustino

Além de captar melhor os detalhes da imagem original, um dos maiores avanços das imagens generativas do GPT-4o fica evidente na capacidade de reproduzir a logomarca e as letras na camisa, grande dificuldade em outros modelos.

Enquanto o Grok consegue, de certa forma, recriar características do estilo do Studio Ghibli, ainda que sofra com o detalhamento da imagem, o Gemini vai completamente na contra-mão, resultando em uma arte genérica. Vale lembrar que o Google já investe em uma atualização das imagens generativas do Gemini, possibilitando criação de imagens complexas e edição de fotos – ferramentas que podem ser testadas através do AI Studio. O Copilot, da Microsoft, não conseguiu responder ao prompt.

Você já testou a ferramenta para entrar na trend do Studio Ghibli? Conta para a gente nos comentários.

Veja também

Veja como fazer fotos no estilo do Studio Ghibli com o ChatGPT

OpenAI lança GPT-4.5 com melhorias em escrita e menores alucinações

Texto revisado por Alexandre Marques em 01/04/2025.

Fontes: The Times of India, Hindustan Times, Economic Times

Deixe um comentário Cancelar resposta 264j2x

Você precisa fazer o para publicar um comentário.

Tendências da semana: 322m2g

Notícias

Eletrônicos
Galaxy S25 Edge é lançado pela Samsung. Entenda o que vem com ele rz5i
Tutoriais

Aplicativos
Como criar prompts: guia completo te ensina a falar com IAs 3i4p53
Notícias
Motorola Razr 60 Ultra, Razr 60 e Edge 60 começam a ser vendidos no Brasil; veja os preços 2j3w73
Cultura

Listas
Veja os lançamentos do Globoplay em maio de 2025 j106i
Notícias

Eletrônicos
GOOGLE I/O 2025: Veja todas as novidades de inteligência artificial anunciadas 1s25t

Posts Relacionados 6q1j5c

Monitores odyssey 3d, odyssey g9 e odyssey oled g8 chegam ao brasil

6 min

Monitores Odyssey 3D, Odyssey G9 e Odyssey OLED G8 chegam ao Brasil 6q2i6t

Fabricante traz para o país um novo monitor gamer 3D que dispensa óculos, junto com modelos com tecnologia QD-OLED 4K e Ultra Wide Dual QHD. Confira

Tiago Rodrigues

22 de maio de 2025

Leia Mais

Galaxy s25 edge chega ao brasil por r$ 8. 799. Veja preços e vantagens

194

5 min

Galaxy S25 Edge chega ao Brasil por R$ 8.799. Veja preços e vantagens u1f20

Smartphone ultrafino tem 5,8 mm de espesssura, mesmo processador dos Galaxy S25, câmera principal de 200 MP e até 512 GB. Saiba tudo sobre ele

Bruno Martinez

22 de maio de 2025

Leia Mais

Google i/o 2025: veja todas as novidades de inteligência artificial anunciadas

368

7 min

GOOGLE I/O 2025: Veja todas as novidades de inteligência artificial anunciadas 1s25t

Empresa mostrou Modo AI nas Buscas, edição de vídeo com som no Veo 3 AI, Gemini Live para todos os Androids e parcerias com a Samsung para criar óculos inteligentes. Confira o resumo

Victor Pacheco

22 de maio de 2025

Leia Mais