A OpenAI lança nesta quarta-feira, 22, o ChatGPT Images 2.0, um ano após a apresentação de sua primeira versão. Neste, a empresa promete avanços qualitativos no acompanhamento de instruções detalhadas, posicionamento da imagem, relação precisa entre objetos, na renderização de textos densos e a possibilidade de gerar imagens em diferentes proporções. Há ainda uma versão Thinking, capaz de raciocinar.
A empresa diz que a nova versão do GPT Images oferece resultados menos “gerados por IA” por sua precisão. É capaz de seguir instruções, preservar detalhes solicitados, renderizar elementos minuciosos que geralmente confundem modelos de imagem, como textos pequenos, iconografia e elementos de interface, além de composições densas e restrições estilísticas sutis. A ideia é que, com um prompt simples, a ferramenta consiga produzir uma imagem utilizando inclusive “seu conhecimento expandido de mundo para preencher lacunas”.
ChatGPT Images 2.0 com Thinking
A nova versão do modelo para imagens possui um recurso chamado Thinking, que, segundo a OpenAI introduz pela primeira vez a capacidade de raciocínio. Neste caso, usuários com o ChatGPT Images 2.0 Thinking, ou seja, assinantes das versões GhatGPT Plus, Pro e Business, podem buscar informações em tempo real na web, criar múltiplas imagens distintas a partir de um único comando e revisar seus próprios resultados.
Com o raciocínio, o modelo assume o trabalho entre a ideia e a imagem. A OpenAI aposta que este modelo vai além da renderização e alcança o design estratégico.
A versão com Thinking também está disponível a partir desta quarta para os usuários no ChatGPT, Codex e na API.
Ao ativar o modo Thinking, o sistema trabalha de forma mais profunda, usa recursos de análise estrutural para executar o prompt com mais precisão.
O modo também pode gerar até oito imagens distintas de uma só vez, facilitando a criação de projetos, como uma sequência de uma história em quadrinhos ou conjunto de designs sem a necessidade de o usuário montar manualmente a sequência.

Imagem criada pelo ChatGPT Images 2.0. Crédito: divulgação
Estilos visuais aprimorados e proporções flexíveis
O ChatGPT Images 2.0 captura melhor características definidoras de fotografias — incluindo as pequenas imperfeições que adicionam realismo —, bem como cenas cinematográficas, pixel art, mangá e outras linguagens visuais distintas, com maior consistência em textura, iluminação e composição.
Outro ponto aprimorado é a proporção da imagem, que pode ser de 3:1 (ultra-wide) a 1:3 (vertical estreito). O modelo gera resultados para banners, slides de apresentação, telas de celular, marcadores de página e artes para redes sociais.
Vale dizer ainda que a novidade tem como data de corte de conhecimento dezembro de 2025.
Images 2.0 no Codex
A ferramenta integrada ao Codex permite a criação de ícones de interface, conceitos e protótipos, além de ser capaz de comparar opções rapidamente e transformar as melhores ideias em produtos reais ou sites.
Limitações
O ChatGPT Images 2.0 tem dificuldade em produzir algumas imagens que dependam de um modelo do mundo físico, como, por exemplo, um guia de origami, quebra-cabeças, cubo mágico e detalhes que precisam parecer corretamente em superfícies escondidas, anguladas ou invertidas. Detalhes densos ou repetitivos, como grãos de areia, também podem ser um desafio para o modelo, assim como rótulos e diagramas.




