Testes de Imagens em Ferramentas de Inteligência Artificial

Novos testes de geração de imagens nas ferramentas de IA: ChatGPT, Microsoft Copilot, Google Gemini e MidJourney.

Na semana passada, compartilhei um vídeo mostrando que agora é possível criar imagens usando o ChatGPT, mesmo na versão gratuita, com um limite de até duas imagens por dia. Para ilustrar o potencial dessa ferramenta, realizei um teste comparativo com o Microsoft Copilot, a inteligência artificial da Microsoft. Os resultados me surpreenderam, e decidi refinar o prompt para uma nova rodada de testes, envolvendo quatro plataformas diferentes: ChatGPT, Microsoft Copilot, Google Gemini e MidJourney. A ideia é comparar qual delas oferece o melhor resultado na criação de imagens.

Assista o vídeo e veja os resultados das imagens geradas pelas ferramentas de IA.

O Prompt de Teste

O prompt utilizado foi bem detalhado para garantir que as inteligências artificiais compreendessem as especificações:

  • Pai: 63 anos, cabelos grisalhos, olhos castanhos, camisa azul, calça jeans preta, altura de 1,80m, com um ar jovial.
  • Filho: 20 anos, cabelo comprido, olhos castanhos, altura de 1,93m, estilo roqueiro, vestindo camisa xadrez preta.
  • Cenário: Ambos conversando e sentados em cadeiras em um deck de madeira ao ar livre, em um dia de inverno ensolarado, com vegetação ao fundo.

Com essas informações, testei cada uma das plataformas.

ChatGPT

Comecei pelo ChatGPT. Apesar de demorar um pouco para gerar as imagens, fiquei satisfeito com o resultado. Comparado ao teste anterior, notei uma melhoria significativa nos detalhes, especialmente nas mãos dos personagens, que antes apresentavam problemas. Dessa vez, as mãos foram renderizadas e ficaram melhores, porém ainda com alguns problemas (no vídeo acima eu mostrei os detalhes). Mas isso mostra uma evolução na capacidade da ferramenta de interpretar e gerar imagens fiéis ao prompt.

Microsoft Copilot

Ao testar o Microsoft Copilot, notei que ele gerou quatro imagens de uma vez, o que é um ponto positivo. No entanto, a interpretação do prompt deixou a desejar em alguns aspectos. As imagens, por exemplo, não representavam um filho de 20 anos como solicitado. Em outra imagem, o pai aparentava ser muito mais jovem do que os 63 anos descritos. O Copilot ainda produziu imagens de qualidade, mas falhou na compreensão de detalhes importantes como idade e estilo dos personagens.

Google Gemini

Em seguida, testei o Google Gemini, mas enfrentei um contratempo. O Gemini, que antes permitia a criação de imagens, por mais simples que fossem, agora não tem mais a capacidade de gerar imagens. Recebi uma mensagem informando que a criação de imagens ainda não está disponível na versão gratuita do Gemini, sendo uma funcionalidade prevista apenas para a versão paga no futuro.

MidJourney

Por fim, tentei utilizar o MidJourney, que é amplamente reconhecido por sua qualidade na criação de imagens. No entanto, fui surpreendido ao descobrir que o MidJourney não oferece mais uma versão gratuita. Para utilizar o serviço, é necessário assinar um plano pago, o que pode ser um obstáculo para quem deseja apenas testar a ferramenta.

Conclusão

Esses testes demonstram que as inteligências artificiais para criação de imagens ainda estão em constante evolução e apresentam diferentes capacidades e limitações. Enquanto o ChatGPT mostrou uma melhoria, o Microsoft Copilot ainda tem espaço para aprimorar a interpretação de prompts complexos. O Google Gemini, por sua vez, está em uma fase de transição, e o MidJourney, embora poderoso, agora exige um investimento financeiro para ser utilizado.

A evolução dessas ferramentas é constante, e vou continuar explorando suas capacidades. Se você conhece alguma outra ferramenta gratuita interessante, deixe seu comentário! Quem sabe não faço um novo teste com ela?

Vale lembrar que, com o tempo, é provável que essas ferramentas melhorem e ofereçam mais recursos. No entanto, acredito que a tendência é que o acesso a recursos avançados seja cada vez mais restrito a planos pagos.

Leia também