
Como eu utilizei agentes para melhorar meus prompts
Vinicius Bernardes
Mesmo com uma estrutura de prompt sólida, quando era necessário produzir para uma mesma marca diversas imagens com ângulos, iluminação e cenários diferentes, havia uma dificuldade em criar consistência entre elas. A criação de um agente para uma marca ou projeto específico possibilitou explorar composições mais criativas e sempre alinhadas com os mesmos direcionais fotográficos em questão.
1- Criação do agente
A melhor forma que encontrei de escrever as instruções foi deixar a descrição mais detalhada e literal possível das diretrizes, adicionando inclusive alguns exemplos para que ele possa ter como base para interpretar seu pedido. Não tenha receio de ser redundante ou repetitivo, isso facilita para o agente interpretar seu pedido e otimizar ao máximo seu prompt.
2- Prompts em inglês
Por hora, a grande maioria das IA’s respondem melhor em inglês do que português,então por isso sempre peço para o meu agente enviar o prompt nos dois idiomas. Porém, quando eu pedia apenas para que ele traduzisse algumas coisas acabavam perdendo o sentido original ou até mesmo nem faziam muito sentido. Então adicionei que precisava de uma tradução localizada, na qual ele adaptava o texto corretamente utilizando expressões adequadas de cada idioma.
Exemplo: Se você pedir uma barba um pouco grisalha para um personagem, ele traduzirá para algo como “slightly graying beard”, e ele pode acabar entregando um resultado completamente (ou nada) grisalho. Mas se você localizar a tradução, ele irá usar “salt-and-pepper beard”: uma expressão utilizada em inglês para descrever perfeitamente o meio termo de um cabelo ou barba se tornando grisalho.
3- Atualize seu agente
Conforme fui utilizando, notei alguns comportamentos indesejados que se repetiam com frequência, e foi necessário um simples parágrafo a mais nas instruções para resolvê-los com tranquilidade.
Exemplo: Texto original que às vezes fazia o agente simplificar detalhes importantes de um prompt:
“Os prompts devem ser construídos respeitando o limite de mil caracteres.”
Texto revisado: “Os prompts devem ser construídos respeitando o limite de mil caracteres sem excluir ou alterar detalhes importantes descritos. O agente não deve criar o prompt mais resumido possível, ele deve somente se manter dentro do limite de caracteres descrito”
4- Referências
Buscando por referências, não me preocupei em encontrar aquelas que estavam completamente alinhadas às diretrizes do projeto, o agente é capaz de extrair somente os atributos solicitados de cada uma delas, me permitindo combinar diversas referências.
Exemplo: “Preciso que você combine somente os atributos que eu pedir de cada referência:
Imagem 1- Utilize o mesmo ângulo de câmera da primeira imagem anexada.
Imagem 2- Utilize a mesma iluminação e tipo de cenário da segunda imagem anexada”



5- Dê e peça feedbacks ao seu agente
Notei que eu tinha resultados mais consistentes se eu especificasse o que tinha gostado ou não ao invés de só apontar o erro ou fazer um novo pedido, já que muitas vezes ele acabava alterando algum elemento além do que sinalizei. Além disso, adicionei uma linha de texto para o agente me ajudar a entender melhor seu processo e também sinalizar pedidos incompatíveis que eu acabo fazendo quando estou empolgado com as referências.
Exemplo: “ O agente sempre deve apontar e justificar as mudanças que ele fez no prompt com base no meu pedido.
O agente deve sinalizar e oferecer soluções sempre que um pedido não tiver sido claro o suficiente para ele tomar a melhor decisão ou apresentar algum tipo de incoerência própria ou com o que já foi pedido anteriormente. Exemplo: “O modelo utiliza boné azul e tênis branco. O plano deve ser fechado”
Isso faz com que mesmo que eu especifique o enquadramento (plano fechado), estou dando a descrição de dois elementos (o boné azul e o tênis branco) que dificilmente vão aparecer na mesma composição utilizando um plano fechado, fazendo com que a IA não siga corretamente as instruções do prompt”

Leia também: Como implementar um projeto com inteligência artificial para uma marca, segundo o Conselho de IA Oliver
O ferramenta é uma extensão da nossa criatividade
Por mais que seja tentador, sempre evito copiar e colar o prompt que o agente me fornece o principal motivo é porque, combinando com o feedback que você pediu a ele, você passa a entender melhor o funcionamento de uma IA e consegue pensar em novas soluções para o seu dia a dia, atualizações para seu agente e até aprender sobre termos técnicos de fotografia, por exemplo.
Combinar ferramentas têm sido um grande upgrade no meu processo criativo, mas ferramentas novas às vezes podem ser difíceis de dominar a ponto de integrar com outra. Por isso, estar sempre trocando todo tipo de conhecimento com meu time acelerou muito o processo de aprendizagem e aperfeiçoamento, seja adicionando novas instruções que funcionou muito bem pra alguém ou até conhecendo expressões mais assertivas para alcançar que nem mesmo a IA conseguiu chegar, afinal as soluções e o repertório da ferramenta ainda dependem da nossa criatividade e experiências humana. E vocês, que tipo de combinação têm feito por ai?
