Como eu utilizei agentes para melhorar meus prompts

Como eu utilizei agentes para melhorar meus prompts

Vinicius Bernardes

Mesmo com uma estrutura de prompt sólida, quando era necessário produzir para uma mesma marca diversas imagens com ângulos, iluminação e cenários diferentes, havia uma dificuldade em criar consistência entre elas. A criação de um agente para uma marca ou projeto específico possibilitou explorar composições mais criativas e sempre alinhadas com os mesmos direcionais fotográficos em questão.

1- Criação do agente

A melhor forma que encontrei de escrever as instruções foi deixar a descrição mais detalhada e literal possível das diretrizes, adicionando inclusive alguns exemplos para que ele possa ter como base para interpretar seu pedido. Não tenha receio de ser redundante ou repetitivo, isso facilita para o agente interpretar seu pedido e otimizar ao máximo seu prompt.

2- Prompts em inglês
Por hora, a grande maioria das IA’s respondem melhor em inglês do que português,então por isso sempre peço para o meu agente enviar o prompt nos dois idiomas. Porém, quando eu pedia apenas para que ele traduzisse algumas coisas acabavam perdendo o sentido original ou até mesmo nem faziam muito sentido. Então adicionei que precisava de uma tradução localizada, na qual ele adaptava o texto corretamente utilizando expressões adequadas de cada idioma.

 Exemplo: Se você pedir uma barba um pouco grisalha para um personagem, ele traduzirá para algo como “slightly graying beard”, e ele pode acabar entregando um resultado completamente (ou nada) grisalho. Mas se você localizar a tradução, ele irá usar “salt-and-pepper beard”: uma expressão utilizada em inglês para descrever perfeitamente o meio termo de um cabelo ou barba se tornando grisalho.

3- Atualize seu agente
Conforme fui utilizando, notei alguns comportamentos indesejados que se repetiam com frequência, e foi necessário um simples parágrafo a mais nas instruções para resolvê-los com tranquilidade.

Exemplo: Texto original que às vezes fazia o agente simplificar detalhes importantes de um prompt:
“Os prompts devem ser construídos respeitando o limite de mil caracteres.”

Texto revisado: “Os prompts devem ser construídos respeitando o limite de mil caracteres sem excluir ou alterar detalhes importantes descritos. O agente não deve criar o prompt mais resumido possível, ele deve somente se manter dentro do limite de caracteres descrito”

4- Referências
Buscando por referências, não me preocupei em encontrar aquelas que estavam completamente alinhadas às diretrizes do projeto, o agente é capaz de extrair somente os atributos solicitados de cada uma delas, me permitindo combinar diversas referências.

Exemplo: “Preciso que você combine somente os atributos que eu pedir de cada referência:
Imagem 1- Utilize o mesmo ângulo de câmera da primeira imagem anexada.
Imagem 2-  Utilize a mesma iluminação e tipo de cenário da segunda imagem anexada”

 

 

Imagem 1
Imagem 2
Resultado

5- Dê e peça feedbacks ao seu agente
Notei que eu tinha resultados mais consistentes se eu especificasse o que tinha gostado ou não ao invés de só apontar o erro ou fazer um novo pedido, já que muitas vezes ele acabava alterando algum elemento além do que sinalizei. Além disso, adicionei uma linha de texto para o agente me ajudar a entender melhor seu processo e também sinalizar pedidos incompatíveis que eu acabo fazendo quando estou empolgado com as referências.
Exemplo:  “ O agente sempre deve apontar e justificar as mudanças que ele fez no prompt com base no meu pedido.

 O agente deve sinalizar  e oferecer soluções sempre que um pedido não tiver sido claro o suficiente para ele tomar a melhor decisão ou apresentar algum tipo de incoerência própria ou com o que já foi pedido anteriormente. Exemplo: “O modelo utiliza boné azul e tênis branco. O plano deve ser fechado”

Isso faz com que mesmo que eu especifique o enquadramento (plano fechado), estou dando a descrição de dois elementos (o boné azul e o tênis branco) que dificilmente vão aparecer na mesma composição utilizando um plano fechado, fazendo com que a IA não siga corretamente as instruções do prompt”

Leia também: Como implementar um projeto com inteligência artificial para uma marca, segundo o Conselho de IA Oliver


O ferramenta é uma extensão da nossa criatividade
Por mais que seja tentador, sempre evito copiar e colar o prompt que o agente me fornece o principal motivo é porque, combinando com o feedback que você pediu a ele, você passa a entender melhor o funcionamento de uma IA e consegue pensar em novas soluções para o seu dia a dia, atualizações para seu agente e até aprender sobre termos técnicos de fotografia, por exemplo.

Combinar ferramentas têm sido um grande upgrade no meu processo criativo, mas ferramentas novas às vezes podem ser difíceis de dominar a ponto de integrar com outra. Por isso, estar sempre trocando todo tipo de conhecimento com meu time acelerou muito o processo de aprendizagem e aperfeiçoamento, seja adicionando novas instruções que funcionou muito bem pra alguém ou até conhecendo expressões mais assertivas para alcançar que nem mesmo a IA conseguiu chegar, afinal as soluções e o repertório da ferramenta ainda dependem da nossa criatividade e experiências humana. E vocês, que tipo de combinação têm feito por ai?