Riscos e desafios de segurança na engenharia de prompt

LLMs avançam rápido, mas a engenharia de prompt expõe riscos que já preocupam governos e empresas

Publicado:

Leitura 5 minutos

Imagem: Shutterstock
Imagem: Shutterstock

Os grandes modelos de linguagem (LLMs) transformaram-se rapidamente em pilares de inovação, apoiando setores que vão da educação ao judiciário, da saúde à administração pública. No entanto, junto ao entusiasmo pelo seu potencial, emerge uma preocupação inevitável: a segurança. O que antes parecia apenas um detalhe técnico hoje se revela como um dos principais desafios da era da inteligência artificial — e o ponto mais sensível dessa discussão está na forma como interagimos com esses sistemas por meio da engenharia de prompt.

Os prompts, que deveriam ser instruções neutras para guiar a IA, abriram espaço para um campo de vulnerabilidades ainda pouco explorado. O exemplo mais evidente é o chamado prompt injection, quando comandos maliciosos são inseridos de maneira camuflada em textos aparentemente inofensivos. O modelo, obediente por natureza, pode interpretar essas instruções ocultas e executar ações indesejadas, como ignorar restrições ou até mesmo revelar informações confidenciais. É um cavalo de Troia moderno, invisível e perigoso, que explora justamente a flexibilidade que torna os LLMs tão poderosos.

As melhores notícias de tecnologia B2B
Acompanhe todas as novidades diretamente na sua caixa de entrada

Outra ameaça crescente é o vazamento de dados sensíveis. Como esses modelos aprendem a partir de vastos conjuntos de informações, existe o risco de que fragmentos confidenciais fiquem armazenados e possam ser reproduzidos quando solicitados de maneira específica. Isso abre a possibilidade de que códigos proprietários, registros médicos ou até documentos governamentais venham à tona sem que o operador perceba. Em tempos em que a informação é o ativo mais valioso, esse tipo de vulnerabilidade transforma a IA em alvo prioritário de espionagem e ataques sofisticados.

Mas não paramos por aí. Técnicas conhecidas como jailbreaking buscam contornar os filtros de segurança dos modelos. A estratégia consiste em manipular o sistema para que ele adote identidades alternativas ou interprete regras de forma criativa, produzindo conteúdos que normalmente seriam bloqueados. Isso vai desde a geração de discursos proibidos até instruções detalhadas para crimes digitais, minando a confiança nos mecanismos de proteção implementados pelos provedores de IA.

Leia mais: Melhores práticas em cibersegurança na era da inteligência artificial

Mesmo quando não há má-fé, os modelos enfrentam outro problema grave: as chamadas alucinações. Trata-se da geração de informações falsas com aparência de veracidade. Em áreas críticas como saúde, direito ou finanças, uma resposta errada, mas convincente, pode ter consequências devastadoras. O cenário piora quando atores maliciosos exploram essa característica para desinformação em escala, afetando a credibilidade de instituições inteiras e manipulando percepções públicas.

Há ainda os ataques indiretos, nos quais o prompt não pede informações diretamente, mas induz o modelo a executar ações fora de seu escopo, como gerar links inseguros, manipular APIs ou até disparar comandos para sistemas conectados. Com a integração crescente dos LLMs a processos empresariais e governamentais, esse tipo de ameaça ganha um potencial destrutivo ainda maior.

O dilema que se coloca não é apenas técnico, mas ético e regulatório. Se um modelo de linguagem expõe dados por conta de um ataque de prompt injection, de quem é a responsabilidade? Do desenvolvedor que criou o sistema? Da empresa que o opera? Ou do usuário que inseriu o comando? Ainda não temos respostas claras, e essa ausência de governança aumenta a insegurança em torno do uso da IA.

A saída, como em toda história de cibersegurança, não virá de uma solução única, mas de uma combinação de estratégias. É preciso adotar segurança por design, incorporando barreiras desde a concepção dos modelos, e não como remendos posteriores. Auditorias constantes, filtragem de prompts, monitoramento de comportamento anômalo e limitação de acesso a dados críticos devem ser vistos como pilares de confiabilidade. Além disso, a capacitação de desenvolvedores e usuários precisa evoluir, formando uma cultura de responsabilidade em torno da inteligência artificial.

O paradoxo é inevitável: quanto mais criativos e adaptáveis se tornam os modelos de linguagem, mais vulneráveis eles ficam a manipulações. A engenharia de prompt, que nasceu como ferramenta para explorar o melhor da IA, é também o vetor que expõe suas fragilidades mais profundas. O futuro da inteligência artificial dependerá menos da sofisticação algorítmica e mais da capacidade de criar sistemas resilientes, capazes de resistir a usos indevidos.

A grande questão que se impõe é se estamos realmente preparados para tratar a engenharia de prompt como um campo de segurança crítica, ou se ainda a vemos apenas como uma técnica auxiliar para extrair melhores respostas da IA. A resposta a essa pergunta determinará se a inteligência artificial será um aliado confiável do progresso ou apenas mais uma superfície de ataque no cenário já complexo da cibersegurança global.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

Sobre o Autor

Fábio Correa Xavier é Diretor do Departamento de Tecnologia da Informação (CIO) do Tribunal de Contas do Estado de São Paulo, onde lidera projetos de inovação, transformação digital e cibersegurança. É também Professor e Coordenador de Graduação e Pós-Graduação em diversas instituições de ensino, além de Colunista do MIT Technology Review, onde escreve sobre temas relacionados à tecnologia e sociedade. Possui formação acadêmica sólida, com Mestrado em Ciência da Computação pela USP, MBA em Gestão de Negócios pelo IBMEC/RJ, Especialização Network Engineering pela JICA-Japão, Pós-graduação em Lei Geral de Proteção de Dados, Direito Público, Gestão Pública e Responsabilidade Fiscal e Projetos de Redes. Possui ainda certificações internacionais em privacidade e proteção de dados, como IAPP CIPM e CDPO/BR, EXIN Privacy and Data Protection e (ISC)² CC.

Com mais de 30 anos de experiência na área de tecnologia e segurança da informação, atuou em empresas de grande porte, do setor público e privado, sendo reconhecido por diversos prêmios e homenagens, como o Prêmio de Inovação Judiciário Exponencial, o Ranking 100 Empresas + Inovadoras no Uso de TI, o Prêmio Empresa +Digital, o Prêmio Security Leaders Case do Ano, entre outros. Além da sua atuação profissional e acadêmica, dedica-se a trabalhos voluntários como Secretário Executivo do Comitê Gestor de Tecnologia, Governança e Segurança da Informação dos Instituto Rui Barbosa – IRB e Membro do Conselho de Administração do Instituto do Câncer Dr. Arnaldo.

É autor dos livros “LGPD no setor público: boas práticas para os municípios brasileiros”, “LGPD no setor público: Boas práticas para a jornada de adequação”, “Roteadores Cisco: guia básico de configuração e operação”, “Tecnologias, Inovação e outros assuntos em análise” e “Cartilha de Governança em Proteção de Dados para Municípios”. Também é autor de capítulos em livros sobre a Lei Geral de Proteção de Dados Pessoais e os Tribunais de Contas Brasileiros.

Ver publicações deste autor

Colunas relacionadas