nx-botton
blog nexoria (1)

O DLP tradicional e o ponto cego da IA generativa

O mercado de cibersegurança busca analogias com o que já conhece para criar referência e acelerar a compreensão, tanto para quem vende quanto para quem compra uma nova tecnologia.

Com as soluções de proteção e governança de IA generativa, esse movimento também está acontecendo. Ferramentas como o Prompt Security, da SentinelOne, e o Harmony Workforce AI, da Check Point, que inspecionam em tempo real os prompts e arquivos enviados para modelos de linguagem, são frequentemente apresentadas ao mercado como o “DLP para IA”. A analogia é útil como ponto de entrada, mas carrega um risco: reduzir a compreensão dessas soluções ao que o DLP tradicional já faz, obscurecendo o que elas têm de genuinamente diferente e por que essa diferença importa.

O DLP foi concebido para proteger dados corporativos em um ambiente onde os vetores de saída eram previsíveis: e-mail, dispositivos USB, uploads para armazenamento em nuvem e impressão. A arquitetura dessas soluções foi desenhada para inspecionar esses fluxos, identificar padrões sensíveis por meio de expressões regulares e fingerprinting de arquivos, e bloquear o que não deveria sair. Esse modelo funcionou bem enquanto o perímetro era estável e o comportamento dos usuários era previsível.

A IA generativa introduziu um vetor de saída que não se encaixa nessa lógica. Quando um colaborador acessa o ChatGPT, o Gemini ou qualquer ferramenta similar pelo navegador e cola um trecho de contrato, dados de clientes ou código-fonte proprietário em um prompt, ele gera uma requisição HTTPS para um servidor externo com tráfego criptografado. O DLP tradicional pode identificar que houve comunicação com aquele destino, mas não consegue inspecionar o conteúdo enviado. A limitação é técnica e conceitual: a solução não foi projetada para avaliar o significado semântico de uma conversa com um modelo de linguagem.

O DLP nativo para IA resolve esse problema por meio de dois componentes distintos. O primeiro é uma extensão instalada no navegador corporativo, que monitora em tempo real o conteúdo que o usuário digita nas interfaces de LLM, inspecionando os prompts antes que sejam transmitidos para o modelo de destino. O segundo é um agente instalado na máquina do usuário, que estende essa cobertura para as interações que ocorrem fora do navegador, por meio de aplicativos instalados localmente como IDEs com assistentes de código integrados e clientes desktop de modelos de linguagem.

Esses aplicativos frequentemente não passam pelo proxy corporativo, tornando o tráfego completamente opaco para a infraestrutura de segurança tradicional. O agente no endpoint resolve esse gap monitorando as interações diretamente na máquina, independentemente de como o tráfego é roteado na rede.

Essa arquitetura de dois componentes é o que diferencia estruturalmente o DLP para IA do DLP tradicional no que diz respeito à implantação. Mas a diferença mais relevante está na camada semântica. O DLP tradicional reconhece padrões fixos: um CPF, um número de cartão, uma sequência conhecida. O DLP para IA utiliza classificação semântica para entender o contexto do que está sendo compartilhado, identificando dados sensíveis mesmo quando fragmentados, parafraseados ou descritos em linguagem natural. É essa capacidade que fecha o gap que o regex nunca conseguiu endereçar.

Além da detecção e do bloqueio, essas soluções entregam algo que o DLP tradicional nunca ofereceu nesse contexto: visibilidade sobre quais ferramentas de IA estão sendo usadas na organização, por quais times e com qual frequência.

Essa informação é o ponto de partida para qualquer política de governança de IA baseada em evidências. A maioria das empresas simplesmente não sabe hoje quais LLMs seus colaboradores acessam no dia a dia.

Dentro de uma estratégia de governança de IA, essa camada responde a perguntas que os conselhos e as áreas jurídicas já estão fazendo: como garantir que a adoção de IA pelos times não comprometa a conformidade com a LGPD, os acordos de confidencialidade com clientes e parceiros, e a proteção da propriedade intelectual da empresa.

A proteção efetiva não passa por bloquear o uso de IA generativa. Passa por criar visibilidade e controle sobre cada vetor por onde os dados podem sair, incluindo os que o DLP tradicional nunca foi capaz de enxergar.

Publicações recentes