Este projeto é uma aplicação desktop em Python para anonimização e revelação de dados sensíveis em textos, arquivos PDF e Word. Desenvolvido para facilitar a proteção de informações pessoais e sigilosas, especialmente em documentos oficiais.
- Anonimização de Dados: Substitui CPFs, CNPJs, nomes, telefones, endereços, apelidos comerciais e outros dados sensíveis por tokens criptografados.
- Revelação de Dados: Restaura o texto original a partir do texto anonimizado e do arquivo de mapa JSON gerado.
- Suporte a múltiplos formatos: Aceita arquivos .txt, .pdf e .docx.
- Interface gráfica amigável: Desenvolvida com Tkinter, com abas para Início, Anonimizar, Revelar e Sobre.
- Uso de NLP: Utiliza spaCy (modelo pt_core_news_sm) para identificar entidades nomeadas (pessoas, organizações, locais, etc).
- Navegue pelas abas:
- Início: Tela de boas-vindas.
- NotebookLm: Utilizar para o envio do prompt padrão e apresentar a contextualização para anexar os arquivos já criptografados.
- Anonimizar: Carregue ou cole o texto, clique em "Anonimizar Texto" e salve o texto anonimizado e o mapa JSON.
- Revelar: Carregue o texto anonimizado e o mapa JSON correspondente para restaurar o texto original.
- Sobre: Manual de uso e informações dos autores.
- Carregue um arquivo ou cole o texto na aba "Anonimizar".
- Clique em "Anonimizar Texto".
- Salve o texto anonimizado e o mapa JSON.
- Para reverter, vá na aba "Revelar", carregue o texto anonimizado e o mapa JSON, e clique em "Revelar Texto Original".
- O mapa JSON é indispensável para reverter a anonimização.
- Não utilize para fins ilícitos ou sem autorização.
- Matheus Brazão (matheus.paixao@antt.gov.br)
- Pedro Cavalcante (pedro.cavalcante@antt.gov.br)
2.1.4 - Ago/2025
Ferramenta desenvolvida para uso institucional ANTT/GEAUT/COAUT. Consulte os autores para mais informações.