anonymizer - Anonymisierung / Pseudonymisierung von Texten

09 Oktober, 2019

In vielen Situationen ist eine Anonymisierung / Pseudonymisierung von Texten notwendig. Unstrukturierte Texte, wie Verträge, Geschäftsberichte, Kommunikationen, Gerichtsurteile etc., werden derzeit meist noch manuell anonymisiert. Unser anonymizer unterstützt hierbei, so dass auch diese Daten für Anwendungsfälle, wie Veröffentlichungen, Transaktionen, Aufbewahrung, Verwendung von Big Data, Training von Algorithmen, etc. verwendet werden können. Dabei wird der langsame und teure Prozess des manuellen Anonymisierens automatisiert, um so Zeit- und Effizienzgewinne zu erreichen.

So funktioniert es:

Vertrauliche Dokumente werden anonymisiert, ohne dabei die Klardaten zu speichern. Der Anwender kann dabei auswählen, welche Inhalte automatisch anonymisiert werden sollen (von Namen über E-Mail-Adressen bis hin zu Zahlen) und hat die Möglichkeit manuell nachzuarbeiten. Hierfür werden optimierte NLP-Algorithmen (Natural Language Processing), Word Embeddings und Sprachmodelle verwendet. Die zu anonymisierenden Bestandteile können entweder geschwärzt werden, oder durch Textbausteine ersetzt werden.

Vorteile:

  • Einsatz für Daten, die der DS-GVO unterliegen und Verlängerung von Löschfristen
  • Training von Algorithmen zur Entwicklung von digitalen Lösungen und Verarbeitung von Big Data
  • Transfer vertraulicher Daten und Aufbereitung von Dokumenten für einen Cleanroom
  • Wahrung des Kontextes und Sinnzusammenhangs von Texten, so dass diese bspw. auch weiterhin automatisiert übersetzt werden können
Screenshot Tool Anonymisierung

Contact us

Dr. Bernd Kliem

Dr. Bernd Kliem

Partner, PwC Germany

Tel.: +49 89 5790-5549

Tim  Dilmaghani Khameneh

Tim Dilmaghani Khameneh

Senior Manager, PwC Germany

Tel.: +491751807910

Ulrich Warning

Ulrich Warning

Senior Manager, PwC Germany

Follow us