09 Oktober, 2019
In vielen Situationen ist eine Anonymisierung / Pseudonymisierung von Texten notwendig. Unstrukturierte Texte, wie Verträge, Geschäftsberichte, Kommunikationen, Gerichtsurteile etc., werden derzeit meist noch manuell anonymisiert. Unser anonymizer unterstützt hierbei, so dass auch diese Daten für Anwendungsfälle, wie Veröffentlichungen, Transaktionen, Aufbewahrung, Verwendung von Big Data, Training von Algorithmen, etc. verwendet werden können. Dabei wird der langsame und teure Prozess des manuellen Anonymisierens automatisiert, um so Zeit- und Effizienzgewinne zu erreichen.
Vertrauliche Dokumente werden anonymisiert, ohne dabei die Klardaten zu speichern. Der Anwender kann dabei auswählen, welche Inhalte automatisch anonymisiert werden sollen (von Namen über E-Mail-Adressen bis hin zu Zahlen) und hat die Möglichkeit manuell nachzuarbeiten. Hierfür werden optimierte NLP-Algorithmen (Natural Language Processing), Word Embeddings und Sprachmodelle verwendet. Die zu anonymisierenden Bestandteile können entweder geschwärzt werden, oder durch Textbausteine ersetzt werden.