Dokumentenvergleich mit KI: Wie semantisches Verständnis der Schlüssel zur Effizienz ist

Veröffentlicht 09.09.2024

Nadja Rußig Product Marketing thingsTHINKING GmbH

Beitragsbild Bogartikel Dokumentenvergleich: Personen im Meetingraum

Ob die Prüfung von Verträgen, das Schärfen von Richtlinien oder die Bewertung von Anforderungskatalogen – im Umgang mit kritischen Inhalten gilt: Nuancen machen den Unterschied. So kann beispielsweise aus einer übersehenen Klauseländerung ein kostspieliges Problem werden. Wer dem Teufel im Detail nicht zum Opfer fallen möchte, muss Dokumente daher in der Regel genau lesen, prüfen und vergleichen. Doch wer hat schon die Zeit, jedes Schriftstück akribisch zu durchleuchten? Nicht ohne Grund sind Prüfungen, die Expertenwissen verlangen, oft das Nadelöhr in der Prozesskette von Unternehmen.

Die meisten unterstützenden Softwarelösungen stoßen schnell an ihre Grenzen, wenn es um das Verständnis von Text geht – sie erkennen zwar Wörter, aber nicht deren Bedeutung. Hier kommt Künstliche Intelligenz ins Spiel: Sie liest Texte wie ein Mensch, nur schneller, genauer und weniger fehleranfällig. Ein Dokumentenvergleich mit KI lässt sich also nicht von unterschiedlichen Formulierungen aus der Bahn werfen und funktioniert auf semantischer Ebene. Das heißt, Wörter und Sätze werden hinsichtlich ihrer Bedeutung und unter Berücksichtigung des Kontexts analysiert. Der folgende Text gibt einen Einblick in die zugrunde liegende Technologie und zeigt auf, wie der KI-basierte Dokumentenvergleich den Weg zu einer effizienteren Textprüfung ebnet.

Was hat der Dokumentenvergleich mit unstrukturierten Daten zu tun?

Im Zusammenhang mit KI in Unternehmen hört man oft von „unstrukturierten Daten”. Das sind etwa Textdateien, Präsentationen, E-Mails, Videos, usw. Das Manko: Diese Daten lassen sich nicht einfach durchsuchen und analysieren. Bemerkenswert ist der Fakt, dass der Anteil dieser unstrukturierten Daten in Unternehmen laut Gartner 80 % ausmacht. Solange diese Daten unzugänglich sind, fehlt die Basis für eine Automatisierung. Wichtige Erkenntnisse und Risiken werden somit nur dann aufgedeckt, wenn Mitarbeitende viele Ressourcen in das Durcharbeiten der Daten investieren. Stetiger Zeitdruck sowie der Mangel an Fachkräften stehen zudem in einem Spannungsverhältnis mit einem hohen Qualitätsanspruch, der z.B. beim Vertragsvergleich unerlässlich ist. Wie also macht KI aus unstrukturierten strukturierte Daten und schafft so die Grundlage für einen automatisierten Dokumentenvergleich?

Wie KI Texte versteht und Insights generiert

Die KI verwendet verschiedene Technologien, wie z.B. (Large) Language Models, kurz (L)LMs, um Texte auf inhaltlicher Ebene zu verstehen und zu analysieren. Dafür werden sogenannte semantische Fingerabdrücke für einen Satz, Textabschnitt oder auch ein ganzes Dokument erzeugt. Auf diese Weise fängt die KI die wesentlichen Merkmale und Eigenschaften des Textes unter Berücksichtigung seiner Bedeutung und seines Kontexts ein. Der semantische Fingerabdruck erfasst somit nicht nur einzelne Worte, sondern den gesamten Sinnzusammenhang des jeweiligen Textes. Mit dieser Methodik wird dessen Essenz extrahiert und in eine strukturierte Form für die Weiterverarbeitung überführt – ganz ohne klassisches und langwieriges Training vorab. Die Daten werden somit zugänglich und lassen sich durchsuchen, analysieren und auswerten – der Grundstein für den Dokumentvergleich mit KI.

Abbildung, die die den semantischen Dokumentenvergleich als Methodik abbildet.

Was sind (Large) Language Models?

Ein (Large) Language Model ist ein Computerprogramm, das im ersten Schritt (dem sogenannten Pre-Training) mit unfassbar großen Mengen an Daten trainiert wird, um menschliche Sprache zu verstehen und zu generieren. Im Falle von LLama 3.1 von Meta sind es beispielsweise über 11,3 Billionen Wörter.

Ein (L)LM verwendet Algorithmen, um in menschlicher Sprache Muster und Zusammenhänge zu erkennen und diese nachzubilden. Es trifft also eine Vorhersage, welche Wörter am wahrscheinlichsten aufeinanderfolgen. In einem weiteren Schritt, dem sogenannten Reinforcement Learning from Human Feedback (RLHF), werden die Sprachmodelle darauf trainiert, zu gegebenen Fragestellungen – sogenannte Prompts – Antworten zu generieren. Dadurch sind (L)LMs in der Lage, eine Vielzahl von natürlichsprachlichen Aufgaben wie Textgenerierung, Übersetzung, Zusammenfassung und Fragenbeantwortung durchzuführen.

Dokumentenvergleich auf Knopfdruck: Funktionen im Überblick

Für einen unkomplizierten Einstieg in die Nutzung von KI im Unternehmen bietet der semantische Dokumentenvergleich ideale Voraussetzungen. Die semantha – Compare App, die sich mühelos in ein Dokumentenmanagementsystem, wie d.velop, integrieren lässt, zeigt beispielhaft, wie man die Potenziale der KI voll ausschöpfen kann. Nutzer können damit ganz einfach verschiedene Versionen eines Dokuments oder unterschiedliche Dokumentenarten miteinander vergleichen – unabhängig davon, wie deren Inhalte formuliert oder strukturiert sind.

Abbildung, die die Funktionen der semantha compare App zum Dokumentenvergleich zeigt.
  • Relevante Unterschiede und Ähnlichkeiten auf einen Blick: Die KI hebt sowohl ähnliche Passagen als auch Abweichungen und klare Unterschiede farbig hervor. Zudem lassen sich Inhalte anzeigen, die im Referenzdokument fehlen.
  • Detaillierte, nachvollziehbare Ergebnisse: Der Similarity-Score gibt an, wie hoch die semantische Ähnlichkeit zwischen zwei Passagen ist. Unterschiede lassen sich zudem genau inspizieren, um so Veränderungen noch besser nachvollziehen zu können.
  • Fokus für die Prüfung: Statistiken geben einen schnellen Überblick über die Vergleichsergebnisse. Mit Hilfe der Filterfunktion lassen sich nur relevante Ergebnisse anzeigen, z.B. alle veränderten und neuen Passagen, um so einen Fokus für die Durchsicht zu setzen. Für einen konsistenten und dokumentierten Prüfungsprozess können Nutzer Passagen abhaken und Kommentare ergänzen.
  • Finden ähnlicher Dokumente: Auf Basis eines Dokuments lassen sich innerhalb des gesamten Datenbestands weitere Dokumente finden, die inhaltliche Ähnlichkeiten aufweisen bzw. gleiche Themen beinhalten.
  • Einfacher Import und Export: Die Dokumente können direkt in der digitalen Akte auswählen und der Vergleich mit einem Klick gestartet werden. Nach der Prüfung ist der Export bequem als PDF oder Excel möglich.

KI liefert Abkürzung für den Menschen

Im Bereich des Dokumentenvergleichs wird KI zu einer Art persönlicher Assistent. Vergleichbar mit unterstützenden Systemen, die beim Autofahren helfen, in der Spur zu bleiben oder vor Gefahren warnen. Am Ende behält die Person hinter dem Steuer die Kontrolle. Genauso verhält es sich mit den Ergebnissen, welche die KI liefert. Gemäß dem “Human-in-the-Loop-Ansatz” bleibt die finale Prüfung immer beim Anwender. Dieser wird durch die KI auf relevante Unterschiede hingewiesen, kann sich auf neue oder fehlende Inhalte konzentrieren und Dokumente, wie Verträge, mit mehr Fokus prüfen. Die KI leistet quasi die Vorarbeit, die den Weg zu Entscheidungen für den Anwender radikal abkürzt.

Dokumentenvergleich mit KI schafft neue Maßstäbe für die Praxis

Der automatisierte Vergleich von Texten eröffnet in vielfältigen Geschäftsfeldern und Tätigkeitsbereichen neue Möglichkeiten und setzt Standards. So lassen sich beispielsweise in Rechtsabteilungen neue Vertragsversionen schnell mit vorangegangenen Versionen abgleichen. Darüber hinaus können bestimmte Themen oder Inhalte, wie z.B. „Must-Haves“ oder „No-Gos“, in einer Wissensbasis definiert und daraufhin geprüft werden. So decken Nutzer beispielsweise in Lieferantenverträgen fehlende Passagen auf oder identifizieren Bedingungen, denen in früheren Verträgen nicht zugestimmt wurde – z.B. risikoreiche Klauseln. Mitarbeitende im Compliance-Bereich sind regelmäßig mit Vorschriften und Regularien konfrontiert, die sich rasend schnell verändern. Bestehende Richtlinien können mit Hilfe der KI schneller geprüft werden, um sicherzustellen, dass sie den neuen Gegebenheiten entsprechen. Das sind nur einige Anwendungsfälle aus einer Liste, die künftig noch länger wird.

Schub für mehr Effizienz und Produktivität

In allen Bereichen profitieren die Anwender von entscheidenden Vorteilen, die eine Nutzung nahezu unverzichtbar machen:

  • Zeitersparnis: Dokumente lassen sich in Sekundenschnelle automatisch vergleichen. Der zeitliche Aufwand für die Prüfung reduziert sich dadurch um bis zu 40 %.
  • Kostenersparnis: Dokumente können zügig mit weniger Ressourceneinsatz bearbeitet werden, was die Kosten senkt.
  • Entlastung der Fachkräfte: KI als Assistenz verspricht Fachkräften Entlastung und ermöglicht ihnen, sich auf wertschöpfende Tätigkeiten zu konzentrieren.
  • Fehlerminimierung und Qualitätssteigerung: Durch die genaue Analyse und Unermüdlichkeit einer Maschine, erzeugt die KI präzisere Ergebnisse als ein Mensch und minimiert das Risiko, relevante Änderungen zu übersehen. Dies führt zu einer höheren Qualität und Konsistenz in der Dokumentenprüfung, was besonders in rechtlich sensiblen oder hochregulierten Branchen von Vorteil ist. Kostspielige Fehler lassen sich so vermeiden.
  • Integration in bestehende Workflows: KI-Lösungen lassen sich problemlos in bestehende Systeme und Workflows einbetten. So können Anwender etwa die Funktionen der semantha Compare App direkt in ihrer gewohnten d.velop-Umgebung abrufen. Dies erleichtert die Einführung und maximiert den Nutzen der KI im täglichen Einsatz

Fazit: Der Weg zur effizienten Dokumentenprüfung führt über KI

Künstliche Intelligenz verändert grundlegend, wie Unternehmen mit unstrukturierten Daten, wie Texten, arbeiten. Dabei geht es nicht darum, Fachkräfte zu ersetzen, sondern die Technologie als wertvolle Unterstützung zu nutzen. Anstatt selbst unzählige Seiten wiederholt zu lesen, übernehmen KI-basierte Anwendungen, wie die semantha Compare App in d.velop, die Analyse und leisten die Vorarbeiten. So können sich Mitarbeitende ganz auf die Ergebnisse konzentrieren und fundierte Entscheidungen schneller treffen. Wer freut sich denn nicht über ein bisschen Assistenz im Arbeitsalltag?

Smarter Dokumentenvergleich: Verträge mit KI automatisch analysieren

Autor:in

Nadja ist beim KI-Unternehmen thingsTHINKING im Bereich des Product Marketings tätig.

Nadja Rußig Product Marketing thingsTHINKING GmbH