Im nächsten Schritt wollten wir herauszufinden, wie mittels maschinellen Lernens eine Datengrundlage geschaffen werden kann, um analog zum Schmerzensgeldassistenten weitere Produkte mit neuartiger Suchfunktion zu entwickeln.
Aus diesem Grund haben wir gemeinsam mit Fraunhofer IAIS ein dreimonatiges Pilotprojekt zur Klassifikation und Extraktion von Informationen aus Urteilen gestartet – zunächst mit Fokus auf Mietrecht.
Wie wurde das Projekt umgesetzt?
Wir haben aus unserem Bestand einen Datensatz an mietrechtlichen Urteilen zusammengestellt und diese annotiert, also anhand bestimmter Merkmale mit entsprechenden Anmerkungen versehen. Das Erstellen der Trainingsdaten hat einen Großteil der Projektzeit beansprucht. Das Annotations-Schema haben wir gemeinsam mit unseren Expert:innen entwickelt – unter anderem entstand so eine Matrix zur Klassifizierung von Mietmängeln.
Zuerst haben wir mit einfacher Extraktion von Entitäten (zum Beispiel Kläger/Beklagte oder Begriffe zum Mietmangel) begonnen. Das haben wir dann im Anschluss auf Klassifikation von Mietmängeln ausgedehnt. Dabei haben wir ein vortrainiertes Sprachmodell verwendet, das wir um unsere speziellen juristischen Daten ergänzt haben.
Im Rahmen der Entwicklung des Datenmodells konnten wir mit verschiedenen Ansätzen experimentieren, deren Wirksamkeit wir immer wieder quantitativ und qualitativ geprüft haben. Dabei ist uns bei einem dieser Experimente aufgefallen, dass wir mit einer Methode, die eigentlich für die Entwicklung von Frage-Antwort-Modellen verwendet wird, gute Ergebnisse beim Identifizieren von Argumentationsstrukturen im Urteilstext erzielen konnten. Davon fasziniert, haben wir diesen Ansatz daraufhin gemeinsam mit Fraunhofer IAIS ausgebaut.
Dieses Verfahren für das Argumentation Mining war übrigens für uns so überzeugend, dass wir es als Grundlage für unsere Innovationsidee „Legal Case Insights“ für den Global Innovation Award 2022, ein weltweiter Innovationswettbewerb von Wolters Kluwer, verwendet haben.
Was war die Erkenntnis?
Durch geschickten Einsatz von Machine Learning in unseren Produkten kann der Rechercheaufwand für Jurist:innen bei der Fallbearbeitung reduziert werden. Hier profitieren wir auch vom Einsatz vortrainierter Sprachmodelle, die in der Lage sind, semantische Ähnlichkeiten zu erkennen. Auch kleinere Modelle als das derzeit vieldiskutierte ChatGPT können hier beachtliche Ergebnisse bringen. Durch den Einsatz unseres Frage-Antwort-Modells können wir schnell und gezielt Informationen in Urteilen sichtbar machen, die sonst mühsam durch lineares Lesen erschlossen werden müssen.
Das gemeinsame Pilotprojekt mit Fraunhofer IAIS, was sich aktuell nur auf ausgewählte Urteilstypen im Bereich Mietrecht beschränkt, bildet hiermit den ersten Schritt in Richtung der automatisieren Urteilszusammenfassung und -aufbereitung. Das langfristige Ziel ist es, mit den gewonnenen Erkenntnissen eine Lösung zu entwickeln, die rechtsbereichsübergreifend einsetzbar ist.
Detaillierte wissenschaftliche Einblicke gibt Birgit Kirsch, Data Scientist bei Fraunhofer IAIS, in diesem Fachbeitrag im
Blog des Lamarr-Instituts für Maschinelles Lernen und Künstliche Intelligenz vom Fraunhofer IAIS.