Daidalos Logo

Daidalos

Entwicklung einer Infrastruktur zum Einsatz von Natural Language Processing (NLP) für Forschende der Klassischen Philologie

Die Digitalisierung macht auch vor der Klassischen Philologie nicht Halt. Bis vor einigen Jahrzehnten blieb den Forschenden nichts Anderes übrig, als sich in mühevoller Handarbeit einen Weg durch ihre Texte zu bahnen. Obwohl diese Arbeitsweise beeindruckende und mustergültige Werke hervorbrachte, haben heute verfügbare digitale Forschungswerkzeuge das Potential, entscheidende Arbeitsschritte zeitsparender und weniger fehleranfällig zu erledigen.

Daidalos ist keinesfalls das erste klassisch-philologische Projekt mit einem Fokus auf digitale Forschungsmethoden. Sein Alleinstellungsmerkmal besteht zum einen darin, dass es versucht, existierende digitale Methoden der Textanalyse und der Ergebnisdarstellung in einer webbasierten Forschungsinfrastruktur zu vereinigen, diese auch für Projektexterne evidenzbasiert und nachvollziehbar zu evaluieren und weiterzuentwickeln. Zum anderen versteht sich Daidalos als Kontaktpunkt für interessierte Forschende (Community of Practice) und als Lernort, an dem Forschende ihre digitale Kompetenz (Digital Literacy) mithilfe verschiedener Lernbausteine autodidaktisch auf- und ausbauen können.

Bedarfsorientierung durch Forschungstandems

Für eine begründete Auswahl der von Daidalos angebotenen Textkorpora, Analysewerkzeuge, Visualisierungen und Lernbausteine evaluiert das Projekt-Team zunächst das Potential ausgewählter NLP-Methoden. Dies geschieht auf Grundlage von realen Forschungsfragen (z. B. zu Autorschaft, Intertextualität oder Diskursstrategien), die aus der Forschungsgemeinschaft an das Daidalos-Projekt herangetragen werden. Die Zusammenarbeit in diesen Forschungstandems ist wie folgt angelegt: In einem ersten Beratungsgespräch präsentieren die Forschenden ihr Forschungsinteresse, eine mögliche Forschungsfrage und das gewünschte Textkorpus. Das Daidalos-Team berät sie bei der Konkretisierung der Forschungsfrage und erklärt, welche Analysewerkzeuge (z. B. morphosyntaktische Tagger, Arbeit mit Word Embeddings) und Visualisierungsoptionen (z.B. annotierter Text, Graph) geeignet sein könnten. Die von Daidalos angebotenen Werkzeuge der maschinellen Sprachverarbeitung ermöglichen sowohl die Analyse linguistischer Erscheinungen (u. a. Wortarten, Kollokationen, Syntax) als auch literaturwissenschaftlicher Fragestellungen (u. a. Genremerkmale, Paraphrasensuche, antike Konzepte). Sobald die Analyseergebnisse vorliegen, übergibt das Daidalos-Team sie den Forschenden zur Beurteilung. In einem weiteren Gespräch evaluieren die Forschenden gemeinsam mit dem Daidalos-Team die Qualität der Ergebnisse und der Visualisierung. Bei Bedarf werden die Parameter angepasst und weitere Analysedurchgänge durchgeführt. Die aus den Forschungstandems gewonnen Erkenntnisse werden als Use Cases zum Aufbau der webbasierten Infrastruktur und zur Gestaltung der Lerneinheiten genutzt.

Interaktive Forschungsinfrastruktur als Lernangebot

Der interaktive Zugang zu antiken Texten soll nicht nur Forschungsfragen beantworten helfen, sondern auch Methodenreflexion fördern und User qualifizieren. Entsprechend bietet die Software folgende Inhalte:

a) Demo-Workflows mit konfigurierbaren Elementen, z. B. Korpusauswahl, wobei die Konfiguration mittels kuratierter, authentischer Beispiele detailliert erklärt und reflektiert wird;
b) eine domänenspezifische Oberfläche u. a. mit Interaktionen zu Forschungsinteresse und Methodenwahl; Speicherung von personalisierten Einstellungen; Übungen und Code-Snippets in Jupyter Notebooks;
c) freie Konfiguration von Text- und Methodentriangulation, Einbindung von eigenem Quellcode für erfahrene Forschende.