Aktueller Stand der maschinellen Sprachverarbeitung für Latein und Altgriechisch
Was ist momentan grundsätzlich möglich?
Die aktuellen Möglichkeiten der maschinellen Sprachverarbeitung für Latein und Altgriechisch erlauben es uns beispielsweise,
- Informationslücken in historiografischen Texten zu finden, indem wir Personen, Orte und andere Eigennamen erkennen.
- die Rolle der Polis in Epitaphien zu untersuchen, indem wir
- Wörter und Textstellen thematisch durchsuchen und gruppieren und
- moralisch positive und negative Narrative identifizieren.
- die Imitation des Ciceronischen Stils in neuzeitlichen Aufsätzen nachzuweisen, indem wir
- den Satzbau analysieren, z.B. Subjekte, Objekte, Prädikate,
- Wortarten erkennen,
- morphologische Informationen erkennen, z.B. Kasus, Numerus, Genus, Tempus, Modus.
Fehleranfälligkeit
Die maschinelle Sprachverarbeitung befindet sich in stetiger Weiterentwicklung. Systeme zur automatischen Analyse antiker Sprachen sind nie perfekt, machen also Fehler. Ein Beispiel ist die Lemmatisierung, wo flektierten Wörtern mitunter die falsche Grundform zugeordnet wird.
Geschwindigkeit der Weiterentwicklung
Dennoch wird die Leistung der Algorithmen tendenziell immer besser, d.h. sie machen ihre Arbeit schneller und zuverlässiger. Darum lohnt es sich, den Stand der Dinge im Blick zu behalten und regelmäßig neu zu evaluieren. Selbst wenn die Ergebnisse in einem bestimmten Fall noch nicht unseren Ansprüchen genügen, kann dies schon wenige Jahre später ganz anders aussehen.
Notwendigkeit der Fortbildung
Solange wir also mit solchen Algorithmen arbeiten, sollten wir uns regelmäßig fortbilden:
- Welche neuen Veröffentlichungen zum Thema gibt es?
- Wie funktionieren die neuen Algorithmen und Methoden?
- Was wird wahrscheinlich demnächst möglich sein?
Zum Nachlesen
Berti, Monica, ed. Digital Classical Philology: Ancient Greek and Latin in the Digital Revolution. Berlin: De Gruyter, 2019.
Johnson, Kyle P., Burns, Patrick J., Stewart, John, Cook, Todd G., Besnier, Clément und Mattingly, William J.B. “The Classical Language Toolkit: An NLP Framework for Pre-Modern Languages.” In Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing: System Demonstrations. Association for Computational Linguistics, herausgegeben von Heng Ji, Jong C. Park und Rui Xia, 20–9. Association for Computational Linguistics, 2021. PDF
Revellio, Marie. Classics and the Digital Age: Advantages and Limitations of Digital Text Analysis in Classical Philology. Digital Humanities Cooperation, 2015. PDF
Short, William. Blog: Computational Classics? Programming Natural Language Understanding. Society for Classical Studies Blog, 2019. PDF
Sommerschield, Thea, Assael, Yannis, Pavlopoulos, John, Stefanak, Vanessa, Senior, Andrew, Dyer, Chris, Bodel, John, Prag, Jonathan, Androutsopoulos, Ion, und de Freitas, Nando. “Machine Learning for Ancient Languages: A Survey.” Computational Linguistics 49, no. 3 (September 2023): 703–47.