Krefeld, 17. Juli. Wissenschaftler der Hochschule Niederrhein arbeiten daran, Texte der Kirchenväter von der Antike bis ins Mittelalter weltweit zugänglich zu machen. Sie entwickelten eine Software, die es ermöglicht, die Jahrtausenden alten Texte, die nur in wenigen Bibliotheken weltweit verfügbar sind, zu digitalisieren. Dabei geht es nicht nur um das bloße Einscannen der Texte, sondern um die Extraktion der Texte aus den gescannten Seiten. Dafür ist eine spezielle Software nötig, die von Prof. Dr. Christoph Dalitz vom Forschungsinstitut iPattern der Hochschule Niederrhein entwickelt wurde und als Open-Source-Software weiterhin betreut wird.
„Entscheidend für die Digitalisierung der Texte ist eine Anpassung der eingesetzten Texterkennungs-Software (OCR) an die verwendeten Sprachen, Seiten-Layouts und Fonts, weil die Software sonst nur unbrauchbare Ergebnisse liefert“, erklärt Christoph Dalitz, der am Fachbereich Elektrotechnik und Informatik Mathematik und Datenverarbeitung lehrt. „Aufgrund der Flexibilität unserer Open-Source Lösung war diese komplexe Anpassung innerhalb weniger Tage möglich.“
Zum Hintergrund: Altphilologen der Tufts University in den USA arbeiten derzeit an der Digitalisierung klassischer griechischer und lateinischer Texte und erstellen die „Perseus Digital Library“. Einen Beitrag leistet auch Prof. Bruce Robertson von der Mount Allison University in Kanda. Er hat sich auf die Digitalisierung der griechischen Texte der Kirchenväter von der Antike bis ins Mittelalter spezialisiert. Diese sind im 19. Jahrhundert in der Sammlung „Patrologia Graeca“ gesammelt erschienen. Aufgrund der mäßigen Druckqualität und des platzsparenden Layouts erweist sich diese Ausgabe als problematisch für eine automatische Texterkennung.
Da Prof. Robertson bei der Digitalisierung das an der Hochschule Niederrhein entwickelte „Gamera Framework“ einsetzt, kontaktierte er Christoph Dalitz, der als Hauptentwickler diese Software betreut. Gemeinsam realisierten sie ein Verfahren, das die Probleme bestehender OCR-Software mit dieser Quelle behebt. Die Ergebnisse wurden kürzlich auf der Konferenz „Digital Acces to Textual Cultural Heritage“ (DATeCH) in Madrid vorgestellt. Für Dalitz zeigt diese Zusammenarbeit, wie anwendungsorientierte Forschung einer Fachhochschule einen Beitrag leisten kann, um kulturhistorische Probleme zu lösen. „Es freut mich, zu der Digitalisierung dieser wichtigen und anderweitig schwer zugänglichen Quelle griechischer Texte durch technische Expertise in der Bildverarbeitung beizutragen.“
Pressekontakt: Dr. Christian Sonntag, Referat für Presse und Öffentlichkeitsarbeit, Tel.: 02151 822-3610, E-Mail: christian.sonntag@hs-niederrhein.de
Autor: Christian Sonntag