Der digitale Bücherwurm

Mit den bionischen Fingern und leistungsstarken Sensoren dieses Scan-Roboters wird die Digitalisierung historischer Schriften zum Kinderspiel.

Vorsichtig blättert der Finger die vergilbte Seite eines alten Manuskripts um. In der andächtigen Stille der Bibliothek nimmt er das Wissen vergangener Zeiten in sich auf. Einige Sekunden später wird eine weitere Seite umgeblättert, dann noch eine...

Wer hier so geschwind Bücher wälzt, ist nicht etwa ein Student. Der Finger gehört vielmehr einem erstaunlich geschickten und effizienten automatischen Buchscanner.

Der Scanner bietet eine raffinierte Lösung für ein altbekanntes Problem, nämlich die Frage, wie alte Schriften so archiviert und bewahrt werden können, dass sie auch einer modernen Leserschaft zugänglich sind.

Der Scan-Roboter hat zwei wesentliche Vorteile: Erstens geht er sorgsam mit den Originalen um – anders als dies bei sogenannten destruktiven Scanverfahren der Fall ist, bei denen die Seiten aus ihrer Bindung gelöst werden. Zweitens kann er dank eines einzigartigen und vollautomatischen Blättermechanismus – dem „bionischen Finger“ – bis zu 2.500 Seiten pro Stunde scannen.

Zum Vergleich: Menschen, die die Seiten eines Buches von Hand umblättern, schaffen nach Angaben der ehrenamtlichen Digitalisierungsinitiative Project Gutenberg wahrscheinlich nur etwa 200 Seiten pro Stunde.

„Der patentierte bionische Finger arbeitet beim Umblättern automatisch mit dem richtigen Druck, um die Vorlagen nicht zu beschädigen. Die V-förmige Buchwippe schont die Bindung, und die Glasplatten halten die Seiten beim Scannen plan“, erklärt Sofie Quidenus, Gründerin von Qidenus Technologies, dem Unternehmen, das hinter dem Scanner steckt.

Die Geräte sind bereits rund um den Globus bei verschiedenen Digitalisierungsprojekten im Einsatz: Sie scannen alte arabische Schriften für die Nationalbibliothek von Abu Dhabi, arbeiten sich durch die historischen Archive der Stadt Buenos Aires in Argentinien und helfen dabei, die gesamte Sammlung der norwegischen Nationalbibliothek mit einer Geschwindigkeit von 55.000 Seiten pro Woche zu digitalisieren.

Handschrift als Hürde

Angesichts der Tatsache, dass 20 Prozent der archivierten Dokumente von Hand geschrieben und nicht gedruckt sind, besteht die nächste Herausforderung darin, eine Technologie zu entwickeln, die Handschrift erkennen und in ein maschinenlesbares Format umwandeln kann.

„Bei der Arbeit für mein erstes Start-up wurde mir klar, dass es nicht ausreicht, Daten einfach nur zu bewahren“, so Quidenus. „Handschriften müssen digitalisiert werden, damit sie durchsucht und mit Bildern und anderen Arten von Informationen verknüpft werden können.“

Zusammen mit Stephan Dorfmeister gründete sie SearchInk, ein Unternehmen, das handschriftliche Dokumente mithilfe von Techniken künstlicher Intelligenz wie etwa Deep Learning und Transfer Learning digitalisieren will.

 

Die Technologie verschafft uns Zugang zu dem Wissen der Menschheit, das in handschriftlichen Dokumenten verborgen ist.

Die Idee dahinter ist, dem Algorithmus beizubringen, Texte auf die gleiche Weise zu verarbeiten und zu analysieren wie der Mensch – also zu „lesen“, statt den Text einfach nur zu extrahieren und zu transkribieren.

In Zusammenarbeit mit anderen europäischen Forschungszentren konzentriert sich das Projekt zunächst darauf, Handschriften in sieben verschiedenen Sprachen zu analysieren. Die Auswirkungen für die zukünftige Forschung wären enorm: Tausende von alten Schriften könnten durchsucht und einfach zugänglich gemacht werden.

„Besonders spannend an diesen aktuellen Entwicklungen finde ich, dass die Technologie uns Zugang zu dem Wissen der Menschheit verschafft, das in handschriftlichen Dokumenten verborgen ist“, sagt Quidenus.