Wie jeder Wörterbücher im Internet veröffentlichen kann

Wie jeder Wörterbücher im Internet veröffentlichen kann
An der Universität Trier wurde eine Anwendung entwickelt, mit der Wortsammlungen einfach online gestellt werden können.
Von Uwe Mauch

Der Aufwand damals war enorm: Die Digitalisierung der 300 Millionen gedruckten Zeichen des Deutschen Wörterbuchs von Jacob und Wilhelm Grimm durch ein Projektteam der Universität Trier hat Jahre gedauert. Schon allein die Strukturierung der Einträge für die Online-Version war eine große Aufgabe.

Ein Angebot auch für Laien

Das durch das EU-Forschungsrahmenprogramm „Horizon 2020“ geförderte Projekt ELEXIS hat nun verschiedene Lösungen vorgelegt, die das Digitalisieren von Wörterbüchern einfacher machen. Ein vom Trier Center for Digital Humanities (TCDH) im Rahmen des Projekts an der Universität Trier entwickeltes Tool ermöglicht es nun prinzipiell jedem und jeder, Wörterbücher im Internet zu veröffentlichen. Größeres technisches Wissen ist dafür nicht notwendig.

„Natürlich braucht es dennoch ein paar Vorarbeiten“, sagt Anne Klee, Projektmitarbeiterin am TCDH. Beispielsweise müssen die Seiten von gedruckten Wörterbüchern gescannt, mit einer so genannten OCR-Software bearbeitet und in das benötigte Dateiformat XML gebracht werden. „Das Schöne ist aber, dass andere Partner im Projekt auch für die Arbeitsschritte davor einfach bedienbare Tools bereitstellen“, so Klee.

Das TCDH der Universität Trier ist der einzige deutsche Partner in dem Projekt, an dem noch 16 weitere Forschungseinrichtungen aus ganz Europa beteiligt sind.

Auch für "kleinere Sprachen"

Aber warum das Ganze? „Wir wollten ein möglichst niedrigschwelliges Werkzeug schaffen, mit dem jeder in der Lage ist, Wörterbücher zu veröffentlichen ohne große Vorkenntnisse. Vor allem bei kleineren Sprachen, wie beispielsweise Kroatisch oder Serbisch, gibt es oft nicht die Ressourcen spezielle technische Lösungen für die Digitalisierung von Wörterbüchern zu entwickeln. Darüber hinaus wollen wir einen Beitrag leisten, Wissen zu bewahren. Es gibt viele Wörterbücher, die in Bibliotheken verstauben. Wenn sie digitalisiert sind, eröffnet das neue Möglichkeiten“, erklärt Klee.

Selbstverständlich kann in den über Publex veröffentlichten Wörterbüchern ganz bequem über eine Volltextsuche gesucht werden. Außerdem ist das Suchen über benutzerdefinierte Felder möglich.

Das Tool eignet sich dafür, sowohl neue Wörterbücher online zu stellen, wie auch vorher digitalisierte Inhalte bereits bestehender Wörterbücher ins Netz hochzuladen. Wer ein Wörterbuch mit Publex veröffentlichen möchte, kann beispielsweise zwischen unterschiedlichen Formatierungen wählen. Das Tool kann als Open Source kostenlos verwendet werden. Es ist aktuell in einer Beta-Version online, die weiter verbessert wird.

Hier noch die Links zum Tool Publex, zum Tutorial und zu einem Video.

Kommentare