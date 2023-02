„Natürlich braucht es dennoch ein paar Vorarbeiten“, sagt Anne Klee, Projektmitarbeiterin am TCDH. Beispielsweise müssen die Seiten von gedruckten Wörterbüchern gescannt, mit einer so genannten OCR-Software bearbeitet und in das benötigte Dateiformat XML gebracht werden. „Das Schöne ist aber, dass andere Partner im Projekt auch für die Arbeitsschritte davor einfach bedienbare Tools bereitstellen“, so Klee.

Das TCDH der Universität Trier ist der einzige deutsche Partner in dem Projekt, an dem noch 16 weitere Forschungseinrichtungen aus ganz Europa beteiligt sind.

Auch für "kleinere Sprachen"

Aber warum das Ganze? „Wir wollten ein möglichst niedrigschwelliges Werkzeug schaffen, mit dem jeder in der Lage ist, Wörterbücher zu veröffentlichen ohne große Vorkenntnisse. Vor allem bei kleineren Sprachen, wie beispielsweise Kroatisch oder Serbisch, gibt es oft nicht die Ressourcen spezielle technische Lösungen für die Digitalisierung von Wörterbüchern zu entwickeln. Darüber hinaus wollen wir einen Beitrag leisten, Wissen zu bewahren. Es gibt viele Wörterbücher, die in Bibliotheken verstauben. Wenn sie digitalisiert sind, eröffnet das neue Möglichkeiten“, erklärt Klee.