Korpus-Archiv

Ein Hauptziel des Zürcher Kompetenzzentrums für Linguistik (ZüKL) ist es, die linguistischen Institute der Universität Zürich zu vernetzen. Dazu gehört es auch, die vorhandenen Ressourcen und insbesondere Korpora, die in den verschiedenen Projekten enstehen, sichtbar zu machen. Das ZüKL bietet daher an, fertiggestellte Korpora auf dem ZüKL-Server zu archivieren und zugänglich zu machen.

Um Korpora auf dem ZüKL-Server archivieren zu können, müssen sie folgende Anforderungen erfüllen.

Format und Dokumentation

  • Die Daten müssen als plain text (z.B. vertikalisiert, CSV/tab-delimited) oder in XML (mit DTD oder XML-Schema) vorliegen, bevorzugt in einem Standardformat wie z.B. TEI, XCES, PAULA, EXMARaLDA, Linguistic Annotation Framework (LAF, ISO 24612)
  • Ausserdem muss eine Dokumentation über das Format, das verwendete Annotationsschema und die Annotationsrichtlininen abgegeben werden.
  • Binäre Dateien, die nur mit einer bestimmten Anwendung geöffnet werden können, werden nicht akzeptiert.

Veröffentlichung

Das ZüKL archiviert nur Korpora, die für die Öffentlichkeit nutzbar sind. Korpora auf dem ZüKL-Server müssen mindestens für UZH-Forschende zugänglich sein und sollen im Idealfall komplett für die nicht-kommerzielle Nutzung geöffnet werden (natürlich unter der Voraussetzung, dass Urheberrechte, Lizenzen und Datenschutz eingehalten werden). Dazu muss für jedes Korpus eine Lizenz gewählt werden.

Informationen zu Lizenzen:

Für jedes Korpus muss ausserdem angegeben werden, in welcher Form es zitiert werden soll. Jedes Korpus benötigt eine Kontaktperson und ein zuständiges Institut an der UZH.

Freigabe der Ressourcen: Optionen

Wenn Ihr Korpus den Anforderungen entspricht, können Sie zwischen verschiedenen Möglichkeiten der Datenfreigabe wählen.

Download vs. Webschnittstelle

Sie können wählen, ob Ihr Korpus direkt von der ZüKL-Seite herunterladbar sein oder über eine Webschnittstelle wie CQPWeb oder ANNIS zugänglich gemacht werden soll. Webschnittstellen bieten den Vorteil, dass sie einen einfachen und plattformunabhängigen Zugriff bieten.

Direkter vs. kontrollierter Zugriff

In beiden Fällen können Sie ausserdem bestimmen, ob der Zugriff direkt erfolgt oder ob zunächst über ein Kontaktformular eine Anfrage gesandt wird. Als Empfänger des Anfrageformulars kann entweder die Technische Koordinationsstelle des ZüKL oder ein Administrator aus Ihrem Team festgelegt werden.

Die Technische Koordinationsstelle erteilt den Zugang ggf. automatisch. Über die Registrierung haben Sie dennoch einen Überblick über alle Zugangsberechtigungen. Für mehr Kontrolle und die Möglichkeit, Anfragen abzuweisen, empfiehlt es sich, eine Kontaktperson von Ihrer Seite zu bestimmen. Dann sollte allerdings sicher gestellt sein, dass deren E-Mail-Adresse regelmässig betreut wird. Wird die Anfrage angenommen, muss anschliessend die Technische Koordinationsstelle informiert werden, damit sie den Zugang erstellen kann.

Fragen?

Wenn Sie Ihr Korpus gerne auf dem ZüKL-Server archivieren würden, wenden Sie sich an die Technische Koordinationsstelle des ZüKL.

Beachten Sie auch unsere weiteren Dienste.