KLIP 2014

Auch 2014 hat das ZüKL Gelder zur Förderung Kleiner LInguistischer Projekte (KLIP) bereitgestellt. Von sieben eingegangenen Anträgen wurden vier ausgewählt, die mit 22'000 CHF gefördert werden. Unten finden Sie kurze Beschreibungen der Projekte.

Neutralisation orthographischer Varation im ZEKO-Projekt

  • ID: KLIP-2014-A-1
  • Antragsteller:
    Elvira Glaser (Deutsches Seminar), Tanja Samardžić (Korpus-Lab, UFSP)
  • Inhalt:
    Das ZEKO (Zürcher Elektronisches Korpus von Sprachvarietäten) hat bereits verschiedene Such- und Filterfunktionen. Schwierig ist es hingegen noch, graphische Varianten des selben Wortes zu finden. Dies ist aber wichtig, weil das Korpus schweizerdeutsche Texte enthält, die keiner standardisierten Orthographie unterliegen. Bisland findet etwa eine Suche nach miir 'mir' zwar mììr, nicht aber mir.
    Dieses Projekt soll zur Lösung dieses Problems beitragen, indem jedem Wort eine für den Benutzer nicht sichtbare normalisierte Form zugeordnet wird. Bei der Suche nach einer beliebigen Schreibweise dieses Wortes soll die Suche das Wort dann normalisieren und im Korpus nach der normalisierten Form suchen.
  • Abschlussbericht:

Anreicherung von Annotationen in einer lexikalischen Datenbank für die Deutschschweizerische Gebärdensprache

  • ID: KLIP-2014-A-2
  • Antragsteller:
    Penny Boyes Braem (Forschungszentrum für Gebärdensprache Basel), Tobias Haug (Interkantonale Hochschule für Heilpädagogik), Sarah Ebling (Institut für Computerlinguistik)
  • Inhalt:
    Für die Deutschschweizerische Gebärdensprache (DSGS) wird seit 1996 am Forschungszentrum für Gebärdensprache (Basel) eine lexikalische Datenbank aufgebaut, die zurzeit rund 9000 Einträge umfasst. Jeder Eintrag enthält Informationen zur Semantik, Form und Verwendung einer Gebärde. Die Datenbank und die zugehörige Software werden seit dem SNF-Projekt InterGaze auf dem ZüKL-Server gehostet.
    Damit die Datenbank in Zukunft noch vielfältiger genutzt werden kann, sollen die Annotationen angereichert werden. Zurzeit sind nur für rund 3000 der 9000 Einträge maschinenlesbare Notationen der Form einer Gebärde im Hamburger Notationssystem (HamNoSys) vorhanden. Diese Notationen sind erforderlich für die Durchführung von standardisierten Formvergleichen sowie für die automatische Verarbeitung von Gebärdensprache, etwa für die Darstellung von Gebärdensprachsequenzen mittels eines Avatars.
    Zur Ausführung dieser Arbeiten werden zwei gehörlose DSGS-Benutzerinnen zur Notation von 1500 Gebärden in HamNoSys und zur Überprüfung vorhandener Notationen angestellt.
  • Abschlussbericht:
  • Folgeprojekt: SNF Sinergia "SMILE: Scalable Multimodal sign language Technology for sIgn language Learning and assessmEnt" (CRSII2_160811 / 1), Projektstart 01/2016

Suchmaske für Brief- und Tagebuchkorpus des späten 18. Jahrhunderts (Lady Mary Hamilton Archive)

  • ID: KLIP-2014-B-1
  • Antragstellerin:
    Marianne Hundt (Englisches Seminar)
  • Inhalt:
    Am Englischen Seminar werden im Rahmen von Seminaren und Qualifikationsarbeiten seit dem Herbstsemester 2012 digitalisierte Manuskripte von Briefen und Tagebucheinträgen aus dem späten 18. Jahrhundert (Lady Mary Hamilton Archiv) transliteriert und nach TEI Standard sowie mit XML annotiert. Das so entstandene Korpus umfasst mittlerweile etwas mehr als 25,000 Wörter. Mit Hilfe der KLIP Mittel soll in Zusammenarbeit mit dem Institut für Computerlinguistik eine Suchmaske (Interface) programmiert werden, über die das bereits digitalisierte Material im Verlauf des Projektes (Stichwort ‚inkrementeller Korpusaufbau’) durchsuchbar gemacht werden kann. Suchanfragen können auch von externen Nutzern vorgenommen werden, da das Material nicht dem Copyright unterliegt und nicht anonymisiert werden müssen.
    Dieses KLIP wird ergänzt duch einen SNF-Antrag ‚Editionsprojekte’, der die Digitalisierung des vollständigen Tagebuchmaterials im Rahmen des Programms zum Ziel hat.

Alinierung von schweizerdeutschen Dialektaufnahmen mit vorhandener Transkription

  • ID: KLIP-2014-B-2
  • Antragsteller:
    Hanna Ruch (UFSP Sprache und Raum), Anne Göhring (Institut für Computerlinguistik)
  • Inhalt:
    In der Zürcher Linguistik gibt es zahlreiche transkribierte Aufnahmen gesprochener Sprache. Häufig fehlt jedoch die zeitliche Aliniierung der Aufnahmen mit der Transkription. Diese ist aber aus verschiedenen Gründen wünschenswert, z.B. für Forschungsarbeiten, in denen Aspekte der gesprochenen Sprache untersucht werden sollen, zur Überprüfung der Transkription, um den prosodischen Kontext mit zu berücksichtigen oder um bestimmte Ausschnitte von Aufnahmen einem breiteren Publikum zugänglich zu machen.
    Mit dem Münchner Automatischen Segmentierungssystem (MAuS) liegt ein Tool vor, das Transkriptionen und Audioaufnahmen automatisch aliniieren kann. Bislang ist MAuS jedoch vor allem auf die Bearbeitung kürzerer Aufnahmen ausgelegt, in denen sich Sprecherstimmen nicht überschneiden. Ziel dieses KLIP ist es, MAuS so zu erweitern, dass es auch mit längeren Aufnahmen in einer natürlichen Umgebung umgehen kann. Davon soll die Zürcher Linguistik als Ganzes profitieren.
  • Abschlussbericht:
  • Dokumentation: