Zur alten DWDS-Webseite

SynCoP

1. Syntactic Constraint Parser

SynCoP steht für „Syntactic Constraint Parser“ und stellt ein System für die vollautomatische Annotation von Korpora dar. Das System wurde im Rahmen des Projektes „Kollokationen im Wörterbuch“ von Jörg Didakowski implementiert und innerhalb des Projektes „Digitales Wörterbuch der deutschen Sprache“ sowie begleitend zu einem Promotionsvorhaben an der Universität Hamburg von ihm weiterentwickelt.

Das System beruht auf einem Finite-State-Ansatz und unterstützt korpus- und wissensbasierende Techniken; es ist möglich, mit Hilfe einer auf XML basierenden Spezifikation über SynCoP verschiedene Analysewerkzeuge wie z.B. Tokenizer, Eigennamenerkenner, Part-Of-Speech-Tagger oder Parser zu implementieren und miteinander zu verbinden. Über die Spezifikation können Konzepte aus der Objektorientierung genutzt werden, um Ressourcen zu strukturieren und austauschbar zu machen. Momentan ist das System auf dem Gebiet der Eigennamenerkennung und Klassifizierung sowie des Dependenzparsings im Einsatz.

2. Literatur

  • Didakowski, J. (2007): SynCoP - Combining Syntactic Tagging with Chunking Using Weighted Finite State Transducers. In: Proceedings of FSMNLP 2007, Potsdam, Germany.
  • Jörg Didakowski und Marko Drotschmann, "Proper Noun Recognition and Classification Using Weighted Finite State Transducers", in: J. Piskorski et al. (Hrsg.), Post-proceedings of the 7th International Workshop FSMNLP 2008, Frontiers in Artificial Intelligence and Applications, Bnd. 191, IOS Press, S.50-61, 2008.
  • Jörg Didakowski, "Local Syntactic Tagging of Large Corpora Using Weighted Finite State Transducers", in: A. Storrer et al. (Hrsg.), Text Resources and Lexical Knowledge -- Selected Papers from the 9th Conference on Natural Language Processing, KONVENS 2008, Mouton de Gruyter, S.65-78, 2008.