Anmelden     Home    Kontakt    Impressum 
 




Testen Sie jetzt die Beta von DWDS 2.0
DWDS · Corpuserschliessung · PoS-Tagger                      Hilfe  


Suchmaschine DDC

Morphologie

PoS-Tagger

LexikoNet

 

PoS-Tagger

Der im Projekt DWDS verwendete PoS-Tagger wurde von Bryan Jurish, gefördert vom Wolfgang-Paul Preis Projekt Kollokationen im Wörterbuch, entwickelt.

Es handelt sich dabei um ein statistisches Verfahren zur Disambiguierung lexikalischer Klassen. Zusätzlich zu den klassischen Bigramm/Trigramm-basierten Tagging Routinen berücksichtigt dieses Verfahren benutzerdefinierte a-priori Mengen von möglichen Analysen (sog. lexikalische Klassen) für jedes Eingabewort. Hierdurch ist es möglich, die vom Tagger vergebenenen Analysen auf die von der Morphologie vorgeschlagenen lexikalischen Kategorien zu beschränken. Im Vergleich zu einem traditionellen Hidden-Markov-Model führt dieses Verfahren zu einer Fehlerreduktion von bis zu 21%.


Jurish, B., "A Hybrid Approach to Part-of-Speech Tagging",
  Final report, Project Kollokationen im Wörterbuch,
  Berlin-Brandenburgische Akademie der Wissenschaften, Berlin. pdf
 
Jurish, B., "Part-of-Speech Tagging with Finite State
  Morphology", Poster presented at the conference
  Collocations and Idioms: Linguistic, Computational,
  and Psycholinguistic Perspectives , Berlin, 18.--20.
  September, 2003. pdf