Suchmaschine DDC Morphologie PoS-Tagger LexikoNet |
PoS-TaggerDer im Projekt DWDS verwendete PoS-Tagger wurde von Bryan Jurish, gefördert vom Wolfgang-Paul Preis Projekt Kollokationen im Wörterbuch, entwickelt. Es handelt sich dabei um ein statistisches Verfahren zur Disambiguierung lexikalischer Klassen. Zusätzlich zu den klassischen Bigramm/Trigramm-basierten Tagging Routinen berücksichtigt dieses Verfahren benutzerdefinierte a-priori Mengen von möglichen Analysen (sog. lexikalische Klassen) für jedes Eingabewort. Hierdurch ist es möglich, die vom Tagger vergebenenen Analysen auf die von der Morphologie vorgeschlagenen lexikalischen Kategorien zu beschränken. Im Vergleich zu einem traditionellen Hidden-Markov-Model führt dieses Verfahren zu einer Fehlerreduktion von bis zu 21%.
|