Digitales Wörterbuch Kooperationen Publikationen |
Das Projekt Digitales WörterbuchDas "Digitale Wörterbuch" ist ein Projekt der BBAW. Ziel ist die Erstellung eines digitalen Wörterbuchsystems auf der Grundlage sehr großer und ausgewogener elektronischer Corpora. Ausgangslage Es
gibt kein Wörterbuch der deutschen Sprache, das den Wortschatz des
20./21. Jahrhunderts befriedigend darstellt. Im Vergleich mit den
Kultursprachen Französisch und Englisch wird dieses Defizit besonders
deutlich. Das DWDS will diesen Zustand mit Hilfe der neuen Datentechnik
schrittweise überwinden. Das Ergebnis wird kein gedrucktes Wörterbuch,
sondern ein Digitales Wörterbuchsystem sein, aus dem Informationen
gezielt 'online' abgefragt werden können.
Das Projekt soll in
drei aufeinanderfolgenden Etappen realisiert werden: der Textcorpuserstellung, der computerlinguistischen
Erschließung sowie der anschließenden lexikographischen Arbeit. Der
derzeitige Stand umfasst eine XML-kodierte und linguistisch
aufbereitete Corpus-Datenbank, die aus einem über die Dekaden und
Textsorten ausgewogenen 'Kerncorpus' (80.000 Dokumente) und einem
'Ergänzungscorpus' (2,5 Millionen Dokumente) besteht. Mit dem
DWDS-Kerncorpus steht der Sprachforschung und allen
Sprachinteressierten zum ersten Mal ein dem British National Corpus
(BNC) in Auswahl und Erschließung zumindest ebenbürtiges
deutschsprachiges Textcorpus zur Verfügung. |