WDG
Mit
dem WDG wurden "neue Maßstäbe für die
einsprachige Lexikographie der deutschen
Gegenwartssprache gesetzt"
(H. E. Wiegand, in: HSK 5,2 1990, S. 2130).
Inhalt:
1. Kurzinformation zum WDG
2. Ein kurzer Abriß der Geschichte des digitalen WDG
1. Kurzinformation zum WDG
Das
Wörterbuch der deutschen Gegenwartssprache (WDG) wurde in Berlin an der
Deutschen Akademie der Wissenschaften (ab Oktober 1972: Akademie der
Wissenschaften der DDR) zwischen 1952 und 1977 erarbeitet. Das WDG
umfasst über 4.500 Seiten und enthält 60.000 bzw. unter Hinzunahme der
Komposita 90.000 Stichwörter.
Nach einer knapp
zehnjährigen Vorbereitungsphase erschien 1961 die erste
Doppellieferung, 1964 der erste Band. Die weiteren fünf Bände wurden in
erster Auflage (Bd. 2:) 1967, (Bd. 3:) 1969, (Bd. 4:) 1974, (Bd. 5:)
1976 und (Bd. 6:) 1977 veröffentlicht. Die einzelnen Lieferungen und
Bände wurden in den Folgejahren mehrfach neu aufgelegt und dabei
teilweise auch überarbeitet. Die recherchierbare Ausgabe entspricht bis
auf den ersten Band (3. Aufl. 1967) der Erstausgabe.
Schon
während seines Erscheinens wurde das WDG zum Vorbild neuer
gegenwartssprachlicher Wörterbücher anderer Verlage. Das WDG versteht
unter deutscher Gegenwartssprache "außer der so charakterisierten,
heute geschriebenen und gesprochenen Sprache der bildungstragenden
Schicht auch die Sprache der in unserer Zeit noch gelesenen, lebendigen
deutschen Literatur der Vergangenheit" (Vorwort zu Bd. 1, S. 04).
Deshalb zählten zum Quellenbestand, der der Ausarbeitung der
Wörterbuchartikel zugrunde lag, nicht nur die wichtigsten
Gegenwartsautoren des ganzen deutschen Sprachbereichs bis in die
siebziger Jahre des 20. Jahrhunderts, sondern auch zahlreiche ältere
Texte deutscher Autoren seit Lessing und Kant. Genaue Auskunft darüber
gibt das alphabetische Verzeichnis der Quellen (Bd. 6, S. 4559 - 4579).
Die
Vorbemerkung zum 4. Band erläutert eine den Herausgebern und den
Autoren im Jahr 1970 auferlegte einschneidende Änderung der Konzeption
des WDG: "Es wird vom 4. Band an den gesamten Wortschatz konsequent auf
der Grundlage der marxistisch-leninistischen Weltanschauung darstellen.
Das gilt für die Auswahl der Stichwörter, für die Bedeutungsangaben,
die kommentierenden Bemerkungen und auch für die Auswahl der Beispiele"
(Bd. 4, S. II). Dieser Forderung entsprechende Änderungen von
Stichwörtern, semantischen Angaben und anderen Einträgen wurden durch
den neuen Beirat des WDG (s. Bd. 4, Titelei) auch in den Neuauflagen
älterer Lieferungen veranlasst. Bezogen auf den Gesamtwortschatz ist
der Anteil ausgeprägt DDR-konformer Einträge jedoch vergleichsweise
gering geblieben. Im Nachhinein gewinnen viele Stichwortansätze und die
einschlägigen semantischen Auskünfte insbesondere der späteren Bände
des WDG durch das deutliche Bekenntnis zur offiziellen Sprache der DDR
nicht nur spezifischen Aussagewert, sondern auch geschichtliches (und
lexikographie-historisches) Interesse. Der Benutzer darf allerdings
nicht außer Acht lassen, daß die offizielle Sprache der DDR – außer im
engeren Bereich DDR-typischer Bezeichnungen – nicht ohne weiteres mit
der wirklichen Sprache ihrer Bevölkerung identisch war.
2. Ein kurzer Abriß der Geschichte des digitalen WDG
Februar 2002 - November 2002
Die
BBAW als Rechteinhaberin an den elektronischen Rechten des WDG vergibt
den Auftrag zur elektronischen Erfassung des WDG an das Kompetenzzentrum
der Universität Trier. Das WDG wird zwischen Mai und Juli 2002 in China
digital erfasst, von August und November nachkorrigiert und in XML
gemäß den Empfehlungen der Text Encoding Initiative (tei)
vorstrukturiert (Ende Oktober 2002).
Dezember 2002 - Februar 2003
Das Projekt "Digitales Wörterbuch" übernimmt die Nachstrukturierung, Datenhaltung und elektronische Veröffentlichung des WDG.
Die
erste und wichtigste Korrektur besteht in der Nachstrukturierung aller
Komposita des WDG, da diese bei der automatisch erstellten
Vorstrukturierung in mehreren tausend Fällen zur Generierung von
falschen Komposita führte. Hintergrund dieser Problematik sind die
eingebetteten Komposita, die im WDG nicht ausgeschrieben, sondern nur
einmal als Präfix bzw. dann für jedes Kompositum als Suffix aufgeführt
werden. Ein Hauptproblem für die "Ausmultiplizierung" der Komposita
stellt die Mehrfacheinbettung dar. Aus diesem Grunde wurden die
automatisch generierten Komposita (etwa 30.000) noch einmal per Hand
überprüft und der xml/tei Annotierung als Attribut ("key") des Elements
("entry") hinzugefügt.
18. März 2003
Veröffentlichung der
elektronischen Version des WDG auf der Website des Projekts DWDS. Die
xml/tei-Quelldaten werden dabei über Perl und XSLT-Scripte in ein
browserfreundliche html-Format transformiert. Etwa 60.000 Einträge sind
über die Maske abfragbar. Nimmt man die Komposita hinzu, so kommt man
auf die Anzahl von 90.000 Einträgen.
Mai 2003
Das
elektronische WDG wird an Leo angebunden. Jedem Nutzer
von Leo steht somit das WDG als Nachschlagewerk zur Verfügung.
April 2005
Im Rahmen des Projekts PoM
der Akademie wurde das Quellenverzeichnis des WDG (ca. 1000 Werke)
digital erfaßt. Darüber hinaus wurde eine Verknüpfung aller
Beispielsätze im Wörterbuch mit dem Quellenverzeichnis vorgenommen. Es
ist dadurch möglich, von allen Siglen direkt zur entsprechenden
Quellenangabe zu springen.
Die WDG Daten werden in der XML-Datenbank
eXist vorgehalten. Somit sind komplexere, auf XQuery beruhende Anfragen
an das WDG möglich.
Mai 2005
Weitere Annotierungen des
WDG kommen hinzu. Das WDG enthält etwa 40.000 "dazu"-Komposita. Diese
wurden halbautomatisch vorannotiert und dann noch einmal komplett per
Hand nachkorrigiert bzw. in der xml/tei Annotierung als Attribut
("key") des Elements ("entry") hinzugefügt.
Die Anzahl der online abfragbaren Stichwörter erhöht sich dadurch um rund 40.000 auf insgesamt knapp 130.000 Stichwörter.
August 2005
1956
Einträge (Derivationen, wie z.B. Radikalität <- radikal) des
elektronischen WDG wurden annotiert und sind somit abfragbar.
Zusätzlich wurden 3765 derivierte Einträge mit ihren Simplizia
verknüpft und sind damit einheitlich abfragbar, z.B. Raffinierung und
raffinieren.
Mai 2006
Nach längerer Zeit mit
Serverproblemen bei der WDG-Abfrage mit der xml-Datenbank eXist sind
wir zu einer einfachen MySQL-Abfrage des DWDS zurückgekehrt. Für jedes
der ca. 130.000 abfragbaren Stichwörter werden die Stellen des
Wörterbuchs zurückgegeben, in denen das Stichwort erwähnt ist. Bei
Querverweisen kann ein Stichwort an bis zu sieben verschiedenen Stellen
im WDG aufgeführt werden.
Juni 2006
Einige kleinere Korrekturen werden an digitalen Quellen des WDG und der Abfrage vorgenommen:
- Alle Varianten, die im WDG in Klammern gesetzt sind, werden ausgeschrieben und sind somit explizit in der elektronischen Stichwortliste
abfragbar. Ein Beispiel hierfür ist "Geleis(e)", welches nunmehr sowohl
als Geleis wie auch Geleise abfragbar ist.
- Mehrere hundert
bezüglich der Groß-/Kleinschreibung ambig generierter Komposita werden
disambiguiert. Beispielsweise findet man unter dem Stichwort "Aal-,
aal" sowohl das Substantiv Aalfang wie auch das Adjektiv aalglatt.
Für die elektronische Variante wurden diese als "Aalfang aalfang" bzw.
"aalglatt Aalglatt" generiert. Unter Einsatz der TAGH-Morphologie werden derzeit alle falschen Varianten (d.h. aalfang und Aalglatt) aus dem Stichwortbestand eliminiert.