Suchmaschine und Suchabfragesprache

Übersicht

Einstieg: Die Suche im Wortauskunftssystem

Beginnen Sie, indem Sie den von Ihnen gesuchten Begriff in die Suchmaske eingeben. Wie von anderen Suchoberflächen gewohnt, spielt dabei Groß-/Kleinschreibung auf dieser Ebene keine Rolle.

Während Sie tippen, wird Ihre Eingabe dynamisch durch Vorschläge aus dem Bestand der im DWDS verzeichneten Begriffe ergänzt, die Sie auswählen können.

Durch die Eingabe Ihres Suchbegriffs bzw. durch die Auswahl eines der Vorschläge aus der Liste gelangen Sie zu den Wortinformationen:

In der Übersicht in der linken Spalte der Webseite finden Sie grammatische Informationen zum gesuchten Begriff, d. h. zur Wortart, zu dessen grammatischem Geschlecht (Genus), ggf. ein (anklickbares) Audiosymbol zur Aussprache sowie Angaben zur Wortzerlegung und -trennung. Darüber hinaus erhalten Sie im Überblick, sofern verfügbar, eine Erläuterung der Bedeutung(en) des Begriffs und dessen sprachgeschichtliche Herkunft (Etymologie), Informationen zu gleichbedeutenden Begriffen und Gegenwörtern (Synonymen und Antonymen, Thesaurus), zu typischen Verbindungen, in denen der Begriff in den DWDS-Korpora erscheint sowie zu den im DWDS verzeichneten Wortbildungen.

In der rechten Spalte finden Sie Angaben zur Worthäufigkeit und der zeitlichen Verteilung der Treffer anhand einer Wortverlaufskurve, Verweise auf bestehende Einträge in den im DWDS verfügbaren „Älteren Wörterbüchern“ (¹DWB und WDG) sowie zu den absoluten Belegzahlen in verschiedenen DWDS-Korpora.

Korpussuche im DWDS

Alle Korpora des DWDS werden für die Suche linguistisch aufbereitet und durch die Suchmaschine DDC indiziert. Die Suche liefert ganze Sätze als Ergebnisse. Dies ermöglicht eine Vielzahl spezialisierter und komplexer Korpusabfragen, die in unten stehender Schnellübersicht anhand beispielhafter Suchen erläutert werden.

Schnellübersicht

Sucheingabe Bemerkung
Haus lexembasierte Suche
@Haus exakte Wortform
Haus* Präfixsuche
*haus Suffixsuche
*haus* Präfix- und Suffixsuche
/haus/ regulärer Ausdruck (Regex)
/haus/i Regex case-insensitiv
{Haus,Hof} Tokens als Menge
Haus && Hof Und-Suche
Haus || Hof Oder-Suche
Haus && !Hof Negation
"ein Haus" Wortgruppe
"ein #2 Haus" Phrase mit Abstand (maximal 2)
"ein #>2 Haus" Phrase mit Abstand (mehr als 2)
"ein #=2 Haus" Phrase mit Abstand (genau 2)
near(gut,Beispiel,5) Abstandssuche ohne best. Reihenfolge
$p=ADJ* POS-Abfrage
sein with $p=VV* Index-Abfrage
Haus with $.=0 Satzanfang
Haus with $.=-1 Satzende

Erweiterte Suche in den Korpora des DWDS

Formularbasierte Suche

Die wichtigsten Parameter zur Verfeinerung der Suche sind über eine Eingabemaske wählbar. Beispielsweise kann die Anfrage auf bestimmte Korpora und einen bestimmten Zeitraum eingeschränkt werden. Für die Anzeige der Korpustreffer stehen verschiedene Kontextoptionen zur Verfügung: Anzeige im kompakten Format „Keyword In Context“ (KWIC), welche das Schlüsselwort im Kontext seiner nächsten linken und rechten Nachbarn zeigt, Anzeige ganzer Sätze (voll) oder Anzeige des Belegsatzes gemeinsam mit dessen vorhergehenden und nachfolgenden Satz (maximal). Die Treffer können nach unterschiedlichen Kriterien sortiert werden, zudem kann eine Anzeige zwischen 10 und 100 Treffern pro Seite ausgewählt werden:

Direkte Eingabe von Suchausdrücken

Über die wählbaren Optionen in der Eingabemaske hinaus können Sie Ihre Suchanfrage verfeinern, indem Sie weitere Parameter entsprechend der Syntax der Suchmaschine DDC in den Suchschlitz eintragen. Die hier beispielhaft erläuterte Suche "{von,der,im,am} WITH $.=0 @Anfang ist #2 $p=NN" && !Wort" kombiniert verschiedene Parameter und Optionen:

Zunächst ist der erste Teil der Anfrage durch die ihn umgebenden Anführungszeichen als Suche nach einer Phrase (Wortgruppe) gekennzeichnet, d. h. dass der gesuchte Satz alle innerhalb der Anführungszeichen aufgeführten Begriffe in der gegebenen Reihenfolge enthalten muss.

Für die erste Position der Phrase wurden die Suchbegriffe „von“, „der“, „im“ und „am“ in geschweiften Klammern {} als alternative Treffer zusammengefasst (s. „Tokens als Menge“). Durch die Kombination mit WITH $.=0 wird zusätzlich festgelegt, dass der Treffer am Beginn des Satzes stehen muss (genauer gesagt, dass der Treffer einen Abstand von exakt 0 Tokens zum Satzanfang aufweisen soll, s. „Satzanfang“).

Die zweite Position der Phrase @Anfang ist durch das vorangestelle @-Zeichen auf die exakte Wortform „Anfang“ festgelegt, d. h. die abgeleiteten Formen „Anfangs“, „Anfange“, „Anfänge“, „Anfängen“ usw. werden ausgeschlossen (s. „exakte Wortform“).

Die dritte Position enthält den Suchbegriff „ist“, der ohne weitere Einschränkung (s. „lexembasierte Suche“) notiert ist, weshalb sowohl der eingegebene Begriff „ist“, aber auch weitere Formen des Lemmas „sein“, z. B. „bin“, „warst“, „gewesen“ usw. als Treffer gekennzeichnet werden.

#2 definiert den Abstand zwischen dem vorhergehenden und dem nachfolgenden Token auf maximal 2 Tokens (s. „[...] Abstand (maximal) [...]“).

An letzter Position der Phrase steht eine Part-of-Speech- oder kurz POS-sensitive Suche, d. h. eine Suche nach einer bestimmten Wortart anstelle eines bestimmten Begriffs. Mit $p=NN wird nach einem beliebigen (normalen) Nomen gesucht, für weitere mögliche Werte siehe das Stuttgart-Tübingen-TagSet (STTS).

Der der Phrase durch && hinzugefügte Begriff „Wort“ ist durch das vorangestellte Ausrufezeichen ! negiert worden (s. „Negation“), d. h. der Satz soll die gesuchte Phrase UND nicht den Begriff „Wort“ enthalten, wodurch etwa die Fügung „Im Anfang war das Wort“ ausgeschlossen wird.

Es empfiehlt sich, zunächst einfache Suchanfragen zu stellen und diese dann nach und nach mit weiteren Suchbegriffen, Operatoren und Parametern zu erweitern. Zur Vertiefung lohnt sich jederzeit der Blick in die technisch-formale Definition der DDC-Abfragesyntax (in englischer Sprache).

Count-Abfragen

Mittels Count-Abfragen können Sie Zahlen über die Ergebnisse von Korpussuchen erhalten. Dabei besteht auch die Möglichkeit, nach diversen Kriterien zu gruppieren. Eine Count-Abfrage gestaltet sich nach dem Muster

COUNT ( query_conditions ) count_by

query_conditions ist dabei die DDC-Abfrage über Korpora, so wie oben in diesem Dokument beschrieben. Sie können in count_by mittels der Syntax #by[key[,...]] optionale Angaben zur Gruppierung machen. Folgende Möglichkeiten stehen zur Verfügung:

Weiterführende Informationen