API (Schnittstellen zum DWDS)

Überblick

Frequenzbarometer

Die Datenbasis für die Worthäufigkeit (Frequenzbarometer) bilden gegenwartssprachliche Korpora (DWDS-Kernkorpus und Zeitungen).

Die bibliografische Datenbank des DWDS-Kernkorpus finden Sie hier: https://www.dwds.de/r/bibl.

Zeitungen sind:

  • Berliner Zeitung (1994 bis 2005)
  • Tagesspiegel (1996 bis 2005)
  • Die ZEIT (1946 bis 2016)

Die Worthäufigkeit errechnet sich wie folgt (Perl-Code):

# $hits  == Anzahl der Treffer in Korpora
# $total == Gesamtzahl der Tokens in Korpora
$frequency = log10( $hits / $total * 1_000_000 );

sub log10 {
    my $n = shift;
    return -2 unless $n;
    my $log = log($n) / log(10);
    return $log < -2 ? -2
         : $log >= 4 ?  4
         :              sprintf('%.0f', $log);
}

Um an die Daten für das Frequenzbarometer zu kommen, können Sie die Schnittstelle unter https://www.dwds.de/api/frequency nutzen. Der Parameter "q" ist dabei das Lemma, dessen Frequenz angezeigt werden soll. Beispiel: https://www.dwds.de/api/frequency?q=Haus.

Die Schnittstelle liefert JSON mit folgenden Feldern:

q Eingabelemma
total Gesamtanzahl der Tokens in den Korpora
hits Anzahl Treffer passend zum Eingabelemma
frequency Frequenzangabe (Integer zwischen 0 und 6)

Wörterbuchinformationen

Auch wenn wir viele der Daten im Wortauskunftssystem des DWDS aus rechtlichen Gründen nicht für eine API öffnen dürfen, so können doch zumindest rudimentäre Informationen über Wörterbucheinträge abgerufen werden. Der URL https://www.dwds.de/api/wb/snippet bietet die Möglichkeit, die Existenz von Wörterbucheinträgen und (falls vorhanden) Informationen über die Wortart eines Eintrages abzufragen. Der Parameter "q" ist dabei das Lemma, über das Informationen abfragt werden wollen. Mehrere Lemmata können mittels Trennung durch | (Pipe-Symbol) gleichzeitig abgefragt werden.

Beispiele:

https://www.dwds.de/api/wb/snippet?q=Haus einfacher Eintrag mit allen Informationen
https://www.dwds.de/api/wb/snippet?q=Haus|Baum Abfrage mehrere Lemmata
https://www.dwds.de/api/wb/snippet?q=Bank mehrere Wörterbucheinträge (bei Homografen)
https://www.dwds.de/api/wb/snippet?q=Ablaß Abfrage mit nicht (mehr) gültiger Schreibung
https://www.dwds.de/api/wb/snippet?q=Industrieholz Eintrag ohne verzeichnete Wortart
https://www.dwds.de/api/wb/snippet?q=Krmbmbl kein Eintrag im DWDS-Wörterbuch

Die Schnittstelle liefert eine JSON-Liste mit folgenden Feldern pro entsprechendem Wörterbucheintrag:

input Eingabe
wortart Wortart (Substantiv, Verb etc.), falls verzeichnet (sonst null)
lemma (erste) gültige Schreibung des Eingabelemmas
url URL zur Wortinformationsseite im DWDS

Korpusergebnisse exportieren

Korpusergebnisse lassen sich in verschiedenen Formaten exportieren. Als Basis gilt der URL https://www.dwds.de/r, welcher folgende Parameter akzeptiert:

Parameter
q DDC-Abfrage (obligatorisch)
corpus abzufragendes Korpus (Default: kern)
date-start Datumseinschränkung Treffer (Beginn), als Jahreszahl
date-end Datumseinschränkung Treffer (Ende), als Jahreszahl
genre Textklassen (wenn nicht angegeben, werden Treffer aller Textklassen geliefert)
format Format der Treffer:
kwickeyword in context
fullganzer Satz (Default)
maxganzer Satz + jeweils 1 Satz Kontext
sort Sortierung der Treffer:
date_ascnach Datum aufsteigend
date_descnach Datum absteigend (Default)
left_ascnach linkem Token vom Trefferwort aufsteigend
left_descnach linkem Token vom Trefferwort bsteigend
mid_ascnach Trefferwort aufsteigend
mid_descnach Trefferwort absteigend
right_ascnach rechtem Token vom Trefferwort aufsteigend
right_descnach rechtem Token vom Trefferwort absteigend
length_ascnach Beleglänge (Anzahl Tokens) aufsteigend
length_descnach Beleglänge (Anzahl Tokens) absteigend
randomzufällig
limit Anzahl der Treffer (max. 5 000, Default: 50)
p nte Ergebnisseite (beginnend mit 1)
view
csvkommaseparierte Liste für MS Excel etc.
jsonJSON
tcfTCF 0.4
tsvTab-separierte Liste

Beispiele:

https://www.dwds.de/r?q=Haus&view=csv Treffer 1 bis 50 für "Haus" aus dem DWDS-Kernkorpus nach Datum absteigend sortiert als CSV
https://www.dwds.de/r?q=Haus&p=2&view=csv Treffer 51 bis 100 für "Haus" aus dem DWDS-Kernkorpus nach Datum absteigend sortiert als CSV
https://www.dwds.de/r?q=Haus&limit=100&view=tsv Treffer 1 bis 100 für "Haus" aus dem DWDS-Kernkorpus nach Datum absteigend sortiert als TSV

Wort des Tages

Das Wort des Tages im DWDS können Sie als Atom-Feed unter der Adresse https://www.dwds.de/api/feed/adt abonnieren.