API (Schnittstellen zum DWDS)

Überblick

Worthäufigkeit (Frequenzbarometer)

Die Datenbasis für die Worthäufigkeit (Frequenzbarometer) bilden gegenwartssprachliche Korpora für Wörter mit einer Mindestfrequenz von 5. Weitere Informationen finden Sie in der Dokumentation zur Worthäufigkeit.

Um an die Daten für das Frequenzbarometer zu kommen, können Sie die Schnittstelle unter https://www.dwds.de/api/frequency nutzen. Der Parameter q ist dabei das Lemma, dessen Frequenz angezeigt werden soll. Beispiel: https://www.dwds.de/api/frequency/?q=Haus.

Die Schnittstelle liefert JSON mit folgenden Feldern:

q Eingabelemma
total Gesamtanzahl der Tokens in den Korpora
hits Anzahl Treffer passend zum Eingabelemma
frequency Frequenzangabe (Integer zwischen 0 und 6, logarithmische Skala)

Die Worthäufigkeit errechnet sich wie folgt (Perl-Code):

# $hits  == Anzahl der Treffer in Korpora
# $total == Gesamtzahl der Tokens in Korpora
$frequency = log10( $hits / $total * 1_000_000 );

sub log10 {
    my $n = shift;
    return 0 unless $n;
    my $log = log($n) / log(10) + 2;
    return $log < 0  ? 0
         : $log >= 6 ? 6
         :             sprintf('%.0f', $log);
}

Wörterbuchinformationen

Auch wenn wir viele der Daten im Wortauskunftssystem des DWDS aus rechtlichen Gründen nicht für eine API öffnen dürfen, so können doch zumindest rudimentäre Informationen über Wörterbucheinträge abgerufen werden. Der URL https://www.dwds.de/api/wb/snippet bietet die Möglichkeit, die Existenz von Wörterbucheinträgen und (falls vorhanden) Informationen über die Wortart eines Eintrages abzufragen. Der Parameter "q" ist dabei das Lemma, über das Informationen abgefragt werden wollen. Mehrere Lemmata können mittels Trennung durch | (Pipe-Symbol) gleichzeitig abgefragt werden.

Beispiele:

https://www.dwds.de/api/wb/snippet/?q=Haus einfacher Eintrag mit allen Informationen
https://www.dwds.de/api/wb/snippet/?q=Haus|Baum Abfrage mehrere Lemmata
https://www.dwds.de/api/wb/snippet/?q=Bank mehrere Wörterbucheinträge (bei Homografen)
https://www.dwds.de/api/wb/snippet/?q=Ablaß Abfrage mit nicht (mehr) gültiger Schreibung
https://www.dwds.de/api/wb/snippet/?q=Industrieholz Eintrag ohne verzeichnete Wortart
https://www.dwds.de/api/wb/snippet/?q=Krmbmbl kein Eintrag im DWDS-Wörterbuch

Die Schnittstelle liefert eine JSON-Liste mit folgenden Feldern pro entsprechendem Wörterbucheintrag:

input Eingabe
wortart Wortart (Substantiv, Verb etc.), falls verzeichnet (sonst null)
lemma (erste) gültige Schreibung des Eingabelemmas
url URL zur Wortinformationsseite im DWDS

Wortarten im DWDS:

  • Adjektiv
  • Adverb
  • Affix
  • Ausruf
  • Bruchzahl
  • Demonstrativpronomen
  • Eigenname
  • Imperativ
  • Indefinitpronomen
  • Interrogativpronomen
  • Kardinalzahl
  • Komparativ
  • Konjunktion
  • Mehrwortausdruck
  • Ordinalzahl
  • Personalpronomen
  • Possessivpronomen
  • Pronomen
  • Pronominaladverb
  • Präposition
  • Reflexivpronomen
  • Relativpronomen
  • Substantiv
  • Superlativ
  • Verb
  • bestimmter Artikel
  • partizipiales Adjektiv
  • partizipiales Adverb
  • reziprokes Pronomen

Korpusergebnisse exportieren

Korpusergebnisse lassen sich in verschiedenen Formaten exportieren. Als Basis gilt der URL https://www.dwds.de/r, welcher folgende Parameter akzeptiert:

Parameter
q DDC-Abfrage (obligatorisch)
corpus abzufragendes Korpus (Default: kern)
date-start Datumseinschränkung Treffer (Beginn), als Jahreszahl
date-end Datumseinschränkung Treffer (Ende), als Jahreszahl
genre Textklassen (wenn nicht angegeben, werden Treffer aller Textklassen geliefert)
format Format der Treffer:
kwickeyword in context
fullganzer Satz (Default)
maxganzer Satz + jeweils 1 Satz Kontext
sort Sortierung der Treffer:
date_ascnach Datum aufsteigend
date_descnach Datum absteigend (Default)
left_ascnach linkem Token vom Trefferwort aufsteigend
left_descnach linkem Token vom Trefferwort bsteigend
mid_ascnach Trefferwort aufsteigend
mid_descnach Trefferwort absteigend
right_ascnach rechtem Token vom Trefferwort aufsteigend
right_descnach rechtem Token vom Trefferwort absteigend
length_ascnach Beleglänge (Anzahl Tokens) aufsteigend
length_descnach Beleglänge (Anzahl Tokens) absteigend
randomzufällig
limit Anzahl der Treffer (max. 5 000, Default: 50)
p nte Ergebnisseite (beginnend mit 1)
view
csvkommaseparierte Liste für MS Excel etc.
jsonJSON
tcfTCF 0.4
tsvTab-separierte Liste

Beispiele:

https://www.dwds.de/r/?q=Haus&view=csv Treffer 1 bis 50 für Haus aus dem DWDS-Kernkorpus nach Datum absteigend sortiert als CSV
https://www.dwds.de/r/?q=Haus&p=2&view=csv Treffer 51 bis 100 für Haus aus dem DWDS-Kernkorpus nach Datum absteigend sortiert als CSV
https://www.dwds.de/r/?q=Haus&limit=100&view=tsv Treffer 1 bis 100 für Haus aus dem DWDS-Kernkorpus nach Datum absteigend sortiert als TSV

COUNT()-Abfragen

COUNT()-Abfragen lassen sich als tabseparierter (= TSV) oder kommaseparierter (= CSV) Datensatz exportieren.

Aussprache (IPA)

Einige Artikel im DWDS verfügen bereits über eine redaktionell geprüfte Angabe der Aussprache in IPA-Notation. Die Basis für diese Arbeiten im DWDS wird durch die Software gramophone gestellt. Sie können Ausspracheinformationen über die Adresse https://www.dwds.de/api/ipa in Verbindung mit dem obligatorischen Parameter q (max. 20 alphanumerische Zeichen) abfragen. Als Ergebnis wird eine JSON-Datenstruktur als Liste ausgeliefert, mit folgenden Werten:

field data type description
ipa string IPA notation for input
status string "auto": generated by gramophone | "proved": edited by DWDS

Beispielabfragen

Abfrage Erläuterung
https://www.dwds.de/api/ipa/?q=Haus Abfrage für „Haus“, automatisch generierte Angabe:
[
  {"ipa":"ˈhaʊ̯s", "status":"auto"}
]
https://www.dwds.de/api/ipa/?q=Caucus Abfrage für „Caucus“, redaktionelle Angabe:
[
  {"ipa":"ˈkɔːkəs", "status":"proved"}
]
https://www.dwds.de/api/ipa/?q=Boot Abfrage für „Boot“, redaktionelle und automatisch generierte Angabe, jeweils für die entsprechenden Wörter:
[
    {"ipa":"buːt", "status":"proved"},
    {"ipa":"boːt", "status":"auto"}
]

Artikel des Tages

Den Artikel des Tages im DWDS können Sie als Atom-Feed unter der Adresse https://www.dwds.de/api/feed/adt abonnieren.

Neueste Artikel

Die neuesten Artikel im DWDS können Sie als Atom-Feed unter der Adresse https://www.dwds.de/api/feed/latest abonnieren.

DWDS-Themenglossare

Atom-Feed

Die DWDS-Themenglossare können als Atom-Feed abonniert werden:

Folgende URL-Parameter sind möglich:

Parameter Werte Erklärung
type html (Default), text Inhalt von <subtitle> bzw. <summary> als HTML oder Plaintext
view compact, full (Default) alle (full) oder nur glossarspezifische (compact) Lesarten listen, bei compact werden die anderen Lesarten mit ihrer Zählung (z. B. 1., a)) gefolgt von ... angedeutet
sort alpha, date (Default) alphabetische oder nach Datum absteigende Sortierung der Einträge
start Integer, Default: 1 Paging: Nummer des ersten Eintrages (Beginn bei 1)
limit Integer, Default: 1000 Paging: anzuzeigende Einträge pro Seite

JSON

Darüberhinaus lassen sich die Einträge in den DWDS-Themenglossaren als JSON bei entsprechend gesetztem Accept-Header abfragen:

curl -X GET "https://www.dwds.de/themenglossar/Corona" -H "accept: application/json"
curl -X GET "https://www.dwds.de/themenglossar/US-Wahl-2020" -H "accept: application/json"

Folgende Datenstruktur liegt dem zugrunde:

field data type description
date string date of last modification
entries list list of entries
image string image of glossary
name string unique name of glossary
teaser string teaser text of glossary as HTML fragment
title string title of glossary
url string URL of glossary

Innerhalb von entries:

field data type description
form string part of speech (e. g. Substantiv, Adjektiv etc.)
genera list optional, nouns only: list of genera (as string), encoded as der, die oder das
lemma string lemma
toc string list of meanings encoded as HTML fragment
url string URL to dictionary entry in DWDS

Beispiel:

{
  "name": "Corona",
  "url": "https://www.dwds.de/themenglossar/Corona",
  "date": "2020-04-29T14:32:00",
  "image": "https://media.dwds.de/dwds_glossare/corona-4916954_600.jpg",
  "title": "DWDS-Themenglossar zur COVID-19-Pandemie",
  "teaser": "<p>Die COVID-19-Pandemie löst weltweit zahlreiche Prozesse des Wandels aus, [...]</p>",
  "entries": [
    {
      "toc": "<ol style=\"list-style-type:none\"><li>1. (hoher) Grad der Verbreitung eines Krankheitserregers, (hohe) Zahl der Infektionen in einem Gebiet ode
r einer Population; Durchgang eines Krankheitserregers durch eine gesamte Population</li><li>2. [übertragen, abwertend] die flächendeckende Verbreitung eines
als negativ empfundenen Phänomens</li><li>3. [Medizin, veraltet] Ausdehnung eines Krankheitserregers auf den gesamten Körper</li></ol>",
      "genera": [
        "die"
      ],
      "form": "Substantiv",
      "lemma": "Durchseuchung",
      "url": "https://www.dwds.de/wb/Durchseuchung"
    },
    ...
  ]
}

Bitte beachten Sie die Nutzungsbedingungen des DWDS.

dstar

Viele weitere Möglichkeiten zur Recherche und APIs finden Sie in unserer Korpusplattform dstar.

Bitte beachten Sie, dass dort manche Korpora zugangsgeschützt sind. Alle Korpora, die wir frei zur Verfügung stellen können, sind auch auf der Webseite dwds.de zugänglich (z. T. erst nach Login).

Firefox Add-on „Im DWDS nachschlagen“

Diese Browsererweiterung erlaubt die direkte Weiterleitung von Suchanfragen an das digitale Wörterbuch der deutschen Sprache (dwds.de). Sie ermöglicht es, das DWDS als zusätzliche Suchmaschine im Suchfenster auszuwählen sowie beliebige Wörter im Fließtext per Rechtsklick im Wörterbuch nachzuschlagen. Wenn dwds als Erstes in der Adressleiste eingegeben wird, wird ein Link für die Abfrage vorgeschlagen.