Statistische Auswertungen

Wortverlaufskurven

Die Häufigkeit, mit der ein Wort im Lauf der Zeit verwendet wird, verändert sich: Sie kann zunehmen (Beispiele: Stress, Demografie) oder abnehmen oder das Wort kann sogar ganz außer Gebrauch geraten (Beispiele: Backfisch, baldigst). Häufig wird ein Wort auch allmählich durch ein anderes ersetzt; so reichen mittlerweile die Sneakers in ihrer Häufigkeit fast an die Turnschuhe heran.

Mit dem Werkzeug „Wortverlaufskurven“ können solche Veränderungen in verschiedenen Korpora nachgezeichnet werden. Die drei wichtigsten Korpora sind:

Das Korpus können Sie wählen, wenn Sie ein Wort in das Texteingabefeld eingegeben haben, beispielsweise das Wort Turnschuh, und dann zum Vergleich über ein weiteres Eingabefeld das Wort Sneaker.

Vergleich: „Turnschuhe“ vs. „Sneakers“
Vergleich: Turnschuhe vs. Sneakers

DWDS-Wortprofil

Wörter treten oft gehäuft mit anderen Wörtern auf – man spricht hier von Kookkurrenzen. Manchmal ergeben sich daraus gängige Gebrauchsmuster wie in Strömen regnen, verfehlte Politik, Zeit schinden oder Arbeit suchen. Es kann aber auch eine neue Bedeutung durch die Kombination der Wörter entstehen, die sich aus der Bedeutung der einzelnen Bestandteile nicht herleiten lässt: Ein schräger Vogel ist weder schräg im Sinne von zur Seite geneigt noch wirklich ein Vogel.

Kookkurrenzen lassen sich aus großen Textkorpora automatisch extrahieren. Viele dieser Kookkurrenzen, wie etwa 70. Geburtstag, Jägerstr. 22 oder Tourismus Ägypten, sind sprachlich nicht weiter relevant. Es ist daher notwendig, sprachlich bedeutsame Wortverbindungen, sogenannte Kollokationen, herauszufiltern (vgl. Kollokation, Lesart 1). Im Rahmen des DWDS wurden zwei Software-Werkzeuge entwickelt, die diese Extraktionsaufgaben für zwei unterschiedliche Szenarien leisten: das DWDS-Wortprofil und DiaCollo.

Das DWDS-Wortprofil liefert einen Überblick darüber, welche Wörter mit welchen anderen besonders häufig vorkommen, und zwar in Tabellenform oder in Form einer einfachen und anschaulichen „Wortwolke“. Bei der ersteren wird nach grammatischen Funktionen unterschieden, z. B. Attribut-Nomen-Verbindungen wie schöne Bescherung oder Verb-Objekt-Beziehungen wie Flasche entkorken.

Basis des DWDS-Wortprofils ist ein knapp 3 Mrd. Tokens umfassendes Zeitungskorpus aus überregionalen Tages- und Wochenzeitungen.

DWDS-Wortprofil zu „Zeit“, Relation „hat Prädikativ“
DWDS-Wortprofil zu Zeit, Relation hat Prädikativ

DiaCollo – Kollokationsanalyse in diachroner Perspektive

Mit DiaCollo kann man untersuchen, wie sich die Häufigkeiten im gemeinsamen Vorkommen von Wörtern ändern. Beispielsweise waren die typischen Wortnachbarn von nachhaltig in den 1950er Jahren Wirkung und Eindruck. In den 1980er Jahren kamen dann Wörter wie Aufwärtsbewegung oder Wachstum hinzu, und seit den 2000er Jahren finden sich auch sehr oft Wörter wie Tourismus oder Landwirtschaft in Verbindung mit nachhaltig.

DiaCollo kann für die meisten DWDS-Korpora ohne Zugangsbeschränkung genutzt werden. Näheres finden Sie in der Übersicht über die Korpora im DWDS.

Für DiaCollo liegt bislang nur eine experimentelle Nutzeroberfläche vor. Starten Sie die Animation des zeitlichen Verlaufs durch Klick auf den Abspiel-Button.

DiaCollo zu „nachhaltig“
DiaCollo zu nachhaltig

Hinweise zum Vergleich DWDS-Wortprofil vs. DiaCollo

DiaCollo bietet auf der einen Seite mehr als das Wortprofil, weil es zeitliche Veränderungen erfasst; daher ist es beispielsweise für HistorikerInnen oder PolitikwissenschaftlerInnen von besonderem Interesse. Auf der anderen Seite bietet DiaCollo auch weniger als das Wortprofil, weil es die Texte nicht grammatisch voranalysiert und damit nicht nach grammatischer Funktion differenziert. Sprachwissenschaftliche Fragen wie „Welches Verb kommt bevorzugt mit welchem Objekt vor?“ lassen sich daher nur mit dem Wortprofil analysieren.