Corona-Korpus

Hinweis: Dieses Korpus ist erst nach Anmeldung recherchierbar.

Zur Einführung in die Webkorpora im DWDS …

Zusammenstellung

Das „Corona-Korpus“ des DWDS sammelt Texte deutscher Webseiten, die sich aus unterschiedlichen Blickwinkeln heraus (Medizin, Politik, Philosophie, Gesellschaft) mit der COVID-19-Pandemie beschäftigen und die ab dem Jahr 2018 erschienen sind.

Das Korpus wurde möglichst vielschichtig und ausgewogen zusammengestellt, vor allem im Hinblick auf die Kategorien „Quelle/Land“ und „Genre“. Es beinhaltet

  • primäre Quellen: Texte aus Tages- und Wochenzeitungen (z. B. „Der Freitag“), Magazinen und Online-Magazinen (z. B. „Manager-Magazin“) sowie Nachrichtenquellen (z. B. „Deutschlandfunk“). Es muss eine Verhältnismäßigkeit in Bezug auf die jeweilige Artikelanzahl bestehen.
  • sekundäre Quellen von besonderem Interesse: Texte aus Fachpublikationen („Ärzte Zeitung“ und „Ärzteblatt“) und (in kleinerem Maße) Texte von politisch einseitigen Webseiten. Mit ihnen sind verschiedenste Diskursspektren ausreichend breit abgedeckt (z. B. „Tichys Einblick“ oder „Jungle World“).
  • weitere Online-Quellen: insbesondere Blogs und Podcasts. Sie geben zusätzliche qualitative Einblicke (z. B. literarische Tagebücher oder Podcasts mit Christian Drosten). Hinweise auf neue Textressourcen und Webseiten werden gerne entgegengenommen.

Nutzbarkeit

Mit einer Recherche im „Corona-Korpus“ lassen sich viele interessante Fragen rund um die COVID-19-Pandemie beantworten. Zum Beispiel gibt das Korpus Hinweise darauf, wann ein Wort erstmals in Webtexten erscheint, in welchen Kontexten es häufig genutzt wird oder mit welcher Frequenz es seit 2018 in bestimmten Quellen auftritt.

Sämtliche Quellen können nach vorheriger Anmeldung auf der Website des DWDS durchsucht werden. Die Sammlung ist auch Teil des Metakorpus WebXL. Außerdem kann die Sammlung eigenhändig reproduziert werden. Hier der Link zur Quellenliste: https://github.com/adbar/coronakorpus.

Abfragebeispiele

Videoanleitung: Recherche im DWDS-Corona-Korpus

Top 20 Quellen

# Quelle Seiten
1. welt.de 6 173
2. zdf.de 5 991
3. faz.net 5 894
4. spiegel.de 5 697
5. cash.ch 5 504
6. merkur.de 5 408
7. handelsblatt.com 4 508
8. taz.de 4 078
9. tagesspiegel.de 3 808
10. nzz.ch 3 530
11. n-tv.de 3 040
12. aerzteblatt.de 2 398
13. dw.com 1 946
14. heise.de 1 366
15. manager-magazin.de 1 299
16. fr.de 1 064
17. horizont.net 886
18. aerztezeitung.de 845
19. futurezone.at 813
20. sueddeutsche.de 619

Weitere Informationen