Corona-Korpus

Hinweis: Dieses Korpus ist erst nach Anmeldung recherchierbar.

Das „Coronakorpus“ fokussiert auf deutschsprachige Webseiten zur COVID-19-Pandemie (u. a. aus einer erkenntnistheoretischen, gesellschaftlichen, politischen und wirtschaftlichen Perspektive) und zum Virus (u. a. aus medizinischer Sicht). Auf Basis des zusammengetragenen Materials wird eine Sammlung von Webdokumenten erstellt, die der Öffentlichkeit zugänglich gemacht wird.

Die folgenden Kriterien werden beachtet, um ein Gleichgewicht zwischen den Quellen zu erzeugen, damit das Korpus vielfältig/vielschichtig und grob nach Quelle/Land und bestmöglich nach Genre ausgewogen werden kann.

  • Tages- und Wochenzeitungen (z. B. Der Freitag), Magazine und Online-Magazine (z. B. Manager-Magazin) sowie Nachrichtenquellen (z. B. Deutschlandfunk) werden zu erstrangigen Quellen, dabei muss ein Gleichgewicht im Sinne der Artikelanzahl zwischen einigen Großen/Bekannten bestehen.
  • Einige zusätzliche Quellen kommen dazu, weil sie von besonderem Interesse sind (keine Balance erwünscht: Ärzte Zeitung und Ärzteblatt), und (im einem kleineren Ausmaß) das politische Spektrum besser abdecken, z. B. Tichys Einblick oder Jungle World.
  • Weitere Online-Quellen, insbesondere Blogs, sollen zusätzliche qualitative Einblicke geben, z. B. literarische Tagebücher oder Podcasts mit Christian Drosten.

Die Quellen können auch heruntergeladen und verarbeitet werden.

Hinweise auf neue Textressourcen und Webseiten werden gerne entgegengenommen.

Dieses Korpus ist auch Teil des Metakorpus WebXL.

Weitere Informationen

Coronavirus, aufgenommen mit einem Elektronenmikroskop (Bild von NIAID, CC BY 2.0)

Informationen

Kategorie: Webkorpora
Verfügbarkeit: nach Anmeldung recherchierbar

Statistiken

Dokumente: 42 221
Sätze: 1 944 361
Tokens: 32 140 489
Quellen: 216
Aktualisierung der Quelldaten: 16.06.2020
Korpusindizierung: 15.09.2020

Weitere Statistiken ...

Weitere Tools