Der deutsche Wortschatz von 1600 bis heute.

Webkorpus Ballsportarten

Hinweis: Dieses Korpus ist erst nach Anmeldung recherchierbar.

Zur Einführung in die Webkorpora im DWDS …

Ziel des Webkorpus Ballsportarten ist es, ballsportbezogene deutschsprachige Inhalte im Internet linguistisch erforschbar zu machen. In einer ersten Version fasst es zunächst Seiten zum Fußball zusammen. Das Korpus umfasst momentan 638 447 Dokumente mit ca. 375 Millionen Wörtern.

Fußball ist im deutschsprachigen Raum seit vielen Jahrzehnten die beliebteste Sportart und ist damit – hier wie in vielen anderen Ländern weltweit – ein kulturelles Phänomen mit gesamtgesellschaftlichem Einfluss. Fußball ist sowohl für die gesellschaftliche Identität als auch für viele persönliche Identitäten mitbestimmend: diese Sportart stellt einen wesentlichen Lebensmittelpunkt vieler Menschen dar, sei es in der Ausübung des Sports oder als Fan einer Mannschaft. Entsprechend umfangreich sind die im Internet verfügbaren Inhalte zum Thema Fußball.

Um der gesellschaftlichen Bedeutung des Fußballs bei der Textauswahl für das Webkorpus gerecht zu werden, steht das Bemühen im Vordergrund, eine möglichst breite, die gesellschaftliche Bedeutung spiegelnde Textsammlung verfügbar zu machen. So finden sich im Korpus zum einen Fußball-Institutionen: internationale, nationale und regionale Verbände, Fußballligen und -vereine. Es finden sich darüber hinaus allgemeine und spezialisierte Nachrichtenseiten und Magazine, vereinsnahe Fanzines und Blogs. Auch Blogs, die sich bestimmten Aspekten – sportlichen, politischen, gesellschaftlichen etc. – des Fußballs widmen, sei es im Bezug auf Fußballregeln, Fankultur, Polizeigewalt, Frauenfußball, Homosexualität im Fußball etc. sind Teil des Korpus. Eingang fanden auch spezialisierte Seiten, Portale und Foren, die sich etwa dem Transfermarkt, bestimmten Vereinen oder Spieltaktiken widmen und viele andere Inhalte, in deren Mittelpunkt das Thema Fußball in einer seiner vielen Formen steht.

Dieses Korpus ist auch Teil des Metakorpus WebXL.

Weitere Informationen

Allgemeine Informationen zu den Webkorpora

Korpusübersicht

N. B.: Die folgenden Links setzen einen Login im DWDS voraus:

Relevante Publikation

  • Adrien Barbaresi (2019): The Vast and the Focused: On the need for domain-focused web corpora. In: Proceedings of CMLC-7, Mannheim, pp. 29–32, DOI: 10.14618/ids-pub-9025.