DTA-Kernkorpus (1598–1913)

Das Deutsche Textarchiv (DTA) stellt einen disziplinen- und gattungsübergreifenden Grundbestand deutschsprachiger Texte mit einem Schwerpunkt ab dem frühen 16. bis zum frühen 20. Jahrhundert bereit. Hauptziel des von der Deutschen Forschungsgemeinschaft (DFG) von 2007 bis 2016 geförderten Projekts war die Erstellung des sog. DTA-Kernkorpus. Dieses DTA-Kernkorpus umfasst etwa 1500 Titel aus dem Zeitraum von ca. 1600 bis 1900, die aufgrund ihrer herausragenden Bedeutung für die Entwicklung der deutschen Sprache bzw. der jeweiligen Genres und wissenschaftlichen Disziplinen ausgewählt wurden (weitere Informationen zur Textauswahl). Unter anderem aufgrund des sprachgeschichtlichen Fokus des DTA und um den historischen Sprachstand möglichst genau abzubilden, wurden dabei als Vorlage für die Digitalisierung in der Regel die historischen Erstausgaben ausgewählt (Auswahl der Exemplare für die Digitalisierung).

Über das DTA-Kernkorpus hinaus integriert das Deutsche Textarchiv eine Vielzahl weiterer Texte aus dem Zeitraum etwa von der Mitte des 15. bis etwa zur Mitte des 20. Jahrhunderts als DTA-Erweiterungen (DTAE), die aus kooperierenden Projekten und weiteren externen Quellen stammen. Dieses Erweiterungskorpus ist auf einer separaten Seite dokumentiert.

Das DTA-Kernkorpus und die DTA-Erweiterungen sind darüberhinaus gemeinsam als Metakorpus recherchierbar.

Weitere Informationen

Informationen

Kategorie: Referenzkorpora
Verfügbarkeit: frei recherchierbar

Statistiken

Dokumente: 1 467
Sätze: 6 153 281
Tokens: 150 959 477
Aktualisierung der Quelldaten: 04.09.2020
Korpusindizierung: 05.09.2020

Weitere Statistiken ...

Weitere Tools