Bei der OA-Transformation lag bisher das Hauptaugenmerk auf Artikeln und, mit einigem Abstand, Büchern. Auf der anderen Seite findet sich im Open-Data-Bereich Forschungsdatenmanagement. Dieser Vortrag wird das Projekt „Open Text Collections“ (OTC) vorstellen, das diese beiden Ansätze verbindet und Texte aus (bedrohten) Sprachen als Forschungsdaten begreift und sie strukturiert und versioniert unter einer offenen Lizenz zugänglich macht. Neben Wörterbuch und Grammatik stellen Textsammlungen das dritte Element der sogenannten Boas’schen Trilogie der Sprachbeschreibung dar. Während für Grammatiken und Wörterbücher bereits gute OA-Möglichkeiten existieren, sind Textsammlungen eher ein Stiefkind des linguistischen Publikationswesens. Weiterhin sind Textsammlungen zwar natürlich Texte, auf der anderen Seite aber auch hochstrukturierte Daten mit Satz-für-Satz- und Wort-für-Wort-Übersetzungen mit standardisierten Glossierungen. OTC speichert die Daten daher im Backend versioniert als CSV, stellt aber verschiedene Schnittstellen bereit, um die Daten zielgruppengereicht anzubieten. Dazu gehörten ein HTML-Frontend mit ElasticSearch, JSON und Print-on-Demand-Bücher. Kuratiert wird OTC von 5 Regional Boards mit einem Schwerpunkt am Endangered Language Archive an der Berlin-Brandenburgischen Akademie der Wissenschaften. Als Publikationspartner dient der renommierte Open-Access-Verlag Language Science Press. Hierbei wird auf bewährte Prinzipien des Scholar-Led- und Community-based-Publishing sowie der konsortialen Finanzierung zurückgegriffen. Die Plattform Open Text Collections weist neue Wege für die Umsetzung von Open-Access-Prinzipien, über den engen Rahmen von Zeitschriften und Artikeln hinaus (Bibliodiversität), und zeigt, wie eine Integration von Forschungsdaten und klassischen Publikationen im OA-Bereich auch bei einer Kulturerbeeinrichtung wie der BBAW möglich ist. Open Access führt dadurch weit über den traditionellen Artikelbereich hinaus, und es ergibt sich ein Kontinuum zwischen granularen Forschungsdaten auf Wort- oder sogar Morphemebene einerseits und mehrere hundert Seiten umfassenden Büchern andererseits. Politische Forderungen im OA-Bereich sollten das gesamte Kontinuum berücksichtigen. Neben dem technischen und sozialen Setup wird der Vortrag auch auf Fragen des Urheberrechts, Persönlichkeitsrechts und Datenschutzes im Kontext von Sprechergemeinschaften, die sich außerhalb des westlichen Rechtskreises bewegen, eingehen. |