Mediendatenbank Swissdox

Schweizer Medienarchiv öffnet sich

Die Universität Zürich bietet ihren Forscherinnen und Forschern direkten und unkomplizierten Zugang zur riesigen Mediendatenbank Swissdox. Dank Swissdox@LiRI werden Big-Data-Analysen in den Textarchiven vereinfacht.

Stefan Stöcklin

zeitung
Das Medienarchiv Swissdox umfasst über 27 Millionen Artikel aus Print- und Online-Medien und wächst täglich um rund 6000 Publikationen. (Bild: istock/F Kozyr)

 

Swissdox ist die führende Datenbank der Schweizer Medienlandschaft und umfasst über 27 Millionen Artikel aus Print- und Onlinemedien. Die Bestände reichen bis in das Jahr 1911 und decken alle wichtigen Verlage ab. Das Archiv, das täglich um rund 6000 neue Artikel und Online-Publikationen wächst, ist eine Goldgrube für geistes- und sozialwissenschaftliche Forschung und steht ab sofort den UZH-Angehörigen zu Forschungszwecken zur Verfügung.

«Dank einer Vereinbarung mit der Schweizer Mediendatenbank SMD können wir Swissdox an der Universität Zürich hosten und nutzen», freut sich Noah Bubenhofer, Professor für Deutsche Sprachwissenschaft. Die Kooperation mit Swissdox ist Teil der «Linguistic Research Infrastructure» (LiRI) des Linguistik Zentrums Zürich – einem Verbund von Instituten und Personen an der Philosophischen Fakultät – und firmiert unter dem Kürzel Swissdox@LiRI.

Gewinn für die Korpuslinguistik

Dank dem laufend aktualisierten Textarchiv von Swissdox können Sprachforscher und -forscherinnen aber auch Angehörige anderer Disziplinen wie der Politik- und Kommunikationswissenschaft, der Medienforschung oder der Soziologie mit aktuellen Textkorpora forschen. Bubenhofer nennt ein Beispiel aus seiner Forschung zur Corona-Pandemie: «Wir haben einen Textkorpus aus verschiedenen Medientiteln zusammengestellt und suchen darin nach auffälligen sprachlichen Mustern und Argumenten.»

Interessant sei zum Beispiel zu sehen, wie sich gewisse Argumente oder die Verwendung von Begriffen (z.B. Herdenimmunität oder Impfdrängler) im zeitlichen Verlauf in den Massenmedien änderten, sagt der Linguist. Die Korpuslinguistik profitiere enorm von den neuen technischen Möglichkeiten und dem automatisierten Zugang zu grossen Archiven, Stichwort Big Data. Mit eigens geschriebenen Programmen können die Forschenden Texte nach beliebigen Merkmalen durchforsten und quantitativ analysieren.

Projektpartner in Basel und Bern

Zurzeit ist eine Anwenderoberfläche und eine Programmierschnittstelle (API) in Entwicklung, die ab Anfang nächsten Jahres zur Verfügung stehen wird. Sie vereinfacht den Zugang der Forschenden mit eigenen Programmen zu den Daten von Swissdox. Die neue Kooperation mit der Mediendatenbank wurde auf Seiten der UZH von Noah Bubenhofer und Fabrizio Gilardi, Professor für Policy-Analysen, initiiert.

Weitere Projektpartner sind die ZHAW, die ETH Zürich sowie die Universitäten von Basel und Bern. Bubenhofer geht davon aus, dass «Swissdox@LiRI» in den nächsten Monaten so richtig abheben und das Linguistik Zentrum in vielfältiger Weise bereichern wird. Wer sich für einen Datenzugang interessiert, findet auf der Website von Swissdox@LiRI ein Zugangsformular.

 

Festakt zur Eröffnung von LiRI

Am 24. September 2021 findet eine feierliche Eröffnung der LiRI «Linguistic Research Infrastructure» am Campus Oerlikon an der Andreasstrasse statt. Der Aufbau des Labors mit fünf Aufnahmekabinen, zwei EEG-Kabinen und drei Nischen für Tests sollte Ende August abgeschlossen sein. Den Forscherinnen und Forschern wird erstklassige und modernste Infrastruktur für linguistische und sprachbezogene Forschung zur Verfügung gestellt. Die EEG-Messungen an der Kopfhaut beispielsweise erlauben Analysen zur Sprachverarbeitung im Gehirn. Am Eröffnungsevent geben Sprachforscher- und forscherinnen einen kurzen Einblick in ihre Arbeiten, im Anschluss bietet sich Gelegenheit für einen Rundgang in den Labors.

Details und Anmeldung unter diesem link

Stefan Stöcklin, Redaktor UZH News

Kommentar schreiben

Die Redaktion behält sich vor, Kommentare nicht zu publizieren. Unberücksichtigt bleiben insbesondere anonyme, ehrverletzende, rassistische, sexistische, unsachliche oder themenfremde Kommentare sowie Beiträge mit Werbeinhalten.

Anzahl verbleibender Zeichen: 1000