Skip to content

Summer School: Digitale Methoden der Zeitungsanalyse // Historische Forschung digital: ein Workshop zum Deutschen Zeitungsportal

License

Notifications You must be signed in to change notification settings

Deutsche-Digitale-Bibliothek/ddblabs-summer-school-2024

Repository files navigation

Binder

Summer School: Digitale Methoden der Zeitungsanalyse

Mittwoch, 11. September 2024 - Donnerstag, 12. September 2024
09:00 - 19:30 Uhr, Zentralbibliothek Zürich, Hermann-Escher-Saal
https://www.zb.uzh.ch/de/events/summer-school-digitale-methoden-der-zeitungsanalyse

Historische Forschung digital: ein Workshop zum Deutschen Zeitungsportal

Datum: Donnerstag, 12. September 2024, 13:30 Uhr - 17:00 Uhr
Dozierende: Michael Büchner (Deutsche Digitale Bibliothek), Franziska Fuchs (Deutsche Nationalbibliothek), Stephanie Nitsche (Deutsche Nationalbibliothek)

Das Deutsche Zeitungsportal – ein Subportal der Deutschen Digitalen Bibliothek – ist mit knapp vier Millionen Ausgaben aus über 1.800 Zeitungstiteln, die fast vollständig mit Volltext vorliegen, der größte Anbieter für historische, digitalisierte Zeitungen in Deutschland. Es stellt damit eine wertvolle Quelle für geschichtlich arbeitende Wissenschaften dar.

Ziel des dreistündigen Workshops ist es, den Teilnehmenden einen umfassenden Überblick darüber zu vermitteln, wie das Deutsche Zeitungsportal für die Forschung, insbesondere in den Digital Humanities, genutzt werden kann. Die Teilnehmenden erhalten dazu zunächst eine kurze Einführung in das Deutsche Zeitungsportal, seine Entstehungsgeschichte, die angebotenen Funktionalitäten und die Vielfalt der verfügbaren Inhalte. Anschließend lernen die Teilnehmenden, wie sie die Programmierschnittstelle (API) der Deutschen Digitalen Bibliothek nutzen können, um Datensets aus dem Deutschen Zeitungsportal herunterzuladen. Der Fokus liegt dabei auf der Vermittlung grundlegender Kenntnisse, die es den Teilnehmenden ermöglichen, in Zukunft eigenständig Datenabfragen zu erstellen. Sie lernen die Funktionsweise der Schnittstellen kennen und erfahren, wie sie Abfragen mithilfe der Dokumentation anpassen und erweitern können.

Nach diesem Einblick führen die Teilnehmenden, begleitet vom DNBLab-Team, eine Datenanalyse auf Basis der gemeinsam heruntergeladenen Daten durch. Hierfür werden Jupyter Notebooks mit Python-Programmcode genutzt. Durch das gemeinsame Live-Coding werden auftretende Fragen und Probleme direkt und interaktiv gelöst. Am Ende werden die gemeinsam analysierten Daten in geeigneten Visualisierungen dargestellt, die Aufschlüsse über die Datenzusammensetzung und mögliche Forschungsansätze geben.

Programm

Uhrzeit Programmpunkt Notebook Dozierende
13:30 Einführung ins „Deutsche Zeitungsportal“ Michael Büchner
13:45 Download der Zeitungsportaldaten über die API der Deutschen Digitalen Bibliothek 001_Download_über_API_der_DDB Michael Büchner
14:45 Pause
15:00 Einführung ins DNBLab Franziska Fuchs
15:15 Datenanalyse
  • Text aus ALTO-XML extrahieren
  • Worthäufigkeiten analyiseren und visualisieren
  • Optional: Kurzer Einblick in Named Entity Recognition
002_Alto-XML-Dateien_einlesen_und_Texte_extrahieren
003_Worthäufigkeiten_und_Analyse
004_named_entity_recognition
Franziska Fuchs und Stephanie Nitsche
16:45 Fragen und Feedback
17:00

Tools

JupyterLab kann beispielsweise über die Distribution „Anaconda“ lokal installiert werden. Eine weitere Option ist, die Jupyter Notebooks auf Basis dieses Repositorys mit Binder oder Google Colab auszuführen.

Links

About

Summer School: Digitale Methoden der Zeitungsanalyse // Historische Forschung digital: ein Workshop zum Deutschen Zeitungsportal

Resources

License

Stars

Watchers

Forks