Correctiv
CORRECTIV unterstützen

Wir decken Missstände auf. Wir sind unabhängig und nicht gewinnorientiert.

Scrapen für Journalisten

Zeit
04.07.2017 10:00 - 18:00
Ort

CORRECTIV

Singerstr. 109

10179 Berlin

Anmeldung
Bitte melde dich hier an
Sprache dieser Veranstaltung
Deutsch

Details

Worum geht's?

Raus aus dem Netz, rein in Excel und Co. - bei einer Tabelle mag das ja noch klappen. Was aber wenn die gesuchten Informationen über tausende Unterseiten verstreut oder in einer Datenbank gespeichert wurden? In diesem Praxis-Workshop sollen Journalistinnen und Journalisten verstehen, wie Webserver "ticken" und Webseiten aufgebaut sind und was eine API ist. Sie lernen Werkzeuge und Anwendungen kennen, mit denen sich die Informationen scrapen lassen. Und: Sie probieren selbst aus, wie sich mit nur ein paar Zeilen Code selbst Programme schreiben lassen, die Webseiten-Informationen strukturiert speichern, so dass sie sich mit Excel, R, OpenRefine und Co. weiterverarbeiten lassen.

Hinweis: Es bietet sich an, einen eigenen Laptop mitzubringen, auf dem sich Software installieren lässt (evtl. vroab Rechte klären). Falls Sie die Programmierübung mit machen wollen, brauchen Sie die nötige Software.

  • Bitte laden Sie von dieser Seite https://www.continuum.io/downloads die neueste "Anaconda"-Version herunter (aktuell 4.3.0). Wichtig: Achten Sie darauf, dass Sie das Paket wählen, das die die Python-Version 3.6 enthält. Sie müssen sich dafür NICHT registrieren. Bei MacOS treten ab und zu Probleme auf, das Programm lässt sich nicht starten. Eine De-Installation und Neu-Installation schafft Abhilfe.

  • Empfehlenswert ist außerdem OpenRefine: http://openrefine.org/download.html Version OpenRefine 2.7-rc1.

Wer unterrichtet?

Claus Hesseling ist Journalist, Trainer und Dozent. Als freier Datenjournalist recherchiert er Geschichten fürs NDR und WDR Fernsehen. Seit 2003 ist er Trainer und Dozent für journalistische Themen: Onlinerecherche, Social Media und Quellencheck, Datenjournalismus, IT-Basiswissen, Schreiben fürs Netz und Webvideo. Zu seinen Auftraggebern zählen die ARd.ZDF-Medienakademie, der NDR und WDR, RTL, die Henri-Nannen-Schule, Deutsche Welle Akademie und die Universität Münster. Seit Januar 2017 arbeitet er für Interlink Academy an dem EU-Projekt "INJECT", das neue Tools für Newsrooms entwickelt (injectproject.eu). Er twittert unter @the_claus.

10 Euro für unabhängigen Journalismus