Datenjournalismus für Lokalreporter

Daten säubern mit OpenRefine

Daten sind oft unsauber, also schlecht formatiert, oder liegen uns oft nicht in der Form vor, in der wir sie brauchen. Um weiter mit ihnen arbeiten zu können oder sie für eine Visualisierung vorzubereiten, müssen sie in das richtige Format gebracht werden. Dieser Screencast zeigt, wie man das mit dem Tool „Open Refine“ anstellt.

Zum Mitmachen: In dieser Folge wird ein Datensatz als Beispiel benutzt, der sich gut für lokale und regionale Geschichten eignet: Eine Statistik über die geringfügig Beschäftigten in NRW.

Hier gibt es OpenRefine zum Download: http://openrefine.org/

Tabellen aus PDFs befreien mit Tabula Daten konvertieren in verschiedene Formate