FYI.

This story is over 5 years old.

Der Datenschmutz

Datenjournalismus VS. Merkels #Neuland-Bullshit

Die Berliner Datenjournalisten von OpenDataCity enthüllen, weshalb die Stasi im Vergleich zur NSA lächerlich war und dass Geheimdienste selbst eure YouPorn-Suchen durchs Internet reichen.

Datenjournalismus erlebte seinen Durchbruch mit den Wikileaks-Veröffentlichungen der Afghanistan und Irak-Kriegstagebücher, sowie deren redaktionellen Aufbereitung durch den Guardian und die New York Times.

Obwohl einige im daten-getriebenen Journalismus „die Zukunft des Politikjournalismus“ sehen, steckt er in Deutschland noch in den Kinderschuhen. Während der Guardian und die New York Times zur Avantgarde dieser Form der Berichterstattung gehören, versagen deutsche Medien bislang durch die Bank und verlassen sich nur zu gerne auf althergebrachte klassische Zeitungsgeschichten, die sie einfach lieblos und ohne Mehrwert für die digitale Welt adaptieren.

Anzeige

Michael Kreil von OpenDataCity.

OpenDataCity ist ein Zusammenschluss aus Journalisten und IT-Fachleuten, die darauf spezialisiert sind, Anwendungen rund um große Datensätze zu bauen. Sie recherchieren und bearbeiten Daten aus einer journalistischen Perspektive und arbeiten die digitalen Informationen auf, um die darin enthalten Geschichten zu finden. Am Ende steht eine webbasierte App, die als datengetriebene Rechercheumgebung dient, mit der der Leser tiefer und interaktiver in die immer komplexeren und abstrakteren Geschichten unserer digitalen Welt eintauchen kann.

VICE: Was versteckt sich hinter den Begriffen Datenjournalismus und Data-Storytelling?
Michael Kreil: Die Grundidee ist, dass man mit Daten Geschichten erzählen kann. Jedes Online-Magazin kann man ausdrucken, überall ist ein Print-Button, aber das ist ein falsches mentales Modell. Das man mit dem Medium mal spielt, das man etwas mit Video und Audio macht, findet kaum statt. Das Interaktivste sind irgendwelche Foto-Klickstrecke.

Soviel Platz würden die Aktenschränke der Stasi und der NSA verbrauchen - wenn die NSA ihre 5 Zettabytes ausdrucken würde.

Was war bislang euer spannendstes Projekt?
Schwierig. Ich habe immer viel dazugelernt. An der Stasi/NSA Geschichte habe ich eine Stunde gearbeitet und 400.000 Menschen waren darauf. Das war spannend, da es eigentlich keine Datenvisualisierung ist, sondern eine billige Statistik. Einfach nur ein Zahlenvergleich, aber da es in eine Karte integriert ist, kann man sich eine bessere Vorstellung davon machen. Wenn es einfach nur ein Tortendiagramm ist, hat man ja kaum einen realen Bezug dazu.
Im vergangenen Herbst haben wir die Afghanistan-Papiere veröffentlicht, die dokumentieren, wie der Krieg dort aussieht und obwohl wir relativ viel Zeit investiert haben, hat es nur wenig Leute interessiert. Bis die Bundeswehr die WAZ Redaktion zwingen wollte, diese Dokumente mit der Begründung „Urheberrechtsverletzung“ aus dem Netz zu nehmen. Jetzt ist es wieder eine interessante Geschichte

Anzeige

Um was geht es in den Papieren?
Die Bundeswehr muss einmal die Woche das Parlament über den Verlauf des Krieges unterrichten. Das ist eine ganz geheime Verschlusssache und darf nicht an die Öffentlichkeit geraten. Diese Papiere sind in Deutschland die bislang intensivste Dokumentation des Afghanistan-Krieges und trotzdem ist uns aufgefallen, dass die tatsächlichen Informationen über den Krieg relativ dünn war. Da fehlten immer wieder Informationen und die Regierung hat sich keine Mühe gegeben, das transparent zu machen.
Wir haben also alles nach Statistiken durchgescannt und daraus ein Diagramm erstellt, aus dem zum Beispiel ersichtlich wurde, dass die Situation schlimmer wurde, je mehr deutsche Soldaten hingeschickt wurden. Das ist ja auch ein interessanter Zusammenhang, der von der Bundeswehr aber niemals analysiert wurde.

Wie und woher bezieht ihr diese Datensätze?
Das ist ganz unterschiedlich. Manche Sachen bekommen wir einfach über anonyme Quellen zugespielt, wie die Afghanistan-Papiere. Manche Sachen sind schon fast Auftragsarbeiten. Das meiste was wir machen, ist jedoch selber Datenquellen zu recherchieren.
Das typische Beispiel ist der Bahnmonitor, den wir für die Süddeutsche gemacht haben. Da fragen wir die Website der Bahn mit einem Programm im Sekundentakt welche Verbindungen Verspätungen haben. Die Daten dafür waren schon immer da und eigentlich frei verfügbar, man muss sie nur abgreifen. Da sammeln wir nun seit eineinhalb Jahren Daten direkt von der Bahn-Webpage und man sieht da sehr schön wie manche Städte plötzlich rot werden, weil gar kein Zug mehr fährt, da zum Beispiel ein Gleis kaputt ist.

Anzeige

Wie wichtig ist dieser reale Bezug in eurer Arbeit für den Leser beziehungsweise User?
Es ist wichtig, da die Themen mit denen wir uns beschäftigen schon sehr abstrakt sind und abstrakte Themen versuchen die Medien immer mit etwas realem zu verbinden. Aber die machen es eben dämlich. Bei der Euro-Krise sehe ich ständig Fotos mit einer Euro-Münze und bei Prism sehe ich ständig irgendwelche Leute auf einer Tastatur rumhacken. Aber da stellt das Bild ja keinerlei Zusammenhänge dar.

GEMA versus YouTubes Top 1000.

Den Medien fehlt also ein direkter Bezug zum Thema?
Es muss Bezug zur Realität haben und gleichzeitig aufzeigen um was es geht. Mich erinnert  das ein wenig an Fotografie. Man liest zum Beispiel wie der Krieg in Afghanistan ist und dann fliegen Fotografen hin und machen Bilder vor Ort. Man darf nicht vergessen, wie wichtig in Argumentationen das Bild ist und jetzt haben wir mit Datenjournalismus auch die Möglichkeit, abstrakte Themen zu verbildlichen.
Wir probieren das aus und testen, wie man das hinbekommen kann. Manchmal geht das auch in die Hose. Wir haben zum Beispiel ein Projekt gehabt in dem wir 900 iPhones verfolgt haben, wie sie sich durch Europa bewegt haben und das sah wunderschön aus. Wie Glühwürmchen. Das hatte dann eine Emotionalität und einen positiven Bezug, der gar nicht beabsichtigt war.

Wie geht ihr an ein großes Datenpaket heran?
Das ist unterschiedlich. Wir haben manchmal Datensätze bekommen, da mussten wir Grundlagenforschung betreiben. Da sind wir eine Art Forschungsinstitut. Zum Beispiel die Daten von re:log, da haben wir 5.000 W-Lan Nutzer auf einer Konferenz analysiert. Da muss man erstmal spielen, mit Mathematik herumexperimentieren.

Anzeige

Besucherstromanalyse der re:publica über das W-Lan Netzwerk

Da ihr nicht auf den Datenschutz der Besucher Rücksicht genommen habt, standet ihr aber auch in der Kritik.
Es ist ein wahnsinnig schwieriges Thema. Ganz viele Leute haben darüber gesprochen. Auf unserer Seite habe ich die Abwägung getroffen, dass ich in dieser Datenvisualisierung selber drin bin. Ich fand es eigentlich viel wichtiger, dass den Leuten bewusst wird, dass sie, wenn sie sich ins W-Lan einloggen, ständig getrackt werden können. Noch spannender wäre da nun zu erfahren, wie die Telekom mit ihrem Hotspot-Netz verfährt. Tracken sie Leute, speichern sie die Daten? Da habe ich in den AGBs nicht spezielles gefunden. Und da finde ich es gut, dass man in dieser Diskussion etwas hat, dass man sich ansehen kann, um sich klar zu werden „soweit geht das“.

Auch im Kontext zu Prism und Tempora: Gibt es überhaupt Möglichkeiten sich im Netz zu verstecken?
Es gibt schon eine Menge Möglichkeiten. Den Tor-Browser zum Beispiel. Das ist alles eine interessante Diskussion die da gerade stattfindet, doch aus meiner Sicht ist das gerade gar kein technischer Skandal sondern ein politischer Skandal und der Grund dafür ist, dass das Internet nicht verstanden wird. Man glaubt, man müsse etwas im Internet reparieren, um dieses Problem zu lösen, aber eigentlich müsste man unsere Sicherheitsbehörden reparieren.

Diese Visualisierung zeigt exemplarisch, wie bei der Nutzung populärer Dienste Datenpakete durch die Leitungen wandern - und auf diesem Weg von verschiedenen Geheimdiensten abgegriffen werden könnten.

Anzeige

Damit, wie Sicherheitsbehörden jeden von uns im Internet erfassen können, habt ihr euch ja bereits beschäftigt …
Die Grundidee war, zu zeigen, dass auch, wenn ich als normaler Nutzer denke, alles ist sicher, meine Kommunikation nicht in Deutschland bleibt. Noch schwieriger wird es, wenn ich daran denke, dass in so gut wie allen Websites Facebook-Like-Buttons drin sind und da Facebook in Amerika sitzt, sieht die NSA also, wann immer so ein Like-Button auf der Page ist, wer darauf zugreift. Dafür muss die Person nicht einmal einen eigenen Facebook-Account besitzen.

Wie geht ihr selber mit journalistischer Ethik um? Wie würdet ihr mit Daten verfahren, in denen zum Beispiel Klarnamen genannt werden?
Wir sind zum Glück noch nicht in diese Situation gekommen, aber wir sind hier nicht Wikileaks. Es ist natürlich immer ein Spagat zwischen öffentlichem Interesse und Schutz der Privatsphäre. Im Zweifel wenden wir uns aber lieber nochmal an eine Redaktion, die mehr Erfahrung damit hat  bevor wir irgendeinen Scheiß bauen.

Fotos: Grey Hutton

MEHR GESCHICHTEN ÜBER DATENSCHMUTZ UND DATENSCHUTZ

Das „Technikaufwuchsprogramm“ ist Deutschlands kleines PRISM

Abmahnung wegen Filesharing? Und was machst du jetzt?

Dieser Typ glaubt, es wird in Zukunft nichts mehr privat sein