Offene Wahldaten mit Wikidata

Debatten über Wahlbeeinflussung, Falschmeldungen und gar staatliches Hacking: Alles Gründe, unsere demokratischen Prozesse so transparent und nachvollziehbar wie möglich zu machen.

Weil das vor allem auch ein Anliegen für Data Scientists und Datenjournalist*innen ist, stand der zweite Wikidata-Workshop von Wikimedia Deutschland bei uns im Haus ganz unter dem Thema „Wahldaten“. Über 40 Freiwillige aus ganz Deutschland und Österreich beschäftigten sich ein Wochenende lang mit diesem Thema – und bekamen nebenbei auch die Stadt gezeigt.

Wer die Begrüßung und einen Teil der SPARQL-Einführung nachempfinden möchte, kann das bei Radio free FM tun. Als Experiment haben wir diesen Teil nämlich live auf 102,6 MHz im Ulmer Umland gesendet und auch aufgezeichnet.

Das sind nicht mal alle, die da waren – die hatten wir nie aufs Bild bekommen 😀

Das sind nicht mal alle, die da waren – die hatten wir nie aufs Bild bekommen 😀

Wie wird eigentlich ein Yak rasiert?

Vielfach ging es bei den Projekten des Wochenendes immer noch um mühevolles Yak Shaving – also mehrere Ebenen tief greifende Vorbereitungen, um überhaupt das tun zu können, worum es eigentlich geht. Mit eine Lektion des Workshops war daher, künftigen Einsteiger*innen in das Thema bessere Dokumentation bereitzustellen, um direkter zum Ziel zu gelangen. Und nicht zuletzt galt es auch, viele der notwendigen Daten überhaupt erst in Wikidata einzupflegen. Mühselig, aber lohnenswert.

Die Projektergebnisse als Sketchnote von @bleeptrack

Die Projektergebnisse als Sketchnote von @bleeptrack

Am Ende des Wochenendes stand eine ganze Reihe von Projektergebnissen. Auch für Laien hervorzuheben ist dabei der guessr – ein kleines Ratespiel, bei dem es herauszufinden gilt, wo ein bestimmtes Foto (beispielsweise eines Parlamentsgebäudes) aufgenommen wurde.

Berichte anderswo:

Und wer offiziell Wahldaten bereitstellt, kann sich ja mal die Forderungsliste des österreichischen Vorbilds ansehen – oder den deutschen Ableger der Website weiterentwickeln.

Meld‘ Dich jetzt an zum Wikidata-Wahldatenworkshop!

Im Dezember gab es bei uns im Haus bereits einen Workshop zu Wikidata, der Freien Wissensdatenbank hinter der Wikipedia. Die erste Auflage war als Prototyp speziell für die Open Knowledge Labs – und es freut uns sehr, dass sie so gut ankam, dass es im Juni bei uns eine zweite Auflage für alle Interessierten geben wird.

Vom Freitag, dem 23. Juni bis Sonntag, dem 25. Juni werden wir uns wieder in einer Mischung aus Hackathon und Edit-a-Thon dem Thema nähern. Angeleitet von SPARQL-Liebhaber*innen und Datenjournalist*innen liegt die Aufmerksamkeit dieses Mal vor Allem auf Wahldaten – aber natürlich bleibt auch rechts und links davon Platz für Experimente.

Weitere Informationen und die Anmeldemöglichkeit zur Veranstaltung findest Du auf der Wikipedia-Projektseite. Das Projekt wird von Wikimedia Deutschland gefördert.

Ein Wochenende voller Wikidata

Die Wikipedia kennen sicherlich die meisten – aber was es mit Wiki_data_ auf sich hat, ist bislang immer noch ziemliches Insiderwissen. Deswegen waren am ersten Dezemberwochenende fast 50 Freiwillige aus den OK Labs von Code for Germany aus ganz Deutschland bei uns in Ulm zu Gast und haben sich dieses Projekt einmal genauer angesehen.

Wie die Wiki_pedia_ ist auch Wiki_data_ eines von vielen Projekten von Wiki_media_ – das sind die, die zu Jahresende immer die Spendenbanner einblenden, und der deutsche Wikimedia Deutschland e.V. hatte auch zu diesem Wikidata-Wochenende eingeladen.

Das Besondere an Wikidata ist, dass es zum Einen die Datenquelle für möglichst viele andere Wikimedia-Projekte sein kann. Damit beispielsweise die Einwohnerzahl von Ulm, wenn sie sich ändert, nur beim Wikidata-Ulm-Eintrag geändert werden muss, und dann stimmt die Zahl auch in allen Sprachversionen der Wikipedia.

Wikimedia-Urgestein @johl erklärt das Grundprinzip von Wikidata

Wikimedia-Urgestein @johl erklärt das Grundprinzip von Wikidata

Zum Anderen ist Wikidata aber keine „normale“, klassische Datenbank mit Schlüsseln und Werten, sondern beschreibt Aussagen wie „Ulm hat die Eigenschaft Einwohnerzahl, und zum 31.12.2013 war der Wert dieser Eigenschaft 119,218±0“. Klingt kompliziert, ist aber im Diagramm vielleicht etwas verständlicher:

Wikidata_statement_de.svg: Lydia Pintscher derivative work: Bjankuloski06en derivative work: Kolja21, Wikidata statement de, CC BY-SA 3.0

Das heißt, dass es zu einem bestimmten Schlüssel (z.B. „Einwohnerzahl“) nicht nur einen Wert geben kann, sondern mehrere – zum Beispiel, wenn sich der Wert über die Zeit hinweg ändert, oder wenn es verschiedene Quellen zu einer Sache gibt, die sich widersprechen.

Mit diesen Daten sollen Menschen aber natürlich auch etwas anfangen können – deswegen gab es an diesem Wochenende umfangreiche Einführungen in Wikidata und die Abfragesprache SPARQL, und die Gelegenheit, eigene Prototypen und Anwendungen damit umzusetzen. Beispielsweise den Universal-Saarland-Umrechner, der automatisch für beliebige Städte, Länder oder andere Dinge angibt, wie groß sie in Saarland sind. Oder die sehr beeindruckende Einbindung unseres Matelights, das danach live aktuelle Änderungen visualisierte:

Es hat uns sehr gefreut, Gastgeber für dieses Wochenende sein zu dürfen!

Rückblicke und weitere Lektüre: