Daten

Wikidata wird 3 Jahre alt – Einblicke von Jens Ohlig beim 2OITG

Jens Ohlig CC BY-SA

Jens Ohlig @johl auf Twitter: My heart is a Turing machine. I do things with software, communication, and strategy at @WikimediaDE, but views are my own. Profile pic CC BY-SA @BosomOfAbraham Berlin, Germany · http://www.johl.io

Wikipedia kennt jeder. Wikidata ist das unbekanntere Projekt der Wikimedia Foundation. Am 5. November feierten die Entwickler*innen den Geburtstag von Wikidata. Vor gerade einmal 3 Jahren wurde das Projekt gestartet. Mitarbeiter Jens Ohlig blickt im eigenen Wikidata-Blog auf die vergangene Entwicklung zurück und erklärte beim 2. offenen IT-Gipfel der Grünen Bundestagsfraktion die Relevanz, die die Plattform der offenen und maschinenlesbaren Daten, für das Lernen und die Lehre haben kann.

„Wir beschäftigen uns bei wikimedia viel mit offen Lern- und Lehrmaterialien“ erklärte er. Dabei sei eine Welt das Ziel, in der jedermensch auf alles Wissen Zugriff hat. Wikidata ist dabei ein Teil und in das “Wikiversum” eingebunden. So ermöglicht  es etwa die Infoboxen auf Wikipedia automatisch zu generieren. Dabei sei Wikidata für den Umgang mit „real existierende Daten entworfen“ worden. Es biete einen Datenfundus, der mit 15.200.000 Einträgen schon rund etwa 3mal so viele Einträge biete wie die englischsprachige wikipedia. „Alles was unter unter CC0 verfügbar ist, wird für Menschen & Maschinen frei bearbeitbar und multilingual angeboten“, pointiert Ohlig. Alles Wissen werde dabei in Nummer codiert und mit Labeln versehen, die verschiedenen Sprachen zugeordnet sind.

Wikidata als „Drehkreuz des Wissens“ der Biowissenschaften

Gerade in den Biowissenschaften werde die Plattform immer mehr zum „Drehkreuz des Wissens“. Schließlich seien mittlerweile alle Genome des Menschen und der Maus in Wikidata gespeichert. Derzeit werde versucht eine umfangreiche Datenbank der gesamten Spezies zu schaffen.

„Enorme Abfragemöglichkeiten“

Die Abfragemöglichkeiten seien enorm, schwärmt der Entwickler: „Dank der strukturellen Zusammenhänge von Daten können Abfragen gestartet werden.“ Mit einem einfachen Programmcode können der strukturierten Datenbank so schnell die Liste der “die größten Städte, die von Bürgermeisterinnen regiert werden“ entlockt werden. Eine Recherchearbeit, die auf anderem Wege wesentlich länger gedauert hätte.

Neue Applikationen für Wikidata

„Wenn ich Daten habe, die in einem bestimmten Zusammenhang stehen, kann ich eine Zeitraumleiste zur Veranschaulichung von Wissen“ generieren. Ein Beispiel für diese Möglichkeit ist histropedia.com, eine Anwendung, die Zeitleisten nach individuellen Kriterien der Nutzer*innen erstellt – und dabei auf die Daten der strukturierten Datenbank von Wikimedia zurückgreift.

Eine weitere Anwendung, die auf die Daten von Wikimedia zurückgreift ist askplatyp.us. Nutzer können dabei eine Frage auf Englisch stellen, die ein Algorithmus, dann entschlüsselt und mit Hilfe der Datenbank beantwortet. Beispiel: How odl is Obama? Die Maschine denke an den amerikanischen Präsidenten und gibt die richtige Anwort: 52 Jahre.

Viele Freiwillige und hilfsbereite Skripte

Dabei verlässt sich Wikidata, wie die große Schwester Wikipedia auf die Schwarmintelligenz „Es ist für jeden möglich, Daten einzutragen“, sagt Ohlig. Dabei habe nur die englische Wikipedia und die Bilderdatenbank mehr freiwillige Content-Liferant*innen. Allerdings: „Nur 25 Prozent der Daten werden vom Menschen direkt eingetragen. 75 Prozent der Einträge erfolgen durch programmierte Skripte.

Seinen eigenen Blogeintrag beendet Ohlig übrigens mit folgender Beobachtung der Wikidata-Geburstagsfeier:

Am Ausgang der Party konnten sich Besucherinnen und Besucher auf einer Tafel verewigen, indem sie eine kleine Liebeserklärung an Wikidata hinterließen. „I love Wikidata because… with machine-readable data, machines can do the heavy lifting for me“ schrieb ein Party-Gast dort. In den letzten drei Jahren hat Wikidata die Grundlagen für eine Menge maschinenlesbarer Daten gelegt. Wir sind gespannt auf das heavy lifting in den nächsten Jahren. Q167545!

 

Click to comment

Leave a Reply

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

Archive

Kategorien

To Top