Oskar Welzl: Weblog zur Homepage

SPARQLing foaf:Images

Logo für RDF

Geil. Seit einigen Jahren schon gibt es ja eine maschinenlesbare Kopie dieses Blogs im RDF-Format. (Siehe diesen Beitrag von 2007.) Dieser Blog-Abzug wird von einigen wenigen Zeilen statischer Zusatzinformationen angereichert und ergibt in Summe einen Datenbestand, ders durchaus in sich hat: Über die Verknüpfung völlig unabhängiger Datenquellen ist es möglich, zu fast allem hier Zusatzinfos zu erhalten. Zu den Themen der Beiträge Infos aus Wikipedia, zu den Autoren der Kommentare Fotos und Namen, zu mir selbst ein Persönlichkeitsprofil und meine Sprachkenntnisse … Genug jedenfalls, daß man es nicht im öffentlichen Netz haben und von Google indizieren lassen will.

Genauer müßte man eigentlich formulieren: „Über die Verknüpfung völlig unabhängiger Datenquellen wäre es theoretisch möglich, zu fast allem hier Zusatzinfos zu erhalten.“ So richtig praktische, schlaue Abfragetools hab ich mir bisher noch nicht angesehen. Irgendwie hats mich gestern und heute aber in den Fingern gejuckt. Ich wollte etwas mit dieser Datenflut auf meiner Festplatte anstellen.

Um RDF vernünftig auszuwerten, braucht man SPARQL. SPARQL ist eine SQL-ähnliche Abfragesprache, die eben nicht Tabellen, sondern Triple-Stores auswertet. Klang für mich immer sehr trocken und mühsam, kam vor allem ohne spitze Klammern aus, also hab ichs bleiben lassen. Bis jetzt. Gestern angeschaut, heute damit gearbeitet und - voilà! - schon hab ich eine Übersicht aller Fotos aus diesem Blog (und manchen anderen Quellen), geordnet nach dem Namen der abgebildeten Personen. Edel. Eine wunderbare HTML-Seite, auf der jeweils ein Name als Überschrift steht, dann alle Fotos, auf denen die jeweilige Person zu sehen ist, dann der nächste Name usw. usw.

Es tut mir in der Seele weh, daß ich das Dokument nicht einfach hochladen und herzeigen kann. Ist mir dann aber doch zu sensibel: Immerhin stehen fast alle Abgebildeten mit ihren vollständigen Namen drin, dazu auch gleich die Fotos aus acht Jahren Blog-Geschichte … Das mag wohl nicht jeder öffentlich zur Schau gestellt haben. (Was ein Dilemma des Semantic Web offenbart: Die fraglichen Fotos sind ja schon alle öffentlich im Web, die meisten davon sogar hier auf diesem Blog. Wer mich kennt, erkennt mich auf jedem dieser Fotos. Trotzdem ist die systematische Abfrage „Zeige mir alle Fotos, auf denen Oskar Welzl abgebildet ist“, vom Standpunkt der Privatsphäre her bedrohlicher.)

Beeindruckend dabei wieder einmal das nahtlose Ineinandergreifen verschiedenster W3C-Technologien. Die SPARQL-Abfrage ist ja nur die halbe Miete und liefert ein unansehnliches XML-Dokument zurück. Um daraus eine hübsche HTML-Seite zu machen, brauchts XSL(T). Schade, daß sich das W3C mit „HTML“ 5 von dieser genialen Systematik verabschiedet hat und zur völlig unsinnigen Tagsoup-Zeit zurück kehrt.

Apropos HTML: Noch etwas mußte ich unbedingt ausprobieren. In einem zweiten Pseudo-Blog hatte ich bereits vor längerer Zeit RDFa-Metadaten in den HTML-Quellcode eingefügt. Überraschenderweise kann ich die SPARQL-Abfrage auch direkt gegen diese mit RDFa angereicherte Website richten, nicht nur gegen den reinen RDF/XML-Abzug (den ich ja manuell erstellen muß hier). Absolut geiler Stoff. Was mich davon abhält, die RDFa Metadaten auch hier reinzupacken? Die noch fehlende endgültige Spezifizierung von RDFa 1.1 unter anderem, vor allem aber, wieder einmal, der Datenschutz. Es ist wirklich unglaublich, wie mittels RDF aus den unterschiedlichsten Datenquellen umfassendste Informationen zusammengestellt werden können. Die Herausforderung wird sein, nützliche Daten zu finden, die dennoch auch in Kombination mit Fremddaten keine personenbezogenen Details offen legen.

 
Deep_Blue meinte am :
Du bist jetzt aber nicht böse
wenn ich das nicht alles lese, bzw. nur Bahnhof verstehe ? :-) 
ossi1967 antwortete am :
Doch!

Es ist ganz einfach. Vielleicht mußt Du vorher noch die SPARQL-Spezifikation lesen, damit Du den Hintergrund kennst? Oder noch besser: Fang hier an und verschaff Dir einen Gesamtüberblick. ;)

 
Weitere Links zu …
RDF: