Oskar Welzl: Weblog zur Homepage

Web



soup.welzl.info

Soup-LogoAuf die Idee gebracht hat mich Daniel schon vor längerer Zeit. Umgesetzt hab ichs erst dieses Wochenende:

Ein Account auf soup.io sammelt stur alles zusammen, was ich ihm sage. Das Ergebnis - soup.welzl.info - ist ein Planet-ähnlicher Mischmasch aus meinen eigenen Inhalten (aus diesem Blog, aber auch von meinem Mobile Web Server oder von delicious), vor allem aber aus Inhalten anderer Websites, die ich mehr oder weniger regelmäßig lese. Ein öffentlicher RSS-Reader? Ja, irgendwie. Nur theoretisch auch noch ein bißchen mehr.

Ehrlich gesagt hab ich noch keine Ahnung, ob mir das Ding in irgendeiner Weise nützlich sein wird oder ob es für andere einen Mehrwert bringt, aber what shall’s: Es ist gratis, es macht Spaß und ich kann es auf meiner eigenen Domain unterbringen. (Und natürlich ist es ach so „Web 2.0“! *LOL*)

Nettigkeit am Rande: Gekocht wird soup.io in Österreich, genauer in der Otto-Bauer-Gasse in Wien (siehe Impressum). Wer kann da schon nein sagen?


Browserstatistik 2008

Kinder! Wieso sagt denn keiner was? Seit 2006 hab ich hier keine Statistik mehr veröffentlicht. Also, nichts wie los!

Bei den Browsern hat der Internet Explorer nochmal deutlich verloren und liegt erstmals unter 50%. Der Abstand zum Firefox beträgt nun nur mehr drei Prozentpunkte. Ebenfalls interessant: Abgesehen von der Aufholjagd des Firefox gibt es keine Veränderung seit 2006.

BrowserAnteil in Prozent
Internet Explorer45%
Firefox42%
Mozilla Suite5%
Safari4%
Opera3%
Andere1%

Der Anteil der regelmäßigen Leser ist von 11% auf 10% leicht gesunken, wobei allerdings die Besucherzahl insgesamt nochmal deutlich gestiegen ist: Statt 59 kommen nun im Schnitt 84 Besucher pro Tag hierher.

Was Microsoft in der Browserstatistik verliert, gewinnt es bei den Betriebssystemen wieder dazu: Rund 85% aller Zugriffe erfolgen mit einem Windows-System. Vor allen Windows Vista trägt hier zum Wachstum von MS bei, fast ausschließlich auf Kosten von GNU/Linux. Das freie Betriebssystem stürzt von 14% auf 7% ab und liegt damit nur mehr knapp über OS X, das seinen Anteil von 6% unverändert halten konnte.

BetriebssystemAnteil in Prozent
Windows XP68%
Windows Vista15%
GNU/Linux7%
Mac OS X6%
Windows 20003%
Andere2%

Die Gruppe „Andere“ wird zunehmend bunter. Neben diversen Windows-Varianten und Unix-Derivaten finden sich hier auch immer mehr mobile Betriebssysteme (z.B. Symbian), aber auch Spielkonsolen wie Nintendo Wii.

Alle Zahlen beruhen wie immer auf der Auswertung der letzten 3000 Besucher. Prozentangaben sind gerundet.


Weihnachts-Content: Kerzenhalter!

Christbaumkerzenhalter von Wolfgang SalomonJaja, da haben wir erst Oktober und schon gibts bei mir Christmas-Content. Ich bin eben der Weihnachts-Junkie, ich kann nicht anders.

Anlaß ist die Eröffnung einer neuen Website, die ich gestern ganz zufällig mitbekommen hab: Ich hab ja hier im Februar 2007 über Drahtdesign aus dem Hause Salomon berichtet. Offenbar hat sich diese Werbung derart positiv auf die Nachfrage dort ausgewirkt, daß man sich nun entschlossen hat, der Kollektion „Swinging Candles“ einen eigenen Webauftritt außerhalb der etablierten Firmenhomepage zu spendieren.

Nicht übel, nicht übel, was da so geboten wird. Ich hab mein Teil ja schon, sonst tät ich doch glatt nochmal einkaufen (die Farbvariation Gelb-Rainbow hats mir angetan *gg*).

(Ach ja: Wer verwirrt auf einer halb leeren Seite steht und keine Navigation findet: Flash aktivieren bzw. besser gleich direkt zum Shop. Dort gibts zwar auch kein Bild, aber eine Übersicht über alle Varianten in HTML. Die Dingers sehen nach wie vor so aus wie hier auf dem Foto zu diesem Blogeintrag - nur halt in den sechs verschiedenen Farben.)


RDFa à la twoday

Logo für RDF

Seit dem 14.10.2008 ist RDFa eine W3C-Empfehlung. RDFa steht für „RDF in attributes“ und definiert eine Erweiterung zu XHTML, mit der RDF-Statements direkt in Webseiten eingebettet werden können. Das Internet wird dadurch ein Stück maschinenlesbarer: Suchmaschinen können diese Information verwerten und so zum Beispiel in Suchergebnissen eine Unterscheidung treffen zwischen Essen, der Stadt in Deutschland, und dem guten Essen bei der Mama. (Tatsächlich experimentiert Yahoo! in seinem Projekt Searchmonkey mit RDFa. Irgendjemand hier sollte mal über Searchmonkey bloggen …)

Natürlich habe ich mich (trotz meiner Verärgerung und Frustration über den sorglosen Umgang mit URIs) seit 14.10. mit RDFa gespielt und versucht, ob man es in einem Blog auf twoday.net einsetzen kann. Immerhin: SIOC/RDF, Planets, Geotagging und Tagging … Mein Blog hat ja schon jetzt nicht mehr allzuviel mit dem zu tun, was Knallgrau sich ursprünglich so vorgestellt hat unter diesem Service.

Um es vorweg zu nehmen: Dieses Blog enthält noch keine RDFa-Informationen. Ich habe es bei einem Testblog belassen. Zum ersten Mal leisten die knallgrauen Server spürbaren Widerstand.

Das grundlegende Problem: RDFa ist als Erweiterung zu XHTML (genauer: zu XHTML 1.1) konzipiert. XHTML ist durch derartige Module leicht erweiterbar, HTML nicht. Ich bemühe mich zwar, dieses Blog so weit wie möglich XHTML-konform zu halten. Knallgrau verhindert aber, daß es wirklich verläßlich sauberes XHTML ist:

  • Es gibt bei der Texteingabe keine Prüfung auf valides XHTML, wie z.B. Drupal sie anbietet. Mit ein bißchen Disziplin schaffe ich es zwar meist (nicht immer), meine eigenen Beiträge fehlerfrei zu halten. Auf die Kommentare anderer User habe ich jedoch keinen Einfluß. Was immer da an Markup drin ist, XHTML ist es wahrscheinlich in den seltensten Fällen.
  • Wesentlich schlimmer: Eine rudimentäre Prüfung auf gültiges Markup führt twoday.net beim Speichern eines Beitrags dann doch durch. Die ist aber problematisch und zerstört in Einzelfällen korrektes XHTML. Folge: Es gibt Situationen, in denen ich selbst wissentlich fehlerhaften Code veröffentlichen muß, weil twoday die von mir richtig eingegebenen Tags stur entfernt.
  • Knallgrau gibt mir keine Möglichkeit, den MIME-Type der Dokumente zu verändern. XHTML 1.0 kann man ruhigen Gewissens als text/html ausliefern (das passiert hier). RDFa baut aber auf XHTML 1.1 auf, und dieses sollte als application/xhtml+xml ausgeliefert werden. Zwar geht text/html in Ausnahmefällen durch, trotzdem: An solche Vorgaben hält man sich einfach, und zwar aus dem gleichen Grund, aus dem man sich regelmäßig duscht.
  • Es ist naheliegend, XHTML-formatierte Inhalte der Seite mit dem datatype rdf:XMLLiteral in eine RDF-Aussage zu übernehmen. Diese Konstruktion bricht zusammen wie ein Kartenhaus, wenn dann einmal fehlerhaftes XHTML (das dann in der Regel auch kein XML mehr ist) in einem solchen Bereich auftaucht.

Mir war das alles dann doch zu heiß. Es gibt keine ausreichenden Erfahrungen, wie RDFa-Parser arbeiten, ob sie über derartige Unkorrektheiten stolpern. (Der von mir zum Testen von rdfa.twoday.net verwendete Parser zum Beispiel spuckt bei ungültigem XHTML nur mehr Fehlermeldungen aus.)

Bleibt zusammenfassend: Ich weiß wie's geht, ich kann es jederzeit einbauen, sobald eine halbwegs fehlertolerante Applikation es auch sinnvoll verarbeiten kann. Bis ich aber weiß, wie fehlertolerant solche Applikationen sein werden, spiele ich nur im Testblog weiter - und schau mir Drupal näher an, das nicht nur korrektes XHTML bietet, sondern auch schon RDFa-Unterstützung eingebaut hat.


FOAF, SIOC: URI Squatting in RDF

Eigentlich hätte das ja, zur Feier von RDFa, ein Artikel nach dem Muster von „RDFa à la twoday“ werden sollen. Der kommt vielleicht auch noch. Die pure Verzweiflung über den den Umgang mit URIs muß ich mir aber vorher noch von der Seele schreiben.

URIs können (grob vereinfacht) alles bezeichnen: Information über die Preise einer Frühstückspension (wie z.B. http://members.aon.at/neumair/zimmer_de.htm) oder mich als Person (ich habe die URI http://www.welzl.info/id/oskar.welzl). Alles kann (und soll) eine URI haben. Das ist die Grundlage des Semantic Web, damit wird die Möglichkeit geschaffen, über alles und jedes Aussagen zu treffen und diese Aussagen miteinander zu verknüpfen. Nur eines darf nicht passieren: daß für zwei verschiedene Dinge die gleiche URI verwendet wird. Das ist logisch: Wenn wir für Spinat und Schokokuchen das gleiche Wort hätten, wüßte der Kellner nicht, was er bringen soll.

In populären RDF-Vokabularen wie FOAF und SIOC kommen aber Bezeichnungen vor, die dazu verführen, URIs doppelt zu vergeben. In der Praxis passiert auch genau das. Die wichtigsten Vertreter dieser Gattung sind sioc:Forum, foaf:weblog und sioc:Site.

Warum verführen diese Bezeichnungen zur doppelten Vergabe von URIs? Der Klassiker ist sioc:Forum, das URIs als Diskussionsbereich auszeichnet, in dem Einträge gemacht werden. Mein Weblog hier ist ein sioc:Forum. Das Userforum auf internettablettalk.com ist ein sioc:Forum. Was passiert also naheliegenderweise in der Praxis? Eine RDF-Aussage „http://oskar.twoday.net/ ist vom Typ sioc:Forum“ wird angereichert mit Informationen wie „http://oskar.twoday.net/ hat 1455 Postings“ und „Der User Zorra hat einen Artikel auf http://oskar.twoday.net/ geschrieben“. Das sind Aussagen, die bezüglich meines Weblogs korrekt sind.

Dummerweise gibt es aber neben meinem Weblog auch noch etwas anderes, das bezeichnet und beschrieben werden will: die Seite, die der twoday-Webserver beim Aufruf von http://oskar.twoday.net/ zurückliefert. Die Übersichts- oder Einstiegsseite also. Auch sie ist, ebenso wie das Weblog als ganzes, eine information resource. Auch über diese Übersichtsseite möchte ich Aussagen treffen können: daß derzeit 16 Artikel auf ihr zu sehen sind zum Beispiel („http://oskar.twoday.net/ hat 16 Postings“) oder daß sie valides XHTML ist („http://oskar.twoday.net/ ist XHTML 1.0“).

Die Aussagen über mein Weblog als Gesamtheit und über die Übersichts-/Einstiegsseite widersprechen einander bzw. sind für die jeweils andere Ressource nicht wahr: Der User Zora hat zwar einen Eintrag auf meinem Weblog verfaßt, der Eintrag erscheint aber nicht auf der Einstiegsseite. Und auch wenn mein Weblog tatsächlich 1455 Postings hat, für die Einstiegsseite ist diese Aussage falsch, genauso wie die Annahme, das Blog sei in seiner Gesamtheit sei valides XHTML. Das Weblog und die Einstiegsseite sind also zwei unterschiedliche Dinge, die unterschiedliche URIs benötigen. Weil die einzelne Übersichtsseite noch eher das ist, was der Webserver beim Aufruf der URI zurück liefert, hätte ich grundsätzlich vorgeschlagen, für die andere Ressource (also das Weblog, das Forum, …) eine neue URI zu erfinden. Das geht: Im Semantic Web ist das Erfinden neuer URIs für irgendwelche Dinge tägliche Praxis.

Tatsächlich aber werden „da draußen in der Wildnis“ die jeweiligen URIs der Einstiegsseiten von Blogs/Foren/… als Bezeichner für das gesamte Blog/Forum/… verwendet. Das ist zunächst nicht falsch - nur extrem unpraktisch, weil es die Verwendung der gleichen URI für die dazugehörige Einstiegsseite verhindert oder aber zu widersprüchlichen und falschen Aussagen führt.

In meinen ersten Experimenten mit SIOC wollte ich alles richtig (und damit anders als alle anderen) machen: Ich habe für mein Blog die URI http://www.welzl.info/rdf/twoday#oskar.twoday.net erfunden, an dieser Adresse ein paar Daten zum Blog und den Link auf http://oskar.twoday.net/ hinterlegt. Bis heute bin ich der Ansicht, daß das ein korrekter Ansatz war. Je länger ich mich dann aber nicht nur mit dem Erstellen, sondern auch mit dem Verarbeiten und der für Menschen lesbaren Darstellung von RDF-Informationen beschäftigt habe, desto klarer ist mir geworden, daß dieser Ansatz nur beschränkt praxistauglich ist. Das Semantic Web muß die Antwort auf die Frage geben können, welche Informationen zum Weblog mit der Adresse http://oskar.twoday.net/ zur Verfügung stehen. Kein Mensch wird je nach dem von mir erfundenen http://www.welzl.info/rdf/twoday#oskar.twoday.net suchen. Außerdem gehen die meisten Tools zur Darstellung von RDF davon aus, daß man auf Links mit der Eigenschaft foaf:weblog oder sioc:Forum einfach klicken kann, um zum jeweilig Blog oder Forum zu kommen. Diese Annahme ist zwar nicht durch die Spezifikationen gedeckt, aber sie ist verständlich.

Dazu kommt ein anderer Aspekt: Die Trennung in eine URI für „das Blog von Oskar Welzl“ und eine zweite URI für „die Einstiegsseite des Blogs von Oskar Welzl“ würde sich als „best practice guideline“ nie durchsetzen lassen. Es ist einfach zu kompliziert. Gerade die populären FOAF- und SIOC-Vokabulare werden von vielen RDF-Einsteigern genutzt (dazu zähle ich mich selbst), die eine solche Trennung nur durchführen, wenn sie verbindlich im Vokabular verankert statt nur empfohlen ist.

Seit gestern heißt mein Blog im semantischen Web nun wieder http://oskar.twoday.net/ - ich habe zum ersten Mal seit Jahren das Pragmatische über das Richtige gestellt. Seither habe ich Depressionen und Bauchweh. Es stimmt einfach nicht. Es ist nicht richtig. Wie käme man aus dem Dilemma raus?

Am einfachsten und saubersten wäre eine klare Neudefinition in den betroffenen Vokabularen. Im Fall von foaf:weblog könnte das ganz einfach die Änderung der Beschreibung sein: Derzeit ist es definiert als a weblog of some thing (whether person, group, company etc.). Dies könnte geändert werden auf „The entry point of (or place to bookmark for) a weblog of …“. FOAF kennt ein ähnliches Konzept bereits für foaf:accountServiceHomepage: Dort wird in der Definition ausdrücklich auf die homepage of the service Bezug genommen. Bei SIOC ist die Sache etwas komplexer, da sich das gesamte Vokabular mit Konzepten wie „… ist Teil von …“ auf das sioc:Forum (und nicht auf seine Einstiegsseite) bezieht. Hier wird nichts anderes übrig bleiben als das Konzept der Website (als Sammlung von einzelnen Seiten) deutlicher von dem der dazugehörigen Einstiegsseite zu trennen.

Überhaupt würde ich mir ein knappes Vokabular zur Beschreibung einer Website wünschen: Ganz unabhängig von Foren und Blogs beziehen sich RDF-Statements immer wieder auch auf ganze Websites. Es wäre praktisch, wenn man die in solchen Fällen gleich bleibenden Grundstrukturen (Website hat Hauptseite, Seite X gehört zur Website Y, …) sauber in RDF darstellen könnte. (Ein solches Vokabular ließe sich außerhalb von SIOC und FOAF entwickeln und dann von beiden Projekten nutzen.) Derzeit werden durch die Verwendung der URI der Einstiegsseite als Bezeichner für die gesamte Site Aussagen über genau diese Einstiegsseite unmöglich gemacht - URI-Squatting eben.


Nationalratswahl 2008: Ich bin begeistert

Die Nationalratswahl 2008 ist vorüber. Das Ergebnis ist ein persönlicher Triumph für mich:

Statt der üblichen 80-100 Besucher pro Tag konnte ich gestern 1.198 unique visitors zählen. Angelockt wurden die durch die hier vor längerer Zeit verwendete Überschrift „Nationalratswahl 2008: Ergebnis in Prozent“. Ich bin nicht nur Reichweitenfetischist, das ganze schlägt sich auch in klingender Münze nieder: Exakt 0,99 US-Dollar zahlt Google mir für die Anzeigen, die gestern auf dieser Seite geschaltet wurden.

Tja. Das waren also die positiven Aspekte der gestrigen NR-Wahl …


New Friseur on the Blog

Mein Friseur hat jetzt auch ein Blog. Dabei fällt mir ein - Zeit wirds wieder einmal …

Barbara bloggt

Barbara trink Wein in ArkansasSeit August ist Barbara im Reich des Bösen, genauer gesagt in Conway, Arkansas. Heute erst habe ich erfahren, daß sie unter dem Titel die morgenlandfahrerin die ganze Zeit über fleißig bloggt. Da wird natürlich sofort der RSS-Feed abonniert und ein Link gesetzt.

Barbara ist die Tochter von Helga und Martin und als solche Mit-Gastgeberin der legendären Sommerfeste in der Leonfeldnerstraße. (Das heurige hab ich verpaßt, und irgend ein Mistkerl hat Helga die Kamera mit den Fotos gestohlen. :( … Dabei war heuer seit langer Zeit auch Ronald wieder mal mit dabei.) Wenn sie diese Traditionen da drüben fortsetzt, kann sich Conway als nächstes auf ein nettes Punschkränzchen gefaßt machen.

(Da fällt mir ein: Ich war ja auch mal in Arkansas, zwei Mal sogar: 1985 und 1987. Ich erinnere mich nur nicht mehr, wie das Kaff damals geheißen hat - aber das schau ich noch nach … Das war in Jonesboro, also ca. 200km weit weg von Conway.)

Einstweilen: Willkommen im Club, Barbara!


Du schon wieder!

So. Und jetzt erlaube ich mal einen Blick in die dunklen Seiten meiner Seele. Ich erkläre, warum ich Blogs „auslacke“, also aus RSS-Reader und Linkliste streiche. Vor allem aber schildere ich, wie gräßlich schadenfroh ich bin, wenn dem Blogger dann Böses widerfährt. Hhr hhr hhr …

Es war an einem kalten Oktobertag, da … Nein, eigentlich muß man anders anfangen: Ein Blog, das man regelmäßig liest, in dem man regelmäßig kommentiert, das ist so ein kleines bißchen wie die Wohnung eines Freundes, den man gerne besucht. Man geht rein, sagt was Nettes und verzieht sich wieder.

Wenn man gleich beim Öffnen der Wohnungstür mit einem griesgrämigen „Ach! Der schon wieder!“ empfangen wird, denkt man sich seinen Teil und läßts einfach bleiben.

Und so war es eben an diesem kalten Oktobertag: Ich kommentier, der Bloginhaber verpfaucht mich mit Der wieder!. Ab da dann eben nicht mehr. Ausgelackt.

Neugierig, wie ich bin, hab ich aber dann doch nochmal meine Nase reingesteckt. Und was muß ich sehen? Er jammert drüber, daß er immer weniger Leser hat und vor allem die Stammleser ausbleiben. Hhr hhr hhr … Ich hätt ihm ja schreiben können, daß zu dem Zeitpunkt alle mir bekannten Blogger über ähnliches klagten und der Leserschwund wohl entweder mit einem veränderten Google-Algorithmus oder mit einer gewissen Blogmüdigkeit im Internet oder auch nur mit dem Wetter zu tun hatte. Aber wozu? Hätt ich mich wieder anpfauchen lassen sollen? Nö. Soll er leiden!

Na? Bin ich nicht ein Schwein? Abgrundtief böse? Intrigant? Das mußte einfach auch mal gesagt werden. Aufpassen also da draußen! ;)


XING

Ich wollte ja nie. Ich habe eine Abneigung gegen solche Plattformen. Aber Stephan hat mich gezwungen und jetzt bin ich bei XING. Nuja.