Die Vermessung der Blogwelt

Nachdem der Saarfuchs vor einigen Wochen über den Zustand seines Aggregators geschrieben hatte, hatte ich mich in Antwort darauf ebenfalls zu dem Thema geäußert. Es ließ mir dann aber doch keine Ruhe und ich fragte mich, wieviele Blogs(beinhaltend natürlich auch Pod- und Videocasts) mit dem Themenbezug Geocaching es da draußen wohl geben mag und natürlich auch, wie viele davon aktiv senden. So nutzte ich die freien Tage zwischen den Jahren nicht nur fürs Cachen und Ausspannen, sondern auch zu Recherche nach Geoblogs und ein wenig programmieren :-) Was aber ist ein Blog denn nun überhaupt, wie definiert man das :???: Da gibt es unterschiedliche Ansichten.
Wikipedia sagt dazu

Das oder auch der Blog oder auch Weblog (Wortkreuzung aus engl. Web und Log für Logbuch) ist ein auf einer Website geführtes und damit meist öffentlich einsehbares Tagebuch oder Journal, in dem mindestens eine Person, der Blogger, international auch Weblogger genannt, Aufzeichnungen führt, Sachverhalte protokolliert („postet“) oder Gedanken niederschreibt.

Quelle: Wikipedia.de

Kurz gesagt, läuft ein Blog auf einer eigenen Webseite(beinhaltend Hosting bei Anbietern wie WordPress, Blogspot und Co.), woraus folgt, dass Inhalte die nur auf Facebook, Twitter, Instagram und Co. stattfinden, nicht unter den Gattungsbegriff Blog fallen. Ebenfalls kennzeichnend für Blogs ist der sogenannte Web-Feed, in dem die letzten Beiträge des Blogs veröffentlicht werden. Hier hat sich als Standard das besonders leicht maschinenlesbare RSS-Format etabliert, das auch auch die beliebten Feed-Aggregatoren von GC Blogs und anderen beliefert. Man könnte auch sagen, dass RSS die (Blog-)Welt im innersten zusammenhält ;-) Newsletter, Twitterfeeds etc. sind zwar auch sinnvoll, aber eben nicht so leicht handhabbar. Und was nicht ausgelesen werden kann, kann nicht statistisch ausgewertet werden.

Demzufolge machte ich mich auf die Suche nach Geoblogs, die die genannten Kriterien erfüllen, also eigener Webspace mitsamt RSS-Feed. Zunächst einmal sammelte ich Linkslisten von Blogs. Die erste Anlaufstelle war mein eigener Aggregator, der aber nur einen kleinen Teil der Blogwelt abbildet. Wesentlich ergiebiger waren da dann GC-Blogs und der Frankfurter News Aggregator.
Danach ging es darum, aus dieser Liste von Feeds die zugehörigen Blogs zu ermitteln. Der dafür geschriebene Analyzer lieferte immerhin 136 Ergebnisse. Im Anschluss daran machte der Analyzer sich daran, die Feeds dieser Seiten auszulesen, um herauszufinden, wann der letzte Beitrag veröffentlicht wurde. Hier kam es dann vermehrt zu Fehlern in Form kaputter, nicht vorhandener oder leerer Feeds bzw. zu Lesefehlern, so dass am Ende gut 100 Feeds übrigblieben. Im letzten Durchlauf filterte der Analyzer alle Blogs heraus, die länger als 200 Tage Funkstille gehalten haben. So blieben gut 50 Blogs übrig(Stand: 3. Januar):

Zugegebenermaßen gab es auch hier ein paar Verluste: Nicht-verlinkte Feeds sind mir ebenso durch die Lappen gegangen wie Feeds, die beim Aufrufen des Skriptes nicht verfügbar waren oder bei denen Lesefehler auftraten. In der Tat fiel mir beim Betrachten der Ergebnisse auf, dass ein paar bekannte Seiten fehlten, die ich natürlich nachgetragen habe. Die obige Liste ist also unter Garantie nicht vollständig, u.a. fehlen alle Blogs, deren Feeds kaputt oder dysfunktional sind. Auch kann ich nicht ausschließen, dass einige Nicht-Geoblogs hier aufgeführt wurden, wem etwas auffällt: Bitte Laut geben :-)

Es gibt sicher noch mehr da draußen, wer noch Blogs kennt, die per Feed erreichbar sind und regelmäßig senden, möge mir bitte Bescheid geben. Im Laufe der nächsten Wochen wird diese Liste auch auf einer eigenen Seite hier im Blog veröffentlicht werden.

In diesem Sinne:
Bis bald im Wald und frohes Lesen :-)

2 Kommentare

  1. Schon lange möchte ich eine solche Übersicht erstellen – einzig der zu betreibende Aufwand hat mich davon abgehalten ;) Schön dass du es gewagt hast – und danke dafür

  2. Das ist ja mal ein feiner Service! Bisher hatte ich hierzu nicht wirklich einen guten Überblick. Vielen Dank von meiner Seite für die Mühe.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.