Nebenprodukt: Publishzahlen

Nebenprodukt: Publishzahlen

Es fing vor einiger Zeit damit an, dass in einer Chatgruppe das Gespräch auf GC-Codes kam und wie diese generiert werden. Die Frage wird auf kryptografie.de recht umfassend und nachvollziehbar beantwortet und irgendwann kam ich auf die Idee, dieses Wissen vielleicht in einem neuen Mystery zu verwerten. Der Mystery selbst harrt noch auf die zündende Idee, aber bis dahin konnte ich mein neu erworbenes Halbwissen auf andere Art und Weise anwenden. Zum Beispiel, um die Entwicklung der Publishzahlen einmal nachzuvollziehen.

Vorgehensweise

Ein  Blick auf die Groundspeak-Datenbank ist nur indirekt über die API möglich. Und die API-Limits wiederum sind recht eng gefasst, so dass es praktisch unmöglich ist, wirklich große Datenmengen wie “alle Caches” herunterzuladen. So ging ich über zu Stichproben. Ich erzeugte mir einfach eine Liste von validen GC-Codes in 500er-Schritten, also jeden 500. Code. Damit bekam ich eine Liste von ca. 17000 Codes zusammen, die entsprechend für ungefähr 8,5 Millionen Cachelistings stehen, die aber bei Weitem nicht alle das Licht der Geo-Welt erblickt haben.

In der Tat stellte ich beim Download der Cachedaten fest, dass ca. 20% der erzeugten Codes ins Leere zeigen, ob das nun unvollendete Cachelistings, Retractions oder Testeinträge der Groundspeak-Developers sind, vermag ich nicht zu sagen. Behaltet einfach im Hinterkopf, dass die unten präsentierten Zahlen nicht ganz richtig sind, sondern “nur” eine Tendenz aufzeigen, die sich aber mit meinen Erwartungen deckt

Auswertung

Tabellerarisch stellt es sich so dar:

Jahr Published
2003 58000
2004 78000
2005 118500
2006 164500
2007 218000
2008 297000
2009 369000
2010 446500
2011 546000
2012 607500
2013 611500
2014 562500
2015 563500
2016 540000
2017 456000
2018 416000
2019 391000
2020 435500
2021 381000

Wir sehen also, dass die Zahl der jährlichen Publishs bis 2011 ziemlich stetig anstieg und sich dann verlangsamte, bis 2013 das Maximum erreicht war.  Danach ging es erst langsam, dann schneller abwärts, so dass wir 2021 ungefähr auf dem Stand von 2009 angekommen sind. Die kleine “Delle” in 2020 ist wohl  Corona geschuldet, als Geoaching eine der wenigen noch möglichen Freizeitaktivitäten war.

Sicherlich gibt es auch elegantere Methoden, an die Zahlen heranzukommen, aber hier war die Gelegenheit einfach günstig, die “nebenbei” zu ermitteln. Für eigene Skripte ist hier das Codesnippet zum Generieren der GC-Codes in Javascript:

const dec2GC = (decVal) => {
    const map = '0123456789ABCDEFGHJKMNPQRTVWXYZ'.split('');
    const base = map.length;
    let result = '';
    let rest = decVal + 411120;
    do {
        result = map[(rest % base)].concat(result);
        rest = Math.floor(rest / base);
    } while (rest);
    return 'GC'.concat(result);

}
console.log(1000000 + ' -> ' + dec2GC(1000000));
console.log(2000000 + ' -> ' + dec2GC(2000000));

In diesem Sinne: Legt mal was schickes aus und bis bald im Wald!

Ein Gedanke zu „Nebenprodukt: Publishzahlen

  1. Es wäre interessant für 2020 mal zu sehen wieviele Monate ein Publishstopp war. Dann könnte man das für das Jahr mal hochinterpolieren und käme vielleicht auf eine Zahl welche deutlich höher wäre wie die 435500 und das gleiche bei 2021. Mal schauen wie das ganze in zwei Jahren ausschaut.

Kommentare sind geschlossen.

Kommentare sind geschlossen.