Warum der 4000er-Algorithmus fair ist. Und warum er unfair ist. Und was das ganze mit Fussball zu tun hat
Mittlerweile hat es sich herumgesprochen: Groundspeak belohnt die 4000 besten Owner des Geolandes mit einem Virtual Cache. Dies sorgt neben dem üblichen Beißreflex über Groundspeaks vermeintliche Unfähigkeit(die niemanden der sich darüber beklagenden Personen davon abhält, ihre Caches bei Groundspeak zu hosten) und Zustimmung auch für eine gewisse Neiddebatte: Warum der und warum nicht ich? Nun, das Thema erregt die Gemüter, dabei sollte mit ein wenig Nachdenken klar sein, dass die Auswahl zwar unfair ist, aber fair gestaltet wurde. Klar soweit Lassen wir einmal die Debatte über Sinn und Unsinn der 4000 Virtuals beiseite und konzentrieren uns auf die Auswahl. Die Aufgabe war klar formuliert: Erstelle eine Rangliste der Owner und wähle die besten 100 aus jedem Land aus. Soweit, so klar. Beim Fussball ist genau definiert, was als Tor gilt und was nicht. Am Ende eines Spiels hat die Mannschaft gewonnen, die die meisten Tore erzielt hat, einfach, verständlich und nicht diskussionswürdig. Geht man allerdings eine Ebene höher auf Ligaebene, wird es schon komplizierter: Ein Sieg bringt drei Punkte, ein Unentschieden einen Punkt. Bei Punktgleichheit entscheidet das Torverhältnis über den Ranglistenplatz.
Was wäre nun, wenn nicht das Torverhältnis, sondern die Anzahl der Tore ausschlaggebend wäre? Oder die Anzahl kassierter roter Karten mit hereinspielt? Dann würde die Tabelle ohne Zweifel anders aussehen. Und wenn die Anzahl der Minuten ohne Gegentreffer mit hereinspielt, die Anzahl verwandelter Eckbälle? Dann wird es langsam kompliziert mit der Berechnung. Und damit sind wir wieder bei der Dosensuche: Nicht ohne Grund wird die Berechnung der Ownerrangliste geheimgehalten, denn das Problem dabei ist: Ownerqualität ist nicht messbar. Es fängt schon damit an, dass Caches nur bedingt miteinander vergleichbar sind. Wie soll man the Rock, Total Recall, Enigma #1 oder Voss-Margarine miteinander vergleichen? Alles bekannte Caches, die sich aber sehr voneinander unterscheiden. Und wie soll man das Ownerverhalten in Zahlen ausdrücken?
Faktoren wie Langlebigkeit des Caches sollen eine Rolle spielen: Eine lange Lebensdauer eines Caches wird mit Ownerengagement gleichgesetzt. Dabei gibt es durchaus Caches, die seit Jahren vor sich hingammeln und auch tolle LPCs, die der Abrißbirne anheim fallen. Im ersten Fall hat der vergammelte Cache eine höhere Wertung als der zweite, bei dem der Owner gar keine Chance auf Reparatur hat. Oder nehmen wir die Fundhäufigkeit: Oft gefunden == toller Cache == toller Owner. Beisst sich bloss mit dem Phänomen der Leitplankentrails, während der ISS-Cache offenbar ziemlich mies ist, mit einem lumpigen Fund Zum Glück gibt es ja die Favoritenpunkte als Kriterium. Wenn der Cache denn nicht vor Einführung der FPs veröffentlicht wurde. Oder ein Alphaowner so viele tolle Caches auslegt, dass den Suchern die FPs ausgehen. Loglänge vielleicht? Eher nicht. Und ob man bei GS den Aufwand auf sich genommen hat, per KI aus Logtexten eine Bewertung des Caches abzuleiten, bezweifele ich ganz stark.
Kurzum: Alles, was in Zahlen gemessen werden kann, bildet die Realität nur bedingt wieder. Hier eine gute Näherung zu finden, ist schwierig. Als IT-Projekt muss man klären: Welche Faktoren sollen berücksichtigt werden, wie sollen sie gewichtet werden(was einen enormen Einfluss auf das Ergebnis hat) und vor allem: Welche Zahlen haben wird und was können wir daraus ableiten? Bei Groundspeak hat man den Vorteil, Direktzugriff auf die Datenbestände zu haben, ohne API-Limits, da gab es sicher mehrere Anläufe, bis eine halbwegs realistische Einschätzung herauskam, sprich: Viele der sich jetzt auf den Schlips getreten fühlenden waren vielleicht schon auf einer der ersten generierten Listen dabei. Und was ist daran jetzt fair?
Die Auswahl der Kriterien war sicherlich subjektiv. Aber da es bei der Bewertung der Ownerqualität gar keine alleinige Wahrheit geben kann, macht es nichts – die Frage nach dem Sinn der ganzen Operation wollen wir ja an dieser Stelle nicht erörtern Am Ende kam eine reproduzierbare(wenn auch nicht für uns) Liste heraus und wir können uns demnächst auf viele neue Virtuals freuen, beinhaltend endlose Debatten über deren Qualität und die Renaissance des Couchloggens.
In diesem Sinne: Bis bald im Wald und happy hunting