Artifizielle Geo-Intelligenz

17. Dezember 2023 Autor

Ihr alle habt schon den Hype um die Künstliche Intelligenz mitbekommen, das Thema hat aus mehreren Gründen in den letzten Monaten einiges an Fahrt aufgenommen und so habe ich mich in den letzten Tagen sowohl beruflich als auch privat ein wenig damit beschäftigt.

Zunächst einmal:

Erwartet hier keine tiefgehende Erklärung, dazu ist das Thema viel zu groß und es gibt sehr viele Leute, die das besser können. Hier möchte ich nur einen groben Überblick geben, mit Schwerpunkt auf Bildgenerierung, weil die mir am meisten Spass gemacht hat. Das Headerbild ist übrigens auch generiert.
Also: Brauchen wir beim Geocachen KI? Die Antwort drauf ist ein ganz klares Jein.
Einige werden sagen “Braucht kein Mensch”. So wie einige keine Wandermultis, keine Kurzmultis, keine Adventure Lab Caches, kein GPSr, kein Smartphone, keine Logstempel, keine Straßenranddosen, keine Walddosen, keine Stadtcaches und keine Mysterycaches brauchen.

Andere werden zumindest mal einen Blick drauf werfen(oder haben es schon getan), ob sich damit Rätsel erstellen oder lösen lassen, oder ob sich damit Cachebilder oder Logtexte generieren lassen.

Es bleibt also euch überlassen

Wie man mit KI Bilder generiert

Das ist mittlerweile kein Hexenwerk mehr und die notwendigen Werkzeuge sind im Internet mittlerweile frei verfügar. Eine einfache Suchmaschinenanfrage nach “Free AI Image generator” bringt unzählige Treffer für entsprechende Webseiten und Apps. Die meisten davon arbeiten mit Freemium-Modellen, limitieren also bspw. die Anzahl von generierten Bildern oder stellen Features nur eingeschränkt zur Verfügung. Das reicht aber für den Anfang völlig aus. Einige Webseiten wollen, dass Ihr einen Account erstellt, andere nicht. Klickt Euch einfach mal durch die Suchergebnisse.

Habt Ihr einen Service gefunden, geht es los. Ihr braucht im Wesentlichen drei Dinge zum Generieren von Bildern:

Ein Modell: Das Modell ist die Basis für die Bilder. Es enthält Texturen und Beschreibungen von Gegenständen, die die KI verstehen kann und aus denen sie die Bilder generiert. Stellt Euch einfach eine Kiste voller Klemmbausteine vor, aus denen Ihr eine Burg, ein Raumschiff oder ein Auto baut. Es gibt Modelle, die eher allgemein gehalten sind und von “allem” ein wenig enthalten, und speziellere Modelle, beispielsweise für Comic- oder Mangastile. In der Klemmbausteinwelt wären das Kisten, die hauptsächlich für den Bau von Flugzeugen oder Burgen geeignet sind. In der Regel geben die Webseiten ein eher generelles Modell vor
Der Prompt: Den Prompt gebt Ihr ein, er enthält die Beschreibung des zu generierenden Bildes. Hier könnt Ihr in natürlicher Sprache beschreiben, was Ihr generieren lassen wollt, also zum Beispiel “Ein Männlein steht im Walde”
Der negative Prompt: Dieser ist manchmal fest vorgegeben, manchmal kann man ihn selber ausfülle. Er enthält alles, was nicht im Bild vorkommen soll.
Das können zum Beispiel “Menschen” in Szenerien sein, oder “zusätzliche Gliedmaßen”. Bitte was? Ja, dazu kommen wir später

Und wie sieht das aus?

Auch hier scheiden sich die Geister: Einige suchen sofort die Fehler in den Bildern und konstatieren, dass das alles nichts taugt. Andere sehen, dass man ohne einen Funken künstlerisches Talent, Photoshopskills oder dergleichen Bilder generieren kann, die zwar nicht ganz perfekt, aber durchaus beeindruckend sind.

Manchmal aber auch irritierend, wenn zusätzliche Arme oder Beine auftauchen oder die Gesichter deformiert sind, auch Augen sind mitunter völlig vermasselt. Ein häufiger Fehler, der nicht sofort auffällt, sind übrigens zusätzliche Finger oder Fingergelenke.

A propos “Auffallen”: In den “sozialen” Netzwerken gibt es eine Unzahl von generierten Fakebildern, auf die jeden Tag unzählige Menschen reinfallen. Oder reinfallen wollen. Die zählen nicht alle Finger und Gliedmaßen, weil ihnen jemand mit den Worten “Hier, KI-generiert, was hältst Du davon” Bilder schickt sondern glauben einfach, was sie sehen, wenn es mit der Überschrift “So schrecklich ist die Lage in…”, “Mir fehlen die Worte” oder dergleichen mehr präsentiert wird. Hier liegt meines Erachtens auch eine große Gefahr, zumal die Bilder auch mit entsprechendem Aufwand oder entsprechenden Tools verbessert werden können, bis zum letzten Finger. Seid Euch einfach bewusst, dass Ihr bei Inhalten im Internet einfach noch skeptischer sein sollt.

So, genug geredet, hier ein paar generierte Bilder. Schaut einmal, ob Ihr die Generierungsfehler(neudeutsch “Artefakte” genannt) findet:

Hier zeigt sich ein erstes Problem: Meine verwendete KI konnte aus dem Modell nicht ermitteln, wie ein Geocache aussieht. Die Umschreibung “The Geocache has a volume of 1 litre” führte die KI zu dem Schluss, dass Geocaches Wasserflaschen seien.

Das ist ein sehr kleiner Cache, hier hatte ich mit “The man holds a plastic box” einen Erfolg, wenn auch nur einen sehr kleinen.

Hier wollte ich eine “plastic bottle” haben und bekam eine.

Gut zu wissen: Die KI generiert bei gleichem Prompt immer wieder neue Bilder

“the Geocache has the size of a melon” veranlasste die KI, ein melonenartiges Objekt in die Hand der Frau zu zaubern.

…und zuguterletzt wurde auch dieser Kollege fündig

…und zum Schluss

KI wird, ob es uns nun passt oder nicht, in den kommenden Jahren immer stärker begleiten und es ist gut, zumindest einen groben Überblick zu erlangen, denn wir alle hatten schon mit KIs und deren Entscheidungen zu tun. Auch abseits der Generierung von Symbolbildern kann KI eine wertvolle Hilfe beim Cachen sein, das oben angeführte Lösen und Erstellen von Rätseln ist nur einer von vielen Anwendungsfällen.

In diesem Sinne: Bis bald im – hoffentlich – echten Wald und happy hunting!

…noch ein Geoblog

Ein Blog über Geocaching, Ingress und was uns da draußen noch so erwartet