Künstliche Intelligenz oder KI ist in aller Munde. Es ist ein Thema, das spaltet und starke Meinungen (für oder gegen) hervorbringt, und es wird in Zukunft immer wichtiger werden, ob Sie es wollen oder nicht. Diese Tools, zumindest die Tools, die wir, die Öffentlichkeit, nutzen können (Bild- oder Textgeneratoren wie ChatGPT), werden immer kreativer – bitten Sie die KI einfach, einen 800 Wörter langen Artikel über die Geschichte des Tourbillon-Reglers zu schreiben, und Sie werden sehen, dass das Ergebnis, auch wenn es etwas steril und generisch ist, gar nicht so schlecht ist. Wenn es um die Generierung von Bildern geht, sind diese Tools ebenfalls ziemlich beeindruckend, aber sie haben ihre Grenzen. Eine davon ist der Umgang mit fest verankerten Konzepten, Bildern, die so tief in der allgemeinen Psyche verwurzelt sind, dass man ihnen kaum entgegenwirken kann. Eine davon ist die 10-nach-10-Position der Zeiger im Uhrenmarketing und in der kreativen Bildsprache; sie ist so stark verankert, dass die KI kaum etwas dagegen tun kann.
Der Grund für diesen Artikel liegt darin, dass einige unserer Teammitglieder eine Diskussion (Video unten oder hier sichtbar) zwischen dem Youtuber und Stanford-Universitätsmitglied Robinson Erhardt und Ned Block, einem Professor an der New York University in den Abteilungen Philosophie und Psychologie, gefunden haben. In einem Abschnitt dieses Videos mit dem Titel „Wie man zeigt, dass ChatGPT dumm ist“ (ab 45:53) erklärt Professor Block, dass er es versucht und versagt hat, als er OpenAI-Tools bat, „ein Bild einer Gruppe von replica Uhren zu zeichnen, die 3 Minuten nach 12 anzeigen“. Die überwiegende Mehrheit der Ergebnisse zeigte Uhren, die 10-nach-10 anzeigten.
Der Grund für diese Ergebnisse ist, wie er erklärt, dass „Bilder von Uhren und Armbanduhren im Internet von 10-nach-10 dominiert werden, weil das das attraktivste Aussehen ist“. Natürlich hat das hier unser Interesse geweckt, und da wir normalerweise nichts für selbstverständlich halten, mussten wir das selbst ausprobieren. Aber vorher werfen wir noch einmal einen Blick auf die berühmte 10:10-, 10-nach-10- oder 10-nach-10-Position der Zeiger auf Uhren.
DER FALL DER 10:10-POSITION DER ZEIGER
Dieses Thema wurde schon oft untersucht und Dutzende von Artikeln befassen sich mit diesem Thema. Aber schauen wir uns das Thema noch einmal kurz an. Warum zeigen die Zeiger auf den meisten Bildern von Uhren von Marken die Zeit irgendwo um 10:10 an? Natürlich kann es in manchen Fällen 10:09 oder 10:08 sein, aber Sie verstehen, was ich meine. Die meisten offiziellen Bilder von Uhrenherstellern verwenden die 10:10-Anzeige. Es gibt einige Ausnahmen, wie Parmigiani Fleurier (Zeiger bei 07:08, angeblich die Geburtszeit des Gründers Michel Parmigiani), Oris, das immer 07:53 anzeigt, oder A. Lange & Söhne mit den Zeigern bei 01:53 (aber das Ergebnis ist optisch identisch mit 10:10).
Aber nehmen Sie Rolex, Omega, Patek, Audemars oder praktisch jede andere Uhrenmarke, und Sie werden sehen, dass offizielle Renderings und Bilder die Zeiger irgendwo um 10:10 positioniert haben. Um genau zu sein, produziert Rolex immer Bilder seiner Uhren mit Zeigern bei genau 10 Stunden, 10 Minuten, 31 Sekunden und dem Datum am 28. des Monats (siehe hier, hier und hier). Bei Omega sind es immer 10:07 und 37 Sekunden.
Warum sind die Zeiger in dieser Position? Es ist ein Marketingtrick, den es seit den 1950er Jahren gibt und der zu einer Branchennorm geworden ist. Es gibt mehrere Gründe, diese Position der Zeiger zu erklären; in erster Linie ist da die Symmetrie, die sie bietet – es ist allgemein bekannt, dass das menschliche Gehirn von Symmetrie angezogen wird. Außerdem bilden die auf diese Weise positionierten Zeiger einen Winkel von ungefähr 120 Grad, der sowohl das Logo umrahmt (meistens befindet sich das Logo der Marke auf Mittag, unter der Markierung) als auch eine Überlappung potenzieller Unterzähler auf dem Zifferblatt vermeidet – beispielsweise wenn Chronographen und Kalender Unterzifferblätter bei 3 und 9 Uhr haben. Schließlich bildet es ein ästhetisch ansprechendes Smiley-Gesicht, wieder einmal, um unser Unterbewusstsein anzusprechen. Es gibt sogar psychologische Studien dazu, wie die aktuelle „Warum ist 10 nach 10 die Standardeinstellung für Uhren in der Werbung? Ein psychologisches Experiment“, veröffentlicht in Frontiers In Psychology.
KI-BILDGENERATOREN UND DIE SCHWIERIGKEIT, MIT ALLEM ANDEREN ALS 10:10 UMZUGEHEN
Also zurück zum Hauptthema und dem, was Professor Block und Erhardt im Video diskutieren, um zu zeigen, dass ChatGPT manchmal dumm sein kann – ja, das ist eine mutige Behauptung. Wie gesagt, diese beiden nehmen das Beispiel von Uhren und haben mehrfach versucht, Bilder von Uhren zu erzeugen, die eine bestimmte Zeit auf ihrem Zifferblatt anzeigen. Ihre Ergebnisse mit ChatGPT waren eindeutig; die meisten, wenn nicht alle Bilder erzeugten Zifferblätter mit einer auf 10:10 eingestellten Zeit. Natürlich mussten wir das selbst ausprobieren, und ich habe dies mit verschiedenen Anfragen an den integrierten KI-Bildgenerator von Adobe Photoshop getestet. Meine Ergebnisse… Nun, sehen Sie unten selbst.
Für dieses erste Bild habe ich das KI-Tool von Photoshop gebeten, „eine Armbanduhr in einer eleganten Umgebung mit der auf 06:35 eingestellten Zeit“ zu erstellen. Wie Sie sehen, haben wir definitiv eine Armbanduhr, aber die Zeiger haben das klassische 10:09-Layout.
Als Nächstes haben wir drei Bilder mit demselben integrierten KI-Tool, diesmal mit der Aufgabe, „eine Taschenuhr mit historischem Layout und der auf 2:45 eingestellten Zeit“ zu erstellen. Auch hier sehen Sie ziemlich realistische Taschenuhren – ich muss zugeben, dass die Ergebnisse ziemlich überzeugend sind – aber auch hier zeigen alle drei die Zeit an, die wir von den meisten Uhrenwerbungen gewohnt sind, also etwa 10:10.
nur weil die Zeigerposition so tief in der Uhrmacherei verwurzelt ist, generiert KI dies nur, wenn sie anders gefragt wird 4 nur weil die Zeigerposition so tief in der Uhrmacherei verwurzelt ist, generiert KI dies nur, wenn sie anders gefragt wird 5
Dann führte ich einen weiteren Test durch, indem ich das KI-Tool bat, ein Bild von „mehreren Uhren, alle mit der auf 6:35 eingestellten Zeit“ zu erstellen. Auch hier war das Ergebnis enttäuschend. Einige dieser Uhren zeigen unterschiedliche Zeiten an, aber die Gesamtqualität des Bildes ist ziemlich schlecht, als ob das Tool mit der Anfrage überfordert wäre.
Ich beschloss dann, meine Anfragen sehr einfach zu halten und bat Photoshop, ein Bild von „einer Uhr zu erstellen, die mit ihren Zeigern genau 02:35 anzeigt“, auch hier ohne viel Glück. Dieses Bild ist eines von sechs Ergebnissen, die Photoshop lieferte, aber sie alle erzeugten im Grunde dasselbe Bild und dieselbe Zeit.
Ich versuchte dann, das System auszutricksen, wie Professor Ned Block in seinem Video vorschlug. Es gelang ihm, Ergebnisse mit Digitaluhren zu erzielen, die die richtige Zeit anzeigten; natürlich spielten diesmal keine Zeiger eine Rolle. Meine Anfrage war einfach: „Eine digitale Sportuhr, die auf ihrem Bildschirm genau 14 Uhr anzeigt“. Wie Sie an den generierten Bildern sehen können, hatte ich nicht viel Glück.
Was sagt uns das? Nun, KI ist von Natur aus kreativ, aber sie hat ihre Grenzen. KI stützt sich auf vorhandene Konzepte und Quellen, um auf der Grundlage einer Anfrage Text oder Bilder zu generieren, und erstellt ihre Antworten mit dem, was im Internet verfügbar ist. Ich habe mehrfach versucht, ChatGPT zu bitten, Artikel über kürzlich erschienene Uhren zu schreiben, aber es waren keine relevanten Ergebnisse möglich – einfach aufgrund des Mangels an verfügbaren Quellen. Wenn Sie ChatGPT jedoch bitten, einen Artikel über ein gut recherchiertes historisches Thema zu schreiben – die Erfindung des Tourbillons, die Geschichte der Rolex Submariner –, sind die Ergebnisse generisch und steril (es fehlt ihnen die menschliche Note und der Stil), aber der Inhalt kann durchaus zufriedenstellend sein.
Was die Bildsprache betrifft, arbeiten KI-Generatoren nach demselben Prinzip; sie durchsuchen das Internet und generieren Bilder in Bezug auf Ihre Anfrage. Wie Ned Block im Video sagt: „Bilder von Uhren im Internet werden von 10-nach-10 dominiert, weil das der attraktivste Look ist.“ Block erwähnt auch, dass die Leute von OpenAI sich dieser Situation bewusst sind, sie aber nicht beheben können. Es gibt Möglichkeiten, solchen Problemen entgegenzuwirken, indem man einen Prozess namens „Reinforcement Training“ verwendet, bei dem man der Maschine beibringt, Dinge anders zu machen, als das, was im Internet allgemein verfügbar ist. Hier gibt es jedoch zu viele verschiedene Vorkommnisse, die verstärkt werden müssen – im Grunde sollte das System durch 719 andere Positionen als das klassische 10:10-Layout verstärkt werden, da auf einer klassischen 12-Stunden-Analoguhr 720 Positionen möglich sind (12 Positionen für den Stundenzeiger multipliziert mit 60 Positionen für den Minutenzeiger).
ANDERE „BUGS“ IN DER KI-MATRIX…
Die 10:10-Zeigerposition ist eines von vielen Beispielen, die Professor Block in diesem Video erwähnt. Er spricht auch über die Prävalenz von Rechtshändern gegenüber Linkshändern. Er erklärt, dass, wenn Sie „ChatGPT bitten, ein Bild von jemandem zu zeichnen, der mit der linken Hand schreibt“, Sie immer eine rechte Hand erhalten. Selbst mit verschiedenen Tricks konnte er das Problem kaum lösen, sondern nur durch die Verwendung komplexer Anfrageketten. Als Beispiel habe ich das KI-Tool von Photoshop auch gebeten, „eine linke Hand zu generieren, die in ein Buch schreibt“, und hier sind drei der Ergebnisse, die ich erhalten habe (und viele weitere im gleichen Sinne), alle mit einer rechten Hand.
Und weil wir auch Autoliebhaber sind, habe ich dasselbe Tool gebeten, ein Bild von „einem Armaturenbrett eines Rechtslenker-Autos“ zu generieren, nur um Bilder von Armaturenbrettern ohne Lenkrad oder Bilder von Linkslenker-Autos zu erhalten – ich bin ziemlich sicher, dass ich mit der richtigen Anfragekette dieses spezielle Problem hätte lösen können, aber andererseits basieren die ersten Ergebnisse auf Websuchen, die von Linkslenker-Autos dominiert werden.
Ich bin sicher, dass diese Probleme gelöst werden, aber dieses spezielle Beispiel, das mit der Uhrmacherei zu tun hat, war sicherlich eine Untersuchung wert. Und wenn Sie Lust haben, haben Sie Spaß und probieren Sie diese Beispiele selbst aus, vielleicht mit anderen KI-generierenden Tools als dem, das wir in diesem Artikel verwendet haben. Und teilen Sie Ihre Erfahrungen bitte im Kommentarbereich unten.