Inhaltsverzeichnis:

Im letzten Monat gab es eine bedeutende Entwicklung im Bereich der KI: OpenAI hat sein neuestes Bildgenerierungsmodell direkt in ChatGPT integriert. Die Qualität der generierten Bilder hat im Vergleich zu früheren Modellen, einschließlich populärer Konkurrenten wie Midjourney, einen gewaltigen Sprung nach vorn gemacht. Wenig überraschend sorgte dies für reichlich Aufsehen, besonders in den Communitys der Fotografie, Illustration und des Grafikdesigns. Diese neue Technologie scheint fähig genug zu sein, potenziell eine noch unbekannte Anzahl von Arbeitsplätzen in einem ohnehin schon umkämpften Markt zu bedrohen.

Als Fotografen waren wir besonders von der Fähigkeit des neuen Modells beeindruckt, konsistente Ergebnisse in der Produktfotografie zu erzielen – ein Bereich, der für KI-Modelle bisher eine große Herausforderung war. Nun scheint oft schon ein einfacher Smartphone-Schnappschuss auszureichen, um hochwertige Produktbilder in verschiedenen Umgebungen zu generieren, ohne dass dafür umfassendes Vorwissen nötig ist. Nach dem, was wir online gelesen haben, scheint die einzige verbleibende Schwachstelle der KI im Moment die korrekte Darstellung komplexer Etiketten mit viel Text zu sein.

Über das Experiment

Wir sind sehr beeindruckt von dieser Technologie und haben eine ganze Weile darüber nachgedacht, was dieser schnelle Fortschritt für unsere eigene Arbeit bedeutet. Das brachte uns auf die Idee, einen direkten Vergleich zwischen echter Fotografie und dem neuesten Modell von OpenAI anzustellen. Dieser Test ist keineswegs umfassend oder wissenschaftlich; vielmehr sehen wir es als ein unterhaltsames, praktisches Experiment, um selbst dazuzulernen. Wir wollten sehen, wie weit wir mit der KI kommen würden.

Um die Sache weniger vorhersehbar und interessanter zu gestalten, haben wir eine ziemlich komplexe Produktaufnahme erstellt, die wir anschließend mit ChatGPT nachbauen wollten. Wir sind keine Experten im Prompten, aber wir nahmen uns vor, uns Zeit zu lassen und unser Bestes zu geben, um ein gutes Ergebnis zu erzielen. Falls Leser Vorschläge zur Verbesserung unseres Prompts haben, freuen wir uns sehr darüber.

Die einzige Bedingung, die wir uns selbst gesetzt haben, war, ChatGPT nicht unser eigenes Foto als Referenz zu geben, das wir bereits vor Beginn dieses Prozesses aufgenommen hatten. Es ist ein echtes Bild, aufgenommen in unserem Studio, ohne jegliche Photoshop-Bearbeitung. Nur die Kamera, echtes Licht und eine leichte Bearbeitung in Capture One (unserer bevorzugten Software für Tethered-Shooting).

Das Foto

Beginnen wir also mit dem Experiment. Zuerst zeigen wir das Bild, das wir nachstellen wollten:

A creative product shot of the Acqua di Gioia perfume bottle by Armani, placed on a vertically rotated, arc-shaped mirror. The mirror’s surface mimics water, with ripple effects spreading outward. The scene is enveloped in moody blue tones, enhancing the aquatic and serene atmosphere.
„Acqau di Gioia“, 2025

Es zeigt einen Parfumflakon von „Acqua di Gioia“, der auf einer Spiegelfläche steht. Während des Shootings wurde der Spiegel um 90 Grad im Uhrzeigersinn gedreht, damit wir Wasser darauf gießen konnten. Dank der Oberflächenspannung blieb das Wasser auf dem Spiegel, was es uns ermöglichte, durch sanftes Bewegen des Flakons Wellen zu erzeugen. Nach der Aufnahme haben wir das fertige Bild um 90 Grad gegen den Uhrzeigersinn gedreht, um den Effekt eines „flüssigen Spiegels“ zu erzeugen. Natürlich waren noch ein paar weitere kleine Tricks nötig, aber alles ließ sich direkt in der Kamera umsetzen – ohne aufwändige Nachbearbeitung. Zum Vergleich: Die Erstellung dieses Bildes hat uns von Anfang bis Ende etwa 9 bis 10 Stunden gekostet.

Arbeit am Prompt

Mit dem fertigen Foto als Vergleich begannen wir an unserem Prompt für ChatGPT zu feilen. Schon früh wurde klar, wie schwer es war, der KI zu vermitteln, dass der Spiegel vertikal stehen und die Flasche darauf positioniert sein sollte. Immer wieder schien die KI sich unserem Prompt zu widersetzen und versuchte, die Elemente in einer konventionelleren Komposition anzuordnen. Es wirkte fast so, als hätte die KI noch nie ähnliche Beispiele gesehen und tat sich schwer, die Idee eines aufrecht stehenden Objekts auf einer vertikalen Wasseroberfläche nachzuvollziehen. Das war der frustrierendste Teil des ganzen Prozesses. 

Nach einigen Versuchen gaben wir die vertikale Variante auf und ließen den Spiegel im Prompt horizontal schweben. Unsere Idee war dann, das Ergebnis später in Photoshop zu drehen und den Hintergrundverlauf anzupassen, um den Himmel korrekt zu simulieren. Das erschien uns einfacher, als endlos gegen die KI „anzuschreiben“.

Uns ist auch aufgefallen, dass das Prompten selbst sehr zeitaufwendig sein kann. Während ein erstes Ergebnis unglaublich schnell und aufregend sein kann, sind kleine, präzise Anpassungen oft das Gegenteil – langsam und mühsam. Ein weiteres Problem ist die Unvorhersehbarkeit der KI. Manchmal erhält man ein recht gutes Ergebnis, das nur geringfügige Änderungen benötigt. Aber oft, wenn man versucht, es zu verfeinern, ändert die KI willkürlich andere Elemente, die bereits perfekt waren. Je mehr man versucht, sie wieder in die richtige Richtung zu lenken, desto mehr scheint sie die ursprünglichen Anweisungen zu vergessen und sich weiter davon zu entfernen.

Wir haben auch versucht, der KI dieselbe Skizze zu geben, die wir im Studio verwendet haben. Das half zwar ein wenig bei der Komposition, aber die KI war immer noch mit der Position des Flakons verwirrt, also haben wir uns entschieden, sie einen normal stehenden Flakon ohne die Skizze generieren zu lassen.

A pencil sketch on paper by mmiri studio illustrating the concept for an Acqua di Gioia perfume bottle shot. The drawing explores the composition, featuring the bottle on an arched, water-like mirror surface, capturing the planned visual elements of the final photograph.
Unsere Skizze für den Studioaufbau – die visuelle Grundlage sowohl für das Foto selbst als auch für das von der KI generierte Bild.

Nach mehr als einer Stunde des Experimentierens ist dies der Prompt, bei dem wir schließlich gelandet sind. Er liefert das Ergebnis, das unserem Ziel am nächsten kam.

„Erstelle ein hyperrealistisches Bild, das einen Parfumflakon von Acqua di Gioia zeigt, der genau in der Mitte eines gewölbten Spiegels mit einem filigranen, kupferfarbenen Metallrahmen steht. Der Spiegel schwebt horizontal ausgerichtet (um 90° gedreht) in der Mitte des Bildes, dessen reflektierende Oberfläche nach oben zeigt. Die Oberfläche des Spiegels besteht vollständig aus Wasser und erzeugt sanfte Wellen, die sich in konzentrischen Kreisen ausbreiten. Der Hintergrund ist ein klarer, offener Himmel in sanften, stimmungsvollen Blautönen unter einem bewölkten, diffusen Licht, das der Szene schmeichelt, ohne harte Schatten zu werfen. Es sind keine anderen Elemente vorhanden – nur der schwebende Wasserspiegel und der Flakon. Die Farben sollten sanft gedämpft sein und eine analoge Farbpalette mit geringer Sättigung verwenden, um eine ruhige, atmosphärische Stimmung zu erzeugen. Integriere das subtile Zusammenspiel von Licht, Reflexion und Wassertextur, um ein Gefühl surrealer Ruhe hervorzurufen. Referenzbilder: Acqua di Gioia Flakon, Spiegelform und Rahmenstil.“

KI-generiertes Bild

Und hier ist das von der KI generierte Bild:

An AI-generated image by mmiri, created using ChatGPT, mimicking a product shot of the Acqua di Gioia bottle. The composition resembles the original photograph, featuring the bottle on a curved mirror-like surface, but with noticeable inaccuracies and missing details due to imperfect interpretation.

Und das passiert, wenn wir versuchen, die KI zu zwingen, den Spiegel um 90 Grad zu drehen:

Another AI-generated image by mmiri, created with ChatGPT, replicating a product shot of the Acqua di Gioia bottle. While the setup mirrors the original—placing the bottle on a curved, mirror-like surface—the bottle’s shape is significantly distorted, marking a clear deviation from the real design.

Ehrlich gesagt, obwohl wir zuversichtlich waren, dass die Originalfotografie besser und eindrucksvoller sein würde, hatten wir gehofft, die KI könnte ein Ergebnis liefern, das näher dran ist – zumindest für ein spannenderes Experiment. Ein Experte im Prompten könnte wahrscheinlich ein besseres Ergebnis erzielen, aber die Frage bleibt: Ist das bei einem so speziellen Konzept wirklich effizienter als traditionelle Fotografie? Effizienz ist schließlich eines der größten Verkaufsargumente der KI. Wir müssen zugeben, dass wir in diesem Fall vom Ergebnis der KI enttäuscht waren. Man könnte natürlich argumentieren, dass dieses spezielle, ungewöhnliche Setup nicht der beste Testfall für die Stärken der KI war. Bei einer anderen Art von Aufgabe würde sie wahrscheinlich deutlich besser abschneiden.

Fazit

Unsere Gedanken zum Schluss: Wenn man ein Motiv braucht, das bereits schon tausendfach in ähnlicher Form existiert, kann KI unglaubliche Produktivitätsvorteile bringen. Wer knapp bei Budget, Zeit oder Ressourcen ist, wird in Zukunft in manchen Szenarien mit KI vermutlich bessere Ergebnisse erziehel können als mit traditioneller Fotografie.

Allerdings werden wir das Gefühl nicht los, dass die KI in ihrem jetzigen Zustand eine gewisse Mittelmäßigkeit fördert. Die Ergebnisse fühlen sich oft wie ein Durchschnittswert aus den Millionen von Bildern an, mit denen die KI trainiert wurde. Wir vermuten, dass es deshalb so schwierig ist, sie dazu zu bringen, etwas wirklich Einzigartiges oder Unkonventionelles zu generieren– etwas, das nicht längst schon in ähnlicher Form existiert.

Und hier stellt sich für uns die entscheidende Frage: Wenn es so einfach wird, Bilder zu erzeugen, und plötzlich alle das tun – wie interessant sind diese Bilder dann noch für das Publikum? Ist nicht gerade die Fähigkeit, sich abzuheben, einer der wertvollsten Aspekte in Marketing und Kunst?