Bilder sagen mehr als tausend Worte: KI-Bildgenerierung unter der Lupe

Dank modernster Technologien ist es heute ein Kinderspiel, beeindruckende Bilder zu erstellen. Ein paar Klicks und präzise Angaben genügen, um mit Hilfe von Künstlicher Intelligenz (KI) Illustrationen zu erzeugen. Die Grenzen der „Kreativität“ scheinen dank verschiedener Generatoren nahezu ausgelöscht. Im Folgenden soll analysiert werden, wie sich künstlich geschaffene Grafiken von manuell erstellten unterscheiden und welche charakteristischen Merkmale sie aufweisen.

Bernd B. Richter & Nicole Siebenhandl

Stürzt man sich ins Netz auf der Jagd nach KI-Bildgeneratoren, wird man von einer Vielzahl an Optionen überwältigt. DALL·E 3, NightCafe oder Midjourney verlocken dazu, diese Tools – mit erstaunlich geringem Aufwand – auszuprobieren. Doch Vorsicht ist geboten, denn je nach Anbieter können dabei unterschiedliche Kostenpakete ins Spiel kommen. Die große Bandbreite zeigt sich vor allem in der Qualität der Bildkreationen, und besonders bei den kostenlosen Angeboten wird schnell klar: Nicht alles, was glänzt, ist auch brillant.

Die kunsthafte Geburt eines KI-Meisterwerks

Die Entstehung einer KI-gestützten Grafik erfolgt durch eine Text-zu-Bild-Eingabe. Darunter versteht man, dass mittels genauer Angaben der Nutzer:innen in den Prompt (=Eingabefeld), Bilder basierend auf die eigentliche Aussage der Suchanfrage erstellt werden. Jede einzelne Komponente der eingegebenen Textanforderung wird im Netz mit Millionen von Bildern verglichen und analysiert. Daraus ergeben sich in der Folge eine Bildzusammenstellung (=Diffusion) unter Berücksichtigung der Beschreibung. Um einen gewissen Stil ins Spiel zu bringen und das Erscheinungsbild des Endresultates bestmöglich mitbestimmen zu können, verfügten die meisten KI-Anwendungen über etliche Settings: Texturen, Farben, Formen und Details könnten auf diesem Weg beispielsweise angepasst und verändert werden. Mitunter ist es deshalb auch so schwierig, die künstlich geschaffenen Werke von menschlichen Kreationen unterscheiden zu können, da Stile einfach adaptiert werden können. Dennoch könne es immer wieder zu kleinen Detailfehlern kommen. Jedoch nehmen diese durch stetige Weiterentwicklungen und Verbesserungen der KI-Anbieter ab und eröffnen immer häufiger neue Wege der „Kreativitätsentfaltung“.

Gleichzeitig mischt auch die Sprache kräftig mit, wenn es um künstliche Bildergenerierung geht. Einzelne Begriffe oder winzige Wortfragmente sind hier schon ausreichend, um Klischees, Normen oder gängige Ideale ins Bild zu rufen. Die gewählte Kommunikation setzt den Rahmen für die Darstellungsarten, sei es bei der Gestaltung von Personen oder anderen Motiven. Dabei ist es entscheidend, dass die kreativen Schöpfungen lediglich bestehende Daten miteinander kombinieren. Das heißt, das künstlerisch tätige Individuum spielt weiterhin eine Schlüsselrolle bei der Gesamtkomposition – ein essenzieller Beitrag, der die Kunst der KI-Bilderschaffung lebendig hält.

Umfrage zwischen Realität und Pixelträumen

Die erstaunliche Ähnlichkeit zwischen einem von KI geschaffenen Bild und einer von menschlicher Hand gefertigten Kreation soll durch die Enthüllungen einer eigens durchgeführten Umfrage hervorstechen (untenstehende Darstellung). In einem Experiment wurde eine Grafik (Nummer 2) mithilfe des Bildgenerators DeepAI kreiert. Die anderen drei Skizzen hingegen entsprangen der kreativen Feder eines Menschen.

© Bilder 1, 3, 4: Bernd Benedikt Richter. Bild 2 Auftrag an KI-Programm DeepAI: „Black and White line sketch with a lighthouse on a cliff and a sunset. Settings: Sandard, Old Style Generator“.

Das Umfrageergebnis verdeutlicht, dass die Unterscheidung zwischen von KI erzeugten und von Menschenhand geschaffenen Bildern herausfordernd ist, ohne einen klaren Trend aufzuzeigen. Mehr als die Hälfte der Befragten vermutete fälschlicherweise, dass eine Skizze aus Menschenhand und nicht von einer KI erstellt wurde. Insbesondere fällt auf, dass der Großteil der über 40-Jährigen Schwierigkeiten hatte, die künstliche Bildkomposition zu erkennen. Im Gegensatz dazu waren jüngere Teilnehmer:innen unter 40 Jahren besser darin, die von KI generierte Grafik richtig zuzuordnen. Dennoch tendierte die Mehrheit auch hier dazu, die auf menschliche Weise erstellten Bilder als vermeintliche KI-Kreationen zu identifizieren. Interessanterweise wurden die Bilder Nr. 1 und Nr. 4 am wenigsten mit Künstlicher Intelligenz in Verbindung gebracht, während sich für die Bilder Nr. 2 und Nr. 3 prozentuell fast der gleiche Anteil der Teilnehmer:innen entschied.

Erleben Sie die beeindruckende Realitätsnähe, die Künstliche Intelligenz auch mittlerweile in der Fotografie erreicht hat. Der folgende Selbsttest fordert Sie heraus: Identifizieren Sie das Bild, das von den kreativen Algorithmen der KI geschaffen wurde.

 

Den Cyberkreationen auf der Schliche

Die Künstliche Intelligenz hat in den letzten fünf Jahren einen beeindruckenden Fortschritt erlebt und sich nahezu in jedem Bereich etabliert. Während sie in einigen Sektoren bereits fest verankert ist, wird sie in anderen noch mit Skepsis betrachtet. Der Einsatz von KI-generierten Bildern nimmt stetig zu, was die Unterscheidung zwischen künstlicher Erzeugung und Realität zunehmend beeinflusst. Trotz der fortschreitenden Entwicklung kommt es bei der KI-Anwendung häufig zu Fehlern, da ihre Fähigkeiten noch nicht vollständig ausgebaut sind. Obwohl künstlich erzeugte Bilder heute nicht mehr so eindeutig erkennbar sind, wie vor ein paar Jahren und der Schwierigkeitsgrad in Bezug auf die Erkennbarkeit sichtlich gestiegen ist, gibt es dennoch einige Merkmale, anhand derer ein künstlich generiertes Bild identifiziert werden kann.

© Bild: Bernd Benedikt Richter. Auftrag an KI-Programm Bing: „Erstelle mir eine Kollage, welche Fehler zeigt, die durch die Erstellung von Bildern mittels Künstlicher Intelligenz entstehen.“.

Dyskalkulie beschreibt die Beeinträchtigung der Fähigkeit, nicht zählen zu können. Während Menschen heute selbstverständlich zählen und rechnen können, ist dies bei künstlicher Intelligenz nicht der Fall. Um ein künstliches Bild zu identifizieren, ist es entscheidend, die Logik hinterfragen und die Plausibilität bewerten zu können. Bilder, die von künstlicher Intelligenz geschaffen werden, sind oft durch abwegige Körperproportionen leicht zu erkennen, sei es ein plötzlich längerer Arm oder eine Überzahl an Händen.

Abschließend lässt sich feststellen, dass in der aktuellen Welt der Bildgenerierung durch Künstliche Intelligenz zwar noch einige Schwächen erkennbar sind, jedoch lassen die Fortschritte darauf schließen, dass diese in der Zukunft mit hoher Wahrscheinlichkeit behoben werden. Schon heute gestaltet sich die Enttarnung der von KI geschaffenen Bildkompositionen als echte Herausforderung. Die kommenden Jahre versprechen noch anspruchsvoller zu werden, bis die Erkennung wohl letztendlich vor einer scheinbar unüberwindbaren Hürde steht. Es bleibt spannend, wie sich diese kreative Revolution weiterentwickeln wird.

Die Überschriften wurden in Verbindung mit ChatGPT am 04.12.2023 um ca. 19 Uhr gestaltet. Die Bilder wurden mit unterschiedlichen Programmen im November 2023 generiert. Der Fließtext wurde am 17.12.2023 um ca. 19:30 Uhr mittels ChatGPT-Eingabe „Mache mir den folgenden Absatz journalistisch peppiger“ gestaltet. Eine Überarbeitung des Textes erfolgte mittels ChatGPT am 09.01.2024 um ca. 18:45 Uhr.

Über die Autor:innen

(Bild Copyright: Bernd Benedikt Richter)

Bernd Benedikt Richter studierte zwei Semester Byzantinistik und Neogräzistik an der Universität Wien bevor er zum Studiengang Medienmanagement an die Fachhochschule St. Pölten wechselte. Zurzeit produziert er diverse Fernseh- und Filmformate. Seine Interessen gelten speziell den Themen Kultur, Medien und Film.

Kontakt: www.linkedin.com/in/bernd-benedikt-richter

(Bild Copyright: Nicole Siebenhandl)

Nicole Siebenhandl ist 20 Jahre alt und studiert im 3. Fachsemester Medienmanagement an der FH St. Pölten. Sie pendelt regelmäßig mit dem Auto und vertreibt sich die Zeit gerne währenddessen mit Musikhören und kennt über die Maße viele Songs so gut, dass ein Karaoke-Abend ohne Prompts (sic!) für sie keine Herausforderung darstellt.

Kontakt: mm221028@fhstp.ac.at