Analogien: Böse II

Analogien, Assoziationen und Symbole sind die Sprache der visuellen Kommunikation. Wer sie versteht, kann sich grafisch besser ausdrücken.

»Analogien, Assoziationen und Symbole« ist ein Projekt, das ich vor einigen Monaten betrieben habe, um Erfahrung im Prompten generativer KI zu sammeln und gleichzeitig meinen Wortschatz an Bildern für visuelle Botschaften zu trainieren.

In den letzten Monaten hat das Projekt geruht, weil ich mich mit anderem befasst habe. Nun habe ich es wieder einmal zur Hand genommen, primär, weil mich interessiert, ob sich KI verbessert hat, wenn es darum geht, die Bilder in meinem Kopf zu visualisieren.

Diese Motive sind mir zu »Böse« (ein Thema, mit dem ich mich jetzt zum zweiten Mal befasst habe) eingefallen.

Die Bilder, die mir dazu eingefallen sind, waren eine einfache Aufgabe für die KI: Charles Manson, ein Terrorist der Gilft in ein Trinkwasser-Reservoire schüttet, eine Hexe, eine Krähe auf einem Totenschädel, eine schwarze Katze, ein böser Clown und ein Alien. Lauter Subjekte.

Schwierig wird es, wenn im Bild mehrere Subjekte vorkommen, die in bestimmter Art miteinander in Beziehung stehen oder interagieren sollen. Es wird einen Grund haben, dass man in User-Galerien mit KI-Bildern solche Motive so gut wie gar nicht findet. Es werden nahezu ausschließlich Subjekte gezeigt.

Eine solche Aufgabe war beispielsweise das Motiv: »eine Person der einerseits ein Engel, andererseits ein Teufel ins Ohr flüstert« (das ist kein Prompt, den ich verwendet habe, sondern nur die Beschreibung des Motivs, um das es mir ging). Vor ein paar Monaten ist es mir noch nicht gelungen, dieses Motiv mit KI in akzeptabler Qualität umzusetzen. Bei meinen letzten Versuchen in den vergangenen Tagen sind einigermaßen brauchbare Resultate herausgekommen, primär Dank Nano Banana, auch wenn sie nicht vollauf meinen Vorstellungen entsprechen.

Interessant finde ich, dass, wenn es um Prompting geht, überwiegend der Stil thematisiert wird. Was für ein Blickwinkel, was für eine Kamera, welche Brennweite, was für ein Licht, welche Blende, welcher Künstler soll plagiiert werden etc. Ich habe noch kein Tutorial gesehen, das verrät, wie man den Inhalt der Bilder so hinbekommt, wie man ihn haben möchte. Vielleicht gehen mir die einschlägigen Berichte ja einfach nur effizient aus dem Weg. Für einschlägige Tipps und Hinweise bin ich definitiv dankbar.

Aber nicht nur komplexe Motive mit Interaktionen können zum Problem werden. Die nächste Galerie zeigt Resultate zum Thema Weggabelung. Der Begriff, um den es geht: Entscheidung. Das Motiv: eine Person am Scheideweg.

Keines der Bilder wirkt ausreichend natürlich, dass ich es für eine professionelle Kommunikationsaufgabe einsetzen würde. Einmal abgesehen davon, dass einige Motive einen geraden Weg zeigen, und keinen der sich teilt, wirkt die Gabelung oder der weitere Wegverlauf in allen Bildern unglaubwürdig. Bei vielen Resultaten scheint die Breite des Ausgangsweges der Breite der gabelnden Wege zusammen zu entsprechen.

Wahrscheinlich bekomme ich irgendwann ein ausreichend glaubwürdiges Ergebnis, wenn ich es nur lange und oft genug versuche. Aber das hat mehr mit Würfeln, als mit systematischem Prompten zu tun.

Ja, vielleicht prompte ich falsch, obwohl ich schon viele Tutorials dazu angeschaut und das Gezeigte selbst probiert habe. Von daher: Wer weiß, was ich prompten muss, um eine Person an einer glaubwürdigen Weggabelung zu bekommen – gerne her damit. Tatsächlich hat mir unlängst jemand einen Prompt geschickt, der produziert hat, was mir nicht gelungen ist. Ich lerne immer gerne weiter und lasse mich jederzeit belehren.

Weitere Begriffe und Galerien findest du im Beitrag »Analogien, Assoziationen, Symbole«.

Schreibe einen Kommentar Antwort abbrechen

Newsletter abonnieren: