Bessere Prompts für KI-Bildgeneratoren

KI-Bildgeneratoren wie Stable Diffusion, MidJourney oder Dall-E können heute bereits erstaunliche Resultate liefern. Wer diese Werkzeuge allerdings schon einmal selbst ausprobiert hat, wird feststellen: Ganz so einfach auf Knopfdruck geht es dann doch nicht.

Wer verlässlich und regelmäßig gute Ergebnisse erzielen will, muss sich mit den Eigenarten dieser Angeboten beschäftigen. Dazu gehört  ähnlich wie bei KI-Textgeneratoren der Hinweis: Je vager der Prompt, desto austauschbarer und zufälliger das Ergebnis.

Hier nun zunächst einige generelle Tipps für bessere Prompts:

  • Aussagekräftige Sprache. Beschreibe detailliert, was du sehen möchtest. Dazu gehören Dinge wie Farben, Texturen, Beleuchtung und Komposition.
  • Stile und Techniken. Denke darüber nach, welchen Stil das Ergebnis haben soll. Das können Kunstrichtungen sein, genutzte Materialien oder auch die Art eines Fotos.
  • Motiv und Kontext. Erkläre das Hauptmotiv des Bildes und füge bei Bedarf außerdem Informationen zum Kontext hinzu wie etwa den Ort oder die Tageszeit.
  • Komposition und Perspektive. Der Wunsch nach einer Nahaufnahme wird zu einem anderen Ergebnis führen als ein Luftbild.
  • Stimmung und Gefühle. Ja, du kannst auch ergänzen, welche Stimmung oder Gefühle das Bild vermitteln soll. Ist es eher humorvoll oder eher melancholisch?

Wie du siehst: Du brauchst idealerweise bereits eine Vorstellung davon, wie das Ergebnis aussehen soll. Dabei musst du aber keinesfalls alle oben genannten Punkte benennen.

Zugleich gilt: Je genauer du deine Idee im Kopf hast, desto frustrierender kann die Umsetzung sein. Denn heutige KI-Werkzeuge straucheln beispielsweise bei Bildideen, für die es in ihrem Trainingsmaterial nicht genug (oder gar keine) Beispiele gibt.

Du wirst mit der Zeit lernen, was verlässlich gut funktioniert und wo es schwierig wird.

Einige weitere Tipps zum Vorgehen an dieser Stelle:

  • Je nach KI kannst du ein vorhandenes Bild oder Foto als Vorlagenutzen. Sogar Skizzen können ausreichen. Auf diese Weise kannst du etwa die Bildkomposition oder eine bestimmte Körperhaltung bestimmen.
  • Verbessere dein Verständnis für die Stärken und Schwächen des Werkzeugs Schritt für Schritt.
  • Jedes Tool ist anders und sogar eine neue Version kann eine andere Ausrichtung haben als du bislang kennst. Experimentiere deshalb so viel wie möglich!
  • Schaue dich nach guten Vorbildern um und merke dir Begriffe für den Prompt, die zu gewünschten Ergebnissen führen. Kopiere allerdings nicht alles wahllos, denn so manche KI-Profis nutzen viel zu lange Prompts, weil sie nie getestet haben, was davon tatsächlich wirkungsvoll ist und was nicht. Bei Ideogram kannst du beispielsweise sehen, was andere generieren und mit welchen Prompts.

Die Anbieter dieser Werkzeuge haben inzwischen selbst erkannt, dass es vielen Nutzer:innen schwer fällt, ihre Bildidee in Worte zu fassen.

Deshalb übernimmt das bei Dall-E beispielsweise ChatGPT: Du erklärst dem Chatbot möglichst genau, was du brauchst und der setzt es in einen passenden Prompt um. Ideogram macht dies ebenfalls automatisch und zeigt dir stets an, welchen erweiterten Prompt es genutzt hat.

Und Google wiederum experimentiert mit einer Benutzeroberfläche, bei der du Alternativen zu deinen bisherigen Begriffen aus dynamisch generierten Pulldown-Menüs wählen kannst. Auch das hilft dabei, auf neue Ideen zu kommen.

Insofern: In nicht allzu ferner Zukunft werden deine Prompt-Künste vielleicht nicht mehr so wichtig sein, da es die Tools selbst übernehmen oder dich aktiv unterstützen. Dennoch glaube ich: Auch dann wird es weiterhin gut sein, die Details zu verstehen, um gezielt auf Ergebnisse hinzuarbeiten.

Mehr zum Thema:

Bleib up-to-date: