Generative KI-Systeme sind ein kontrovers diskutiertes Thema in der Kreativbranche. Diese Systeme nutzen Deep Learning-Algorithmen, um neue Inhalte auf der Grundlage von vorhandenem Material zu generieren, wie zum Beispiel Texte, Bilder, Musik oder sogar Videos.
In diesem Kapitel möchte ich dir einen Einblick in die Welt der generativen KI-Systeme geben. Ich werde dir aufzeigen, wie ich diese Systeme nutze und welche Erfahrungen ich dabei gemacht habe. Außerdem werde ich dir konkrete Anwendungsbeispiele aus verschiedenen Bereichen präsentieren, damit du eine Vorstellung davon bekommst, was mit generativer KI alles möglich ist.
Generative KI genauer erklärt
Generative KI-Systeme basieren in der Regel auf Deep-Learning-Technologien wie generativen adversariellen Netzen (GANs) oder variationalen Autoencodern (VAEs). Bei GANs handelt es sich um Systeme, die aus zwei Netzwerken bestehen: einem Generator, der neue Daten erzeugt, und einem Diskriminator, der entscheidet, ob die Daten echt oder gefälscht sind. Der Generator wird dann so trainiert, dass er immer bessere gefälschte Daten erzeugt, die vom Diskriminator nicht als solche erkannt werden können.
VAEs sind ein weiterer Ansatz zur generativen KI. Sie basieren auf der Idee, dass ein KI-System ein Latent Space-Modell erstellt, in dem bestimmte Merkmale eines Datensatzes codiert werden. Dieser Codierungsvorgang ermöglicht es dem System, neue Daten zu generieren, die auf der zugrunde liegenden Struktur des Modells basieren.
Generative KI-Systeme können in der Kreativbranche eingesetzt werden, um neue und originelle Inhalte zu generieren. Zum Beispiel können GANs dazu verwendet werden, realistische Bilder von Personen, Orten oder Objekten zu erzeugen, die nicht existieren, aber dennoch realistisch aussehen. VAEs können auch zur Erzeugung von Texten oder Musik verwendet werden, indem sie eine vorhandene Sammlung von Werken analysieren und daraus neue Stücke generieren.
Warum KI für die Kreativbranche relevant ist
Wie bereits im 1. Teil dieser Blogreihe beschrieben, ist die Verwendung von künstlicher Intelligenz (KI) in vielen Bereichen des täglichen Lebens bereits allgegenwärtig, sei es bei der Verarbeitung von Sprache, der Bilderkennung oder der Optimierung von Abläufen. Auch in der Kreativbranche gewinnt KI zunehmend an Bedeutung und wird bereits von Vielen eingesetzt.
Relevanz für Kreative
Ein wichtiger Faktor ist die zunehmende Automatisierung von repetitiven Aufgaben. KI-Systeme übernehmen das Katalogisieren von Bildern, das Erstellen von Texten oder die Erstellung von Layouts automatisch, was Zeit und Ressourcen spart. Das gibt Kreativen mehr Freiraum für schöpferische Arbeit, da sie sich auf komplexere und anspruchsvollere Aufgaben konzentrieren können. In der Folge können Unternehmen schneller und effizienter arbeiten und ihre Wettbewerbsfähigkeit steigern.
Analyse
KI-Systeme können Daten und Trends analysieren, um fundierte Entscheidungen zu treffen und Vorhersagen zu treffen. Das kann bei der Identifizierung von Trends und Zielgruppen helfen und bei der Erstellung von Inhalten unterstützen, die auf diese abzielen. KI kann auch dazu beitragen, die Effektivität von Kampagnen zu messen und zu verbessern, indem sie Verhaltensmuster von Zielgruppen analysiert und Optimierungsvorschläge liefert.
Kreativität
Ein weiterer wichtiger Aspekt ist die Kreativität selbst. Viele KI-Systeme können kreativ sein und neue Ideen und Ansätze generieren. Generative KI-Systeme können beispielsweise Bilder, Musik oder Texte erzeugen, die von Menschenhand geschaffenen Werken schwer zu unterscheiden sind. Diese Technologie kann Kreativen dabei helfen, neue Ideen zu entwickeln oder sogar neue Formen der Kunst zu schaffen. Darüber hinaus können KI-Systeme helfen, Kreativität in Unternehmen zu fördern, indem sie eine Umgebung schaffen, in der Ideen und Innovationen gefördert werden.
Conclusio
Es gibt unter KollegInnen die Bedenken, dass KI die Kreativität von Menschen ersetzen könnte. Doch diese Befürchtungen sind meiner Meinung nach eher unbegründet. KI kann zwar repetitive und einfache Aufgaben übernehmen, aber die Kreativität und das künstlerische Schaffen selbst sind etwas, das von Menschen geschaffen wird und schwer von einer Maschine zu ersetzen ist. Vielmehr kann KI Kreativen helfen, die eigene Kreativität zu erweitern und zu verbessern, indem sie ihnen Tools zur Verfügung stellt, die die Arbeit erleichtern und inspirieren.
Auch ist die eigene Erfahrung unabdingbar, um die Korrektheit und Qualität der Ergebnisse zu kuratieren und zu bewerten. Was sich allerdings ändert wird, sind die einzelnen Arbeitsschritte bzw. ganze Produktionsabläufe.
Renommierte Branchentools mit KI-Unterstützung
In der Designbranche wird KI schon länger in vielen etablierten Anwendungen eingesetzt, um die Arbeit von Designern zu unterstützen und zu verbessern. Einige der bekanntesten Tools, die auf KI basieren, sind Adobe Photoshop und Adobe Illustrator.
Auch in der Bilderkennungssoftware Google Lens kommt KI zum Einsatz. Google Lens kann Objekte in Bildern erkennen und weitere Informationen dazu liefern. Zum Beispiel kann die Software den Nutzern sagen, welches Gebäude auf einem Foto zu sehen ist oder wo man ein bestimmtes Produkt kaufen kann.
Auch die häufig genutzte Grafikdesignplattform Canva bietet eine automatische Generierung von Farbschemata und Entwürfen an. Der Nutzer gibt dabei lediglich die gewünschten Farben und die Art des Designs ein, und das Tool generiert daraufhin passende Entwürfe.
Und auch Figma, ein Design-Tool für User Interfaces, setzt auf KI. Das Figma bietet eine Funktion namens „Auto Layout“, die automatisch Elemente wie Buttons und Textfelder auf einer Seite anordnet. Dabei wird berücksichtigt, wie viel Platz jeder Elementtyp benötigt und wie die Inhalte angeordnet werden sollten.
Weitere Anwendungen:
KI-Bildgeneratoren
KI-Bildgeneratoren sind Softwareanwendungen oder Plattformen, die auf Künstlicher Intelligenz (KI) basieren und in der Lage sind, Bilder zu generieren, zu verändern oder zu transformieren. Sie nutzen verschiedene KI-Techniken wie Deep Learning, neuronale Netzwerke und GANs (Generative Adversarial Networks), um visuelle Inhalte zu erstellen oder zu bearbeiten.
Diese Generatoren können auf unterschiedliche Weise eingesetzt werden. Einige ermöglichen es BenutzerInnen, eigene Bilder hochzuladen und mit verschiedenen Stilen, Effekten oder Filtern zu kombinieren, um ein neues künstlerisches Ergebnis zu erzielen. Andere Generatoren können Bilder basierend auf einer Textbeschreibung oder einer Skizze automatisch generieren, wobei die KI das Bild aus dem Kontext erstellt.
KI-Bild-Generatoren haben in den letzten Jahren große Aufmerksamkeit erlangt, da sie erstaunliche Ergebnisse erzielen können. Sie können fotorealistische Bilder erzeugen, künstlerische Stile nachahmen oder surreale und abstrakte Kreationen schaffen. Sie werden in verschiedenen kreativen Bereichen wie Kunst, Design, Fotografie, Film und Werbung eingesetzt, um visuelle Inhalte zu erzeugen und zu verbessern.
Es ist wichtig anzumerken, dass die Qualität und Genauigkeit der Ergebnisse stark von den verwendeten KI-Modellen und den zugrunde liegenden Trainingsdaten abhängt. Einige Generatoren können beeindruckende Ergebnisse liefern, während andere möglicherweise weniger überzeugend sind.
Die 3 beliebtesten Text-zu-Bild-Generatoren
(Stand Mai 2023)
Text-zu-Bild-Generatoren sind KI-Modelle, die Bilder aus Textbeschreibungen generieren. Sie nutzen maschinelles Lernen und neuronale Netzwerke, um eine Verbindung zwischen Text und visuellen Konzepten herzustellen. Die Generatoren finden Anwendung in der Werbung, beim Storyboard-Erstellen und mehr. Die generierten Bilder können jedoch gelegentlich inkonsistent oder ungenau sein. Dennoch zeigen sie das Potenzial von KI in der visuellen Kunst und Kommunikation.
DALL·E 2
DALL·E 2 ist zweifellos der bekannteste Name unter den KI-Bildgeneratoren – und das aus gutem Grund. Er war der erste, der faszinierende und interessante Bilder erstellen konnte und weit genug verbreitet war, um viral zu gehen. Und obwohl der Erste nicht unbedingt der Beste sein muss, hat DALL·E 2 einiges zu bieten.
Mit einen kostenlosen OpenAI-Account lässt sich per Text eingeben, was man sehen möchte. Nach dem Klicken auf „Generieren“ und innerhalb weniger Sekunden stehen vier AI-generierte Bildvarianten zur Auswahl. OpenAI hat auch ChatGPT entwickelt, sodass man sich schnell zurechtfinden wird, wenn man dies bereits verwendet hat.
DALL·E 2 ist sehr einfach zu bedienen und hat auch einige leistungsstarke Funktionen. Der Bildeditor (der sich in der Beta-Phase befindet) ermöglicht es, zusätzliche generierte Rahmen hinzuzufügen, um ein Bild zu erweitern, egal ob Sie es mit DALL·E 2 generiert oder hochgeladen haben. Diese Technik, die als „out-painting“ bezeichnet wird, ermöglicht es Ihnen, größere Werke der KI-Kunst zu erstellen.
Es gibt auch einen Radiergummi, mit dem Sie Teile eines Bildes entfernen und durch KI-generierte Elemente ersetzen können (diese Technik wird als „in-painting“ bezeichnet).
Neben der DALL·E 2 Web-App bietet OpenAI auch eine API an, mit der Entwickler Apps erstellen können, die mit DALL·E 2 integriert sind. Dadurch ist es möglich, DALL·E 2 mit Zapier zu verbinden, um automatisch Bilder aus Google Forms- oder HubSpot-Antworten zu erstellen – auch ist dies mit jeder anderen App möglich.
Midjourney
Midjourney liefert aktuell meines Erachtens die besten Ergebnisse unter allen Bildgeneratoren in dieser Liste. Die von ihm erstellten Bilder wirken zusammenhängender, mit besseren Texturen und Farben – und insgesamt sind die Ergebnisse einfach interessanter und visuell ansprechender.
Insbesondere Personen und reale Objekte wirken lebensechter und natürlicher als bei anderen KI-Bildgeneratoren, zumindest ohne viele Eingabeaufforderungen(Prompts).
Es ist bemerkenswert, dass es der erste KI-Bildgenerator war, der einen Kunstwettbewerb gewonnen hat.
Allerdings ist die Beta-Version von Midjourney nur über Discord zugänglich, wo die generierten Bilder öffentlich gepostet werden. Das verleiht allem eine coole Community-Atmosphäre, bedeutet aber auch, dass jeder sehen kann, was man erstellt. Während dies für manche Künstler kein Problem sein mag, kann dies ein Ausschlusskriterium sein, wenn Midjourney für geschäftliche Zwecke genutzt werden soll.
Die Hilfe-Dokumentation von Midjourney ist sehr gut und führt Nutzer durch den Einstieg sowie alle fortgeschrittenen Funktionen, wie verschiedene Modellversionen, das Hochskalieren von Bildern, das Mischen mehrerer Bilder und die Verwendung verschiedener Parameter zur Steuerung. Sobald die verschiedenen Optionen verstanden sind, sind die erzielbaren Ergebnisse wirklich erstaunlich.
Die kostenlose Testversion von Midjourney begrenzt Nutzer auf insgesamt 0,4 Stunden GPU-Zeit oder etwa 25 Bilder. Die Bilder sind außerdem auf eine CC BY-NC 4.0 Creative Commons nicht-kommerzielle Lizenz beschränkt. Das Basic-Abonnement beginnt bei 10 US-Dollar pro Monat und ermöglicht 3,3 Stunden GPU-Zeit pro Monat oder etwa 200 Bilder. Nutzer haben auch die Möglichkeit, zusätzliche GPU-Zeit zu erwerben und die Bilder kommerziell zu nutzen.
Midjourney-Preise: Kostenlos für ~25 Bilder; ab 10 US-Dollar pro Monat für das Basic-Abonnement, das die Generierung von ~200 Bildern pro Monat und kommerzielle Nutzungsrechte ermöglicht.
DreamStudio (Stable Diffusion)
Stable Diffusion ist eine Open-Source-Software und unterscheidet sich damit von DALL·E 2 und Midjourney. Das bedeutet, dass jeder mit den entsprechenden technischen Fähigkeiten die Software herunterladen und auf seinem eigenen Computer ausführen kann. Dadurch besteht die Möglichkeit, das Modell für spezifische Zwecke zu trainieren und anzupassen.
Dieser KI-Bildgenerator wird von nahezu allen Diensten verwendet, die KI zur Generierung von künstlerischen Porträts, historischen Porträts, architektonischen Renderings und vielem mehr einsetzen.
Stable Diffusion wird auch über die leistungsstarke öffentliche App DreamStudio angeboten, die von Stability AI entwickelt wurde. Mit DreamStudio erlangt man eine enorme Kontrolle über die verschiedenen Aspekte der Bildgenerierung mit KI. So lässt sich die Größe des endgültigen Bildes, den Grad der Übereinstimmung mit dem Textprompt, die Anzahl der Schritte des Diffusionsmodells und die Anzahl der generierten Bilder anpassen.
Darüber hinaus können Sie die Version des Algorithmus auswählen und sogar einen spezifischen Startwert und eine Abtastmethode eingeben, um reproduzierbare Ergebnisse zu erzielen.
DreamStudio bietet auch Funktionen wie In-Painting und Out-Painting an, die Ihnen zusätzliche Möglichkeiten zur Bearbeitung und Anpassung der Bilder bieten.
DreamStudio arbeitet mit einem Guthabensystem. Bei der Registrierung erhalten Sie 100 kostenlose Credits, mit denen Sie 500 Bilder mit den Standard-Einstellungen generieren können. Wenn Sie ein leistungsstärkeres Modell verwenden, größere Bilder generieren oder mehr Schritte durchführen möchten, werden die Credits schneller aufgebraucht. SMan hat die Möglichkeit, zusätzliche Credits zu kaufen, die ab 10 US-Dollar für 1.000 Credits erhältlich sind.