DALL-E 2 ist ein von OpenAI entwickeltes Computerprogramme, welches Bilder aus Textbeschreibungen erstellen kann.
Der Algorithmus ist in seiner zweiten Version in der Lage, mehrere Begriffe in ein logisches Verhältnis zu setzen und damit aberwitzige Bilder zu kreieren. Der Anwender teilt dem System möglichst genau mit, welcher Inhalt in welchem Stil abgebildet werden soll und die künstliche Intelligenz generiert mit dieser Eingabe Bilder in jeder beliebigen künstlerischen Stilrichtung.
Neben der Möglichkeit der Texteingabe, können die Nutzer auch eigene Bilder hochladen und diese bearbeiten. Darüber hinaus kann mit bereits vorhandenen Beispielbildern experimentiert und neue Bilder mit denselben Prompts generiert werden. Die Ergebnisse machen deutlich wie zufällig die Kreationen sind. Identische Prompts können komplett unterschiedliche Resultate hervorbringen.
Die Leistungsfähigkeit von DALL-E ist insofern beeindruckend als dass innerhalb von Minuten die skurrilsten Bilder in verschiedensten Stilrichtungen erzeugt werden können. Wirklich kreativ ist davon aber wenig. Vielmehr handelt es sich offensichtlich primär um eine visuelle Umsetzung von eher konzeptlosen Datenkombinationen.
Zudem hat die KI unter anderem anscheinend oft Probleme menschliche Gesichter darzustellen. Generell liefern Prompts für abstrakte, nicht reale Bilder scheinbar die besten Ergebnisse.
Einige problematische Aspekte der Technik
Stand: Januar 2023
[1] Lawsuit challenging Stable Diffusion https://stablediffusionlitigation.com/
Getty Images https://newsroom.gettyimages.com/en/getty-images/getty-images-statement
[2] Richtlinien für Inhalte https://labs.openai.com/policies/content-policy
Sammlung von mit DALL-E erschaffener Bilder: https://commons.wikimedia.org/wiki/Category:DALL-E
Tags: Elon Musk Sam Altman Open AI Dall-E Craiyon DALL-E mini Pre-trained Transformer 3 Bildgenerator Midjourney Stable Diffusion Stability AI maschinelles Lernen künstliche Intelligenz Copyright USA Fair Use Karla Ortiz Sarah Andersen Kelly McKernan DeviantArt Getty Images
Der Algorithmus ist in seiner zweiten Version in der Lage, mehrere Begriffe in ein logisches Verhältnis zu setzen und damit aberwitzige Bilder zu kreieren. Der Anwender teilt dem System möglichst genau mit, welcher Inhalt in welchem Stil abgebildet werden soll und die künstliche Intelligenz generiert mit dieser Eingabe Bilder in jeder beliebigen künstlerischen Stilrichtung.
Neben der Möglichkeit der Texteingabe, können die Nutzer auch eigene Bilder hochladen und diese bearbeiten. Darüber hinaus kann mit bereits vorhandenen Beispielbildern experimentiert und neue Bilder mit denselben Prompts generiert werden. Die Ergebnisse machen deutlich wie zufällig die Kreationen sind. Identische Prompts können komplett unterschiedliche Resultate hervorbringen.
Die Leistungsfähigkeit von DALL-E ist insofern beeindruckend als dass innerhalb von Minuten die skurrilsten Bilder in verschiedensten Stilrichtungen erzeugt werden können. Wirklich kreativ ist davon aber wenig. Vielmehr handelt es sich offensichtlich primär um eine visuelle Umsetzung von eher konzeptlosen Datenkombinationen.
Zudem hat die KI unter anderem anscheinend oft Probleme menschliche Gesichter darzustellen. Generell liefern Prompts für abstrakte, nicht reale Bilder scheinbar die besten Ergebnisse.
Einige problematische Aspekte der Technik
- Urheberrecht: Wer hält die Rechte an den von der KI erschaffenen Werken und inwieweit müssen Künstler deren Bilder zu Trainingszwecken benutzt wurden, entschädigt werden? Erste Klagen von Künstlern und der Bildagentur Getty Images sind bereits anhängig. [1]
- Fälschungen: Die Generierung von Desinformation und täuschend echt aussehenden gefälschten Bildern. Mithilfe der Technik können z.B. Personen des öffentlichen Lebens verunglimpft oder gewaltverherrlichende Inhalte generiert werden.
- Möglichkeiten des Missbrauchs: Ohne Schutzmaßnahmen könnte z.B. fotorealistisches pornografisches Material erstellt werden. [2]
- Zensur: Die wohlmeinenden Filter führen ihrerseits bisweilen zu absurden Blockierungen von vollkommen harmlosen Inhalten.
- Cultural Bias: Der Algorithmus ist wahrscheinlich nicht frei von einer gewissen kulturellen Voreingenommenheit, da die Bilder zum Training des Programms zum größten Teil aus dem westlichen Kulturkreis stammen. Die auf dieser Basis generierten Bilder können daher gewisse stereotype Vorstellungen beinhalten.
Stand: Januar 2023
[1] Lawsuit challenging Stable Diffusion https://stablediffusionlitigation.com/
Getty Images https://newsroom.gettyimages.com/en/getty-images/getty-images-statement
[2] Richtlinien für Inhalte https://labs.openai.com/policies/content-policy
Sammlung von mit DALL-E erschaffener Bilder: https://commons.wikimedia.org/wiki/Category:DALL-E
Tags: Elon Musk Sam Altman Open AI Dall-E Craiyon DALL-E mini Pre-trained Transformer 3 Bildgenerator Midjourney Stable Diffusion Stability AI maschinelles Lernen künstliche Intelligenz Copyright USA Fair Use Karla Ortiz Sarah Andersen Kelly McKernan DeviantArt Getty Images