KI? Was genau ist das nochmal?
Eine kleine Begriffserklärung:
KI und AI sind dasselbe nur einmal in deutsch und einmal in englisch: Künstliche Intelligenz bzw. Artificial Intelligence
Generative KI, generative AI und genAI sind Bezeichnungen für Software, die mithilfe von Algorithmen Text, Bilder, Musik etc. erstellen (generieren) kann.
Bei graphischen Lösungen spricht man entsprechend von bildschaffender KI.
Die Begriffe vermischen sich manchmal ein wenig. Da hilft es auf den Kontext zu achten. Wie meistens ;)
Aber was genau ist KI, AI, genART nun?
Das hat bestimmt jeder schonmal gehört: "Heutzutage schreibt ja keiner mehr selbst was. Das wird doch alles von der KI gemacht!"
Für jemanden der recht gerne schreibt, klingt das natürlich wie ein Vorwurf. Was macht jener (ich) also? Klar, er startet ChatGPT (das zur Zeit wohl bekannteste Text-Generierungs-Tool) und stellt die Frage: "Was ist bildschaffende KI?"
Und was soll ich sagen ... die Antwort ist erstaunlich gut und umfassend. Könnte ich direkt hier rein kopieren und mir ein Eis holen gehen.
Mach ich aber nicht. Weil die Antwort von ChatGPT eben auch stinklangweilig ist. Und wer liest schon ernsthaft einen Artikel über künstliche Intelligenz, wenn es draussen mehr als 30 Grad hat und man nicht dazu gezwungen wird?
(Was für Texte gilt, gilt übrigens auch für Bilder. Dazu später mehr.)
Das Fazit aus der ChatGPT-Antwort möchte ich dennoch hier verwenden:
"Bildschaffende KI revolutioniert die Art und Weise, wie wir visuelle Inhalte erstellen und konsumieren. Sie eröffnet neue Möglichkeiten in der Kreativbranche und ermöglicht es auch Laien, hochwertige Bilder zu erstellen. Gleichzeitig wirft sie ethische und rechtliche Fragen auf, insbesondere in Bezug auf Urheberrecht und den potenziellen Missbrauch von KI-generierten Bildern, z.B. für Deepfakes.
Insgesamt ist bildschaffende KI ein faszinierendes Feld, das sowohl technische als auch kreative Potenziale hat und sich schnell weiterentwickelt."
Finde ich prima. Kann man so stehen lassen! Und auf die einzelnen Punkte im Detail eingehen.
Aber zuerst:
"Wie sieht das denn aus, was muss man da als Anwender genau machen, kann ich das auch?"
Der Einstieg ist wirklich ganz einfach:
- Man sucht sich eine App, Internetseite oder ein Tool (siehe Artikel zu ...)
- Man schreibt in das Prompt-Feld, was man gerne von der KI gemacht haben will und drückt auf Go, Generieren, Start was auch immer
- Man ist beeindruckt, überrascht und speichert bei Gefallen einen oder alle der Vorschläge.
Entweder macht man das so lange bis es langweilig wird oder man will irgendwann mehr. Zum Beispiel soll auf dem Bild der eigene Hund oder das eigene Haus zu sehen sein. Der Hund vom Nachbarn ist mir wurscht. Ich möchte natürlich ein Bild von meinem eigenen haben. Aber da wird es dann schwierig. Denn egal wie oft ich "Schnuffi" in den Prompt eingebe, da kommt - wenn überhaupt - immer nur irgendein Hund dabei raus, der zwar realistisch aussieht aber so gar nichts mit Schnuffi zu tun hat.
Woran liegt´s? Ganz klar: die KI kennt Schnuffi nicht. Das ist an sich schon mal unverzeihlich.
Und falsch.
Denn die KI ist "nur" das Programm, der Algorithmus der versucht Daten und Eingabe in Einklang zu bringen. Diese Daten sind in einem sogenannten Model gespeichert. Man nennt das auch "trainiert".
Finde ich persönlich zwar etwas affig, denn letzten Endes speichert man Informationen in eine Datenbank und versieht diese mit Begriffen, die uns Menschen den Zugriff darauf erleichtern. Aber das ist ein grundsätzliches Problem der Vermenschlichung von Dingen die wir nicht verstehen.
So richtig intelligent ist so eine KI ja auch nicht. Tausche ich das verwendete Model mit einem anderen aus, erstellt mir dieselbe KI ein ganz anderes Bild daraus. Nicht gerade clever ...
Und genau das ist der Ansatz wie wir Schnuffi in die Dose äh, das Model bekommen. Wir müssen es trainieren! Das Model.
Also 20-30 Fotos von Schnuffi machen. In unterschiedlichen Posen, aus unterschiedlichen Richtungen, in hoher Qualität. Danach jagen wir die Fotos durch ein anderes Tool, geben jedem Foto möglichst klare Bezeichnungen mit und erstellen per Knopfdruck ein eigenes Model von Schnuffi.
Laden wir dieses Model dann in unsere KI-Anwendung ta-daaa: Schnuffi wie er leibt und lebt. Je nachdem wie gut das Bildmaterial war, können so sehr treffende Bilder von unserem Hund im Schnee, am Strand, im Weltraum erstellt werden.
Falls Schnuffi dem Ganzen auch noch zugestimmt hat, ist alles prima.
Falls nicht, könnte es sein, dass wir demnächst Post von der Anwaltskanzlei Knochen&Leckerli bekommen.
Ihr merkt schon: wir reden jetzt von Deepfakes und den Schattenseiten der KI-Möglichkeiten!
Selbst wenn man nur so zum Spaß ein Bild generieren lässt, in dem zum Beispiel eine reale Person zu erkennen ist und dieses dann - natürlich auch nur aus Jux - in seinen social Media teilt, begeht man damit potenziell eine Verletzung des Persönlichkeitsrechtes dieser Person.
Also Finger weg! Nicht cool!
Wem die moralische Keule noch nicht als Hinderungsgrund ausreicht, dem sei gesagt, dass Bildgenerierung auf Bilderkennung basiert. Wäre ich ein fieser Abmahnanwalt, würde ich ständig das gesamte Internet nach Deepfakes absuchen um mal zu schauen, wem ich da eine Abmahnung über ein paar tausend Euro zustellen könnte. Unrealistisch? Fragen Sie mal bei denen nach, die solche Abmahnungen bekommen haben, weil auf ihrer Webseite das Impressum nicht korrekt angegeben war.
Anmerkung: Einige Tools die auf dem Markt sind, verwenden Modelle die mit Bildern aus dem gesamten Internet trainiert wurden. Zum Teil auch ohne Einwilligung der Urheber. Hier sollte man sich die Nutzungsbedingungen genau ansehen, bevor man daran denkt, diese kommerziell zu nutzen.
So. Jetzt sind wir die wichtigsten Punkte aus dem ChatGPT-Fazit durchgegangen:
- was ist die Revolution? Man kann schnell und unkompliziert hochwertiges Bildmaterial aus Bilddatenbanken (Models) erstellen
- was sind die neuen Möglichkeiten? Man kann Schnuffi durchs Weltall sausen lassen ohne eine Rakete mieten zu müssen.
- können Laien das? Ja, solange es nicht darum geht eine Bildidee exakt nach Vorgaben umzusetzen.
- wie ist die rechtliche Situation? Bitte keine Deepfakes! Und bei kommerzieller Nutzung erstmal schauen ob das erlaubt ist.
Bleibt noch die Frage zu klären, warum man sich langweilige Bilder bei 30 Grad anschauen sollte.
Soll man natürlich nicht. Es sollte gar keine langweiligen Bilder geben!
So wie man aus einem langweiligen KI-generierten Text eine Story über Hunde im Weltall machen kann, kann man auch aus unspektakulären KI-generierten Bildern interessante Kunstwerke schaffen.
Die Möglichkeit dazu hat nun jeder.
Es gibt also keine Ausrede mehr:
her mit den kreativen Ideen!