26.08.2024 Interdisziplinäres KI-Forschungsprojekt

KI-Kreationen durchschauen und ihre Auswirkungen verstehen

Eva Cetinić

Kunst und Kultur sind mit einer Fülle von Bildern konfrontiert, die mit Künstlicher Intelligenz kreiert wurden. (Bild: Website «The Canon of Latent Spaces»)

«Künstler oder künstliche Intelligenz: Wer hat das Bild gemacht?», «Künstliche Intelligenz in der Kunst: Chance oder Gefahr?», «ChatGPT, klaust du unsere Kunst?», Das sind nur ein paar Beispiele für Artikel in Zeitschriften und auf Nachrichtenportalen, die in den letzten zwei Jahren die Bedenken vieler Kreativer gegenüber KI thematisiert haben. Die Diskussion über die Beziehung von Technologie und Kunst reicht zwar bis in die Anfänge der Computertechnik zurück, sie hat sich in den letzten Jahren durch die Durchbrüche im Bereich der generativen künstlichen Intelligenz aber noch intensiviert.

Vor allem seit dem Aufkommen multimodaler generativer KI-Technologien wurde es möglich, digitale Daten aus verschiedenen Quellen wie Video, Bild, Sprache, Ton und Text herauszunehmen, in ein anderes Medium zu transferieren und daraus etwas Neues zu erschaffen. Mithilfe multimodaler KI lässt sich die menschliche Wahrnehmung digital so detailreich nachbilden und verändern, dass sie teils nur schwer von «echten» Bildern, Videos oder Aussagen unterschieden werden können.

Erfolgreiche Text-Bild-Modelle

So sind Text-Bild-Modelle wie DALL:E, Imagen, Parti, Stable Diffusion, MidJourney, GROK und viele andere mittlerweile ausgesprochen erfolgreich bei der Erstellung realistischer und ansprechender Bilder aus Textbeschreibungen – und das in nur wenigen Sekunden. Die Bandbreite der möglichen Anwendungen ist gross und vielfältig, sie reicht von der Erschaffung von Illustrationen für Kinderbücher bis zur Stärkung von Fake News mit überzeugenden Bildern von Ereignissen, die nie stattgefunden haben. Text-Bild-Modelle finden daher nicht nur in der KI-Community derzeit enorme Beachtung, sondern auch bei Wissenschaftler:innen, Künstler:innen und Anwender:innen, die sich für neue Technologien interessieren.

Unbekannte Auswirkungen auf Kunst und Kultur

Dabei stellen sich zahlreiche Fragen zu den langfristigen Auswirkungen dieser Technologien: Welchen Einfluss werden diese auf unsere Vorstellungskraft und Kreativität haben? Wie wird sich die Verbreitung von KI-generierten Inhalten auf unsere Wahrnehmung auswirken? Wie beeinflussen multimodale KI-Technologien die künstlerische und kulturelle Gestaltung und deren Wertschätzung?

Beim Sesamstrassen-Elmo mit Pistole ist der Fake vergleichsweise harmlos. Andere KI-generierte Bilder fahren mit härterem Geschütz auf. (Bild: GROK/X)

Bei einer so neuen und sich schnell entwickelnden Technologie ist es unerlässlich, nicht nur ihre Beziehung zur Kunst und ihren Einfluss auf die Erstellung von Inhalten zu untersuchen, sondern auch die zugrunde liegenden Mechanismen ihrer Entwicklung und die Dynamik ihrer Nutzung zu verstehen.

Künstliche Intelligenz als Blackbox

Es ist bekannt, dass KI-Modelle aufgrund ihrer Komplexität oft als «Blackbox» bezeichnet werden. Die Herausforderung, das Innenleben von KI-Modellen zu verstehen, ist mit den jüngsten multimodalen generativen KI-Technologien noch grösser geworden. Da diese Modelle auf der Basis einer enormen Datenmenge aus dem Internet trainiert werden, stellen sich viele Fragen in Bezug auf das Verstehen, die Bewertung und die verantwortungsvolle Nutzung dieser Modelle.

Beispielsweise neigen sie oft dazu, soziale Vorurteile sowie demografische und kulturelle Stereotypen, die in ihren Trainingsdaten enthalten sind, zu übernehmen. Darüber hinaus werfen die breite Verfügbarkeit und Demokratisierung dieser Technologien auch Fragen zur Verletzung der Privatsphäre oder des Urheberrechts auf. Daher wird es immer wichtiger, die technologischen Grundlagen und die verschiedenen kulturellen, ethischen und gesellschaftlichen Auswirkungen dieser Modelle besser zu verstehen.

Auswirkungen von KI auf Kunst und Kultur

Das bessere Verstehen dieser Modelle ist denn auch das Ziel des aktuellen Forschungsprojekts «The Canon of Latent Spaces: How Large AI Models Encode Art and Culture». Dieses vierjährige Projekt wird vom Schweizerischen Nationalfonds finanziert und von der Digital Society Initiative (DSI) der Universität Zürich (UZH) unterstützt.

Neben der Projektleiterin Eva Cetinic arbeiten derzeit zwei Doktorandinnen, Laura Juliane Wagner und Maria-Teresa De Rosa Palmini, an dem Projekt. Die Mitglieder des Projektteams haben Ausbildungshintergründe in verschiedenen Bereichen. Dies spiegelt das vorrangige Ziel des Projekts wider: Es will Interdisziplinarität fördern und unterschiedliche Sichtweisen auf das weltweit relevante Thema der KI-gestützten Inhaltsgenerierung berücksichtigen. Ausserdem sollen die weitreichenden Auswirkungen von KI auf die Zukunft von Kunst, Kultur und Gesellschaft besser verstanden werden.

Die Entwicklung einer sinnvollen Kontextualisierung und kritischen Betrachtung von KI-Technologien im Spannungsfeld von Kunst und Kultur erfordert zwangsläufig eine interdisziplinäre Erforschung. Während «Interdisziplinarität» oft als verlockendes Schlagwort verwendet wird, birgt die Realität einer wirklich interdisziplinären Forschung viele Herausforderungen. Insbesondere wenn das Ziel darin besteht, die Gräben zwischen sehr unterschiedlichen Disziplinen wie der Informatik und den Geisteswissenschaften zu überbrücken.

Neue DSI Community «Digital Humanities»

Die Tendenz zur Integration von Computermethoden und digitalen Werkzeugen in geisteswissenschaftliche Studien ist seit mehr als einem Jahrzehnt im Gange und hat zu zahlreichen Forschungs- und Bildungsinitiativen geführt, die unter dem Oberbegriff «Digital Humanities» zusammengefasst werden. Das oben erwähnte Projekt ist nur ein Beispiel für Forschungsinitiativen im Bereich der digitalen Geisteswissenschaften an der Universität Zürich – es existieren diverse weitere Aktivitäten, die einen ähnlichen Schwerpunkt haben.

Dieser Text ist Teil der Reihe «DSI Insight» auf Inside IT.

Eva Cetinić ist SNSF Ambizione Fellow und DSI-Forschende an der UZH. Sie erforscht die Überschneidung von Deep Learning und Explainable AI mit digitalen Künsten und Geisteswissenschaften, mit Fokus auf multimodalem Deep Learning im Kontext von visueller Kunst und Kultur.

Quicklinks

Hauptnavigation