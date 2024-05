Wer früher Musik machen wollte, musste viel können – heute reicht ein Prompt und ein KI-Modell. Was bedeutet das für Künstler, die Branche und die Zukunft der Musik?

Generative Künstliche Intelligenz macht auch vor Musik nicht halt: Neue Musik zu schaffen, ist heute so einfach wie nie. Die Musikverwertungsgesellschaft Gema sieht darin, „dass es massenhaft neue KI-generierte Musik geben wird“, eine Konkurrenz zu menschlich gemachter Musik. Was bedeutet das für Künstler, Musikproduzenten und die Branche?

Suno AI – KI-Songs in Radioqualität?

Seit einigen Wochen erhält Suno AI viel Aufmerksamkeit, denn die neue Version des KI-Modells gilt als Maßstab für Songs per Mausklick. „Als ich das zum ersten Mal getestet habe, war ich sehr überrascht, in welcher Qualität das mittlerweile funktioniert“, sagt Musikproduzent Thomas Foster.

Die KI kann heute einen kompletten Song erstellen, der sich anhört, als hätte jemand ihn geschrieben, der Musik studiert hat und seit 20 Jahren nichts anderes tut als Musik zu komponieren und zu produzieren. Thomas Foster, Musikproduzent

Thomas Foster … … ist ein österreichischer Musikproduzent. Foster macht selbst Elektronische Tanzmusik (EDM) und hat mit seinem musikalischen Partner bekannte Jingles produziert, etwa das Intro der Nachrichtensendung „RTL Aktuell“.

Selbsttest: Wie funktioniert Musikproduktion mit KI?

Ähnlich wie beim Chatbot ChatGPT lassen sich Lieder mit nur wenigen Stichworten, dem Prompt, generieren – inklusive Songtext. Es ist ebenfalls möglich, Lyrics sowie ein gewünschtes Genre vorzugeben. Im Beispiel hat das Programm (in der Bezahlvariante) den Auftrag erhalten, einen Countrysong mit deutschem Text über die Kunst des Pizzabackens zu generieren.

Text: Die Kunst der Pizza – Song mit KI Ich nehme Mehl und Wasser, eine Prise Salz

Knete den Teig, mach ihn wunderbar (wunderbar)

Lege ihn zur Seite und lass ihn ruhen

Denn die Kunst der Pizza hat gerade begonnen (oh-ja) Rolle den Teig aus, dünner als dünn

Schmiere die Sauce, bis nichts mehr drin (nichts mehr drin)

Streu den Käse großzügig aus

Die Kunst der Pizza lässt mich träumen, ganz laut (jaaa) Das ist die Kunst der Pizza, so lecker und fein (so fein)

Jeder Biss ist ein Stück vom Paradies (Paradies)

Mit jedem Topping, jede Zutat genau richtig

Die Kunst der Pizza, das ist meine Geschichte (ganz laut) Quelle: Suno AI / David Metzmacher

Der Test zeigt: Suno AI hat auf Basis des Prompts ein in sich stimmiges Lied generiert. Die KI könnte den gleichen Text ebenfalls als Metal-, Rap- oder Opern-Stück interpretieren.

Songs per Knopfdruck: Nicht alles perfekt

„Prinzipiell funktioniert das schon ziemlich gut“, sagt Professorin Dr. Heike Adel-Vu von der Hochschule der Medien in Stuttgart. „Wenn man sich die Stücke aber im Detail anhört, dann findet man Artefakte und es gibt einiges, was die KI nicht so gut kann.“ Beispielsweise falle es der KI schwer, über längere Zeit konsistent zu bleiben.

Die KI hat schließlich keine Ahnung von der Theorie hinter der Musik oder bestimmten Aspekten der Melodieführung. Heike Adel-Vu, Professorin für Künstliche Intelligenz für audiovisuelle Medien

So werden mal Wörter hinzu halluziniert, Silben seltsam ausgesprochen oder Teile einer Strophe plötzlich zum Refrain. Auch Foster sieht Probleme bei den KI-Songs: „Es ist die technische Qualität, also wie das Audiomaterial klingt – das ist noch nicht bei hundert Prozent, das klingt wie ein schlechtes MP3.“ Zudem klängen die KI-Lieder meist wie von gestern: „KI kann Dinge super replizieren, die sie oft genug gesehen hat. Jeder Song, der heute in den Chart ist, hat irgendetwas, was es so noch nicht gab. Und da glaube ich, wird sich KI schwertun.“

Die wichtigsten Tracks dieser Erde, die weltweit in den Charts landen, werden auch in Zukunft eher von Menschen gemacht werden als von Maschinen. Thomas Foster, Musikproduzent

„Bei generativen KI-Modellen spricht man auch von stochastischen Papageien. Sie plappern potenziell also viel nach, haben aber durchaus Zufallsprozesse, die dann Dinge generieren, die so vorher nicht existiert haben“, erklärt Adel-Vu.

Also insofern kann die KI schon „kreativ“ werden. Aber das ist sehr stark eingeschränkt, weil die Modelle sehr abhängig sind von ihren Trainingsdaten. Heike Adel-Vu, Professorin für Künstliche Intelligenz für audiovisuelle Medien

Künstlicher Intelligenz in der Musikindustrie als Chance

KI-Modelle wie Suno AI können laut Foster die Arbeit von Musikproduzenten nicht ersetzen, aber Inspiration liefern oder beim Komponieren helfen. „Ich glaube, dass man KI gut als Brainstorming-Partner, als Kreativpartner nutzen kann – besonders zu Beginn eines kreativen Prozesses, um schnell verschiedene Stilrichtungen, Melodien oder Texte auszuprobieren“, sagt auch Adel-Vu.



Neben der direkten Generierung neuer Lieder, biete Künstliche Intelligenz auch weitere Möglichkeiten: „Zum Beispiel kann man KI benutzen, um ähnliche Musikstücke oder Samples zu finden. Das ist manuell in großen Datenbanken sehr aufwändig und zeitintensiv – da kann eine Automatisierung durch KI den Prozess extrem beschleunigen.“ Insgesamt gebe es aber noch viele offene Fragen – wie die nach dem Urheberrecht:

Sowohl die Frage, wem die KI-generierten Songs gehören als auch, ob die KI-Modelle mit urheberrechtlich geschütztem Material trainiert wurden. Heike Adel-Vu, Professorin für Künstliche Intelligenz für audiovisuelle Medien

GEMA: Viel Skepsis bei Musikschaffenden

Auch die Musikverwertungsgesellschaft GEMA sieht offene Fragen sowie Risiken für die Branche: „Die größte Sorge der Musikurheberinnen und -urheber ist, dass KI generierte Musik in vielen Bereichen die menschlich gemachte Musik ersetzt.“ Die GEMA fordert mehr Transparenz von den KI-Firmen, einheitliche Kriterien für die Offenlegung der Trainingsdaten sowie eine Beteiligung der Urheber an den Erlösen.



Bei Musikschaffende überwiegt die Einschätzung, das generative KI eher ein Risiko als eine Chance darstellt – wie eine Ende Januar veröffentlichte Studie zeigt:

KI-Studie von GEMA und Sacem

Im Auftrag der Musikverwertungsgesellschaften GEMA (Deutschland) und Sacem (Frankreich) hat Goldmedia eine Studie zum Einsatz von künstlicher Intelligenz in der Musikbranche in Deutschland und Frankreich durchgeführt. Wesentlicher Bestandteil war eine Online-Befragung Mitglieder zwischen dem 30. Oktober und 20. November 2023. Insgesamt nahmen über 15.073 Personen teil, die haupt- oder nebenberuflich als Komponisten, Textdichter oder für Musikverlage tätig sind. Viele der Befragten arbeiten zugleich auch als ausübende Künstler, Produzenten oder für Musiklabels. Quelle: GEMA

Besonders betroffen von generativer KI sei laut GEMA der Bereich der so genannten „production music“ sein, wie Hintergrundmusik, Gebrauchsmusik aber auch Filmmusik.

KI als Tool soll kreative Arbeit unterstützen und nicht ersetzen. GEMA

Auch Musikproduzent Foster geht davon aus, dass generative KI seinen Beruf „deutlich verändern wird“. Sorgen mache er sich aber trotzdem nicht:

Allein das Wissen, dass ein Lied eine KI gemacht hat, die keine Gefühle hat und die nur so tut, als hätte sie welche, macht Zuhörer nicht wirklich glücklich. Deshalb wird es Menschen immer wichtig sein, Musik zu hören, die letztendlich wiederum von Menschen gemacht wird. Thomas Foster, Musikproduzent

Quelle: David Metzmacher | Foto: © mariof/Adobe Stock