USB

AI og musikkproduksjon

Hvordan kan artister, musikkskapere og produsenter benytte seg av AI?

Daniel Johansson er låtskriver og musikkbransjeforsker ved Høgskolen i Innlandet. I tillegg analyserer han teknologi og musikk på Musikindustrin.se.

Han har fulgt med på AI i flere år, og gir deg her informasjon om over 60 forskjellige produkter og plattformer som du kan bruke som musikkskaper og musikkprodusent.

Av Daniel Johansson

Sist oppdatert: 29. august, 2024

Intro

Selv om AI ikke er noen ny teknologi - forskning på området datagenerert musikk har pågått helt siden 1950-tallet - er det først de siste årene at AI har begynt å få betydning for musikk.

AI er et samlebegrep for flere forskjellige teknologier, slik som maskinlæring, dyp læring, kunstige nevrale nettverk, generativ AI, NLP og robotikk, men grunnlaget er det samme:

Ved å trene programvarer skaper man applikasjoner som kan utføre mer intelligente og avanserte oppgaver.

Daniel Johansson er låtskriver og musikkbransjeforsker ved Høgskolen i Innlandet, i tillegg analyserer han teknologi og musikk på Musikindustrin.se.  Foto: Privat

Daniel Johansson er låtskriver og musikkbransjeforsker ved Høgskolen i Innlandet, i tillegg analyserer han teknologi og musikk på Musikindustrin.se.
Foto: Privat

Generativ AI vs funksjonsspesifikk AI

I dag finnes det tekniske løsninger for det meste: For miksing, mastering, stemmeskille, lydeffekter, looper, stemme-til-instrument, stemmekloning/syntetiske stemmer, tekster, melodigenerering, arrangering, lydrestaurering og mye annet.

En undersøkelsen som ble gjort blant 1.200 DIY-artister av distributøren Ditto Music, viser at 60% av uavhengige artister bruker AI.

15.000 musikkprodusenter deltok i en undersøkelse som tyske GEMA og franske SACEM (TONOs motstykker i disse landene) gjennomførte i 2024, som viste at 35% bruker en eller annen form for AI-baserte hjelpemidler. Blant dem under 35 år, var det 51% som bruker AI.

En undersøkelse fra Tracklib viser i tillegg at en fjerdedel av musikkprodusenter verden over bruker AI-verktøy.

AI er altså allerede i dag noe som brukes flittig i musikken. Men teknologien brukes på mange forskjellige måter, som tidvis blandes sammen. For å få en god oversikt kan det derfor være lurt å begynne med å definere de to hovedsporene for AI og musikk; generativ AI og funksjonsspesifikk AI.

Generativ AI i musikk

Når det kommer til bruk av AI i musikkproduksjon kan man dele inn generativ AI i tre kategorier:

  • promptbasert
  • utvalgsbasert
  • katalogbasert

Promptbasert generativ AI

Promptbasert generativ AI er løsninger der musikkprodusenten bruker tekstinstruksjoner, eller «prompts», for å generere melodier, tekster, looper, stems, samples, sang osv.

Eksempler på slike plattformer er:

Dette er fortsatt et ganske nytt område, og det er først i 2024 plattformer har blitt lansert som begynner å nå en kvalitet som er nyttig også for profesjonelle låtskrivere og produsenter. Foreløpig er de fleste av de nevnte plattformene mer rettet mot ikke-profesjonelle brukere, men vi kan forvente at promptbasert musikkskaping ved hjelp av generativ AI gradvis vil bli en naturlig del av produksjonsprosessen fremover.

For tiden bruker de fleste låtskrivere og produsenter disse verktøyene for å teste ideer og skape grunnlag for sanger, som de deretter bygger videre på eller bruker som inspirasjon. Med prompter på Stable Audio eller Udio kan man raskt skape dusinvis av varianter av sanger, en slags AI-drevet pitching, der musikkskaperen deretter velger de elementene som passer best.

Andre musikkskapere bruker opplastingsfunksjoner, såkalt «conditioning», der man laster opp en låtidé til en plattform for å generere varianter basert på det man har lastet opp. For eksempel, hvis du har første vers til en gammel låt i skuffen som du ikke har gjort noe med tidligere, kan du laste opp den delen av låten og instruere AI-plattformen til å bygge videre på den, generere et refreng osv.

Verdt å merke seg

Promptbasert generativ AI handler fortsatt i stor grad om eksperimentering, og denne typen samarbeid med en AI-assistent passer ikke for alle. Men for mange musikkskapere har dette likevel blitt en måte å utvikle sin egen prosess på, ved å få tilbakemeldinger og ideer fra generativ AI.

Utvalgsbasert generativ AI

Utvalgsbasert generativ AI for musikk baserer seg hovedsakelig ikke på prompter eller tekstinstruksjoner, men på at brukeren velger ut fra et antall forhåndsbestemte kriterier.

Noen av disse plattformene er likevel hybridløsninger som kombinerer bruk av prompter med utvalg.

Eksempler på slike plattformer er:

Akkurat som med plattformene for promptbasert generativ AI, er de utvalgsbaserte AI-modellene trent på store mengder musikk, men det dreier seg ofte om instrumentalmusikk, ofte kjøpt fri eller royaltyfri musikk.

De som bruker disse plattformene, arbeider vanligvis innen områder som bakgrunnsmusikk, produksjonsmusikk, stemningsmusikk, eller er andre typer skapere som influensere, youtubere og reklameskapere som enkelt vil generere musikk som passer til innholdet.

Verdt å merke seg

For profesjonelle musikkskapere og produsenter som er vant til å jobbe i Pro Tools, Logic Pro, Reason, Cubase, FL Studio, Ableton, osv., kan disse verktøyene ofte være ganske begrensede. Men for dem som ønsker å lage store mengder musikk til spesifikke bruksområder, og som ikke stiller høye kunstneriske krav, kan plattformene være nyttige.

Katalogbasert generativ AI

Katalogbasert generativ AI for musikk er løsninger der man trener opp en AI-modell på en spesifikk katalog for å deretter generere ny musikk som ligner på den som har blitt trent på.

Denne kategorien gir relativt begrenset frihet i musikkskapingsprosessen; musikken som genereres er sterkt betinget av musikken modellen har blitt trent på, og for øyeblikket befinner disse verktøyene seg i en eksperimentell fase. Eksempler inkluderer OpenAI Jukebox, Musenet, Flow Machines og Dance Diffusion.

Disse plattformene er mer rettet mot musikkskapere med programmeringsferdigheter, siden det ofte kreves at man kan håndtere plattformer som Google Colab eller Microsoft Azure.

Verdt å merke seg

Foreløpig finnes det ingen kommersielle og brukervennlige applikasjoner der en musikkskaper eller produsent for eksempel kan laste opp hele sin katalog eller deler av den, og la AI generere ny musikk basert på den katalogen, eller låtidéer basert på musikk som er skapt tidligere. For de som har visse programmeringsferdigheter, er det imidlertid mulig å gjøre dette ved å utvikle egne AI-modeller.

Funksjonsspesifikk AI for musikk

De fleste musikkprodusenter og låtskrivere som jobber digitalt, bruker trolig allerede AI-baserte verktøy, enten bevisst eller uten å være klar over det. Som tidligere nevnt skal disse verktøyene ikke forveksles med generativ AI, ettersom de ikke primært er «skapende», men snarere løser spesifikke funksjoner.

Dette kan dreie seg om plugins for DAWs eller nettbaserte løsninger. Funksjonsspesifikk AI for musikk kan deles inn i følgende hovedkategorier:

  • verktøy for ulike deler av musikkproduksjonsprosessen
  • verktøy for stemmekloning og syntetiske stemmer
  • verktøy for tekstskriving
  • verktøy for miksing og mastering

Slike AI-verktøy bruker maskinlæring for å skape mer robust funksjonalitet, hovedsakelig gjennom såkalt overvåket læring (supervised learning). Utviklerne av AI-modellene benytter store mengder lyd og effekter som merkes med informasjon som representerer innholdet og de ulike variablene. Dette er grunnlaget for å trene opp en modell til å utføre en spesifikk oppgave.

En AI-modell for for eksempel en reverb vet ikke at den jobber med reverb, siden den ikke håndterer ekte lyd, men kun representasjoner av lyd. Gradvis finjusterer man funksjonaliteten, og modellen kan også utvikle seg gjennom interaksjon med brukere.

Dette gjør at AI-plugins blir langt mer tilpassbare og effektive, eller intelligente, sammenlignet med programvare som kun er basert på statisk kode skrevet av programmerere.

Eksempler på AI-verktøy relatert til musikkproduksjon:

Eksempler på AI-verktøy for stemmekloning og syntetiske stemmer:

Eksempler på AI-verktøy for låtskriving:

Eksempler på AI-verktøy for miksing og mastering:

For låtskrivere, artister og produsenter finnes det altså et hav av forskjellige verktøy, både generativ AI og funksjonsspesifikk AI.

Om noen av de ovennevnte plattformene eller pluginene passer for deg, finnes det kun én måte å finne ut av det på: gjennom å teste dem eller se på YouTube-videoer med gjennomganger og veiledninger.

Oppsummering

AI er, som tidligere nevnt, et samlebegrep for mange forskjellige teknologier. På samme måte som elektrisitet, datamaskiner og internett har medført store gjennombrudd for musikkproduksjonsprosessene, innebærer også AI et paradigmeskifte. Vi kan forvente at alle former for produkter og tjenester på sikt vil bygges på en AI-plattform, ettersom det rett og slett er en bedre måte å utvikle smarte teknologiske løsninger på.

Den siste tiden har noen av plattformene for generativ AI blitt utfordret av musikkbransjen, på grunn av hvordan de har trent sine AI-modeller. De amerikanske tjenestene Suno og Udio ble saksøkt av den amerikanske bransjeorganisasjonen RIAA i slutten av juni, og den britiske plattformen Jammable blir også gransket av bransjen.

Mange av de funksjonsspesifikke AI-verktøyene utfordrer ikke opphavsretten på samme måte, siden de hovedsakelig bare er verktøy i hendene på musikkskaperen og ikke genererer ny musikk. For alle plattformer og verktøy man bruker, kan det likevel være verdt å undersøke den juridiske grunnlaget, siden vi fortsatt befinner oss i begynnelsen av dette paradigmet, og noen aktører ikke er like nøye med å følge lovgivningen rundt opphavsrett.

Generelt kan man si at AI er på vei til å gjøre det enklere for «hvem som helst» å generere musikk av høy kvalitet, samtidig som teknologien er i ferd med å forandre hverdagen for profesjonelle musikkskapere og produsenter. Til syvende og sist vil det likevel alltid være behov for mennesker, ikke minst på den andre siden, de som lytter og elsker musikken.

En helt AI-generert sang kan høres veldig bra ut, men så lenge det ikke finnes et menneske bak, som fremfører sangen og gir den en kontekst, blir den ganske uinteressant. Mennesker foretrekker tross alt fortsatt andre mennesker.

Andre artikler om AI og musikk skrevet av Daniel Johansson i 2024:

Gi oss tilbakemelding!

Dersom du oppdager feil, har kommentarer eller innspill, hører vi mer enn gjerne fra deg!

hei@musikkontoret.no

Forbehold

Vi jobber hardt for å levere innhold som til en hver tid er oppdatert og riktig. Det kan likevel hende at artikler på Musikkontoret.no inneholder feil og mangler.

I slike tilfeller står ikke Musikkontoret ansvarlig for eventuelle utfordringer eller problemer dette måtte forårsake.