Podverkstan

Hur gör man en AI-ljudbok?

På den här sidan berättar jag hur man kan tänka och göra för att producera en AI-ljudbok, dvs. en bok som läses in av en AI-röst istället för av en människa vid en mikrofon. AI är mycket spännande och befinner sig i stark utveckling när detta skrivs mars 2023. 

Inläsningen

När det gäller att producera en ljudbok tänker de flesta att det handlar om att spela in en uppläsning. Det har varit sant men när Ai-röster utvecklas finns AI som ett alternativ till den traditionella metoden. Förutom inläsningen ska du förbereda och redigera, korrekturlyssna, justera och publicera. Och allt tar tid.

Jag börjar här med själva inläsningen med AI-röst för att senare återkomma till det de andra stegen i processen.

Innan du sätter igång och låter en AI-röst läsa in din bok måste du tänka på att välja en AI-röst som passar din bok. I dagsläget (mars 2023) har vi 10 Ai-röster att välja mellan i vår AI-röstkatalog. Framöver kommer säkerligen fler AI-röster finnas att välja mellan. Det är också viktigt att klargöra om det är en voice-over eller voice-acting du vill ha. En voice-over inläsning sker utan större betoningar eller ageranden. Vocie-over är mer en rak inläsning. En voice-acting är mer agerande, mer betonande, mer illustrerande. I dagsläget är AI-röster av karaktären voice-over. Söker du en voice-acting ska du använda dig av en människas röst.

Valet av vocie-over och voict-acting påverkas också av om din bok är en fiction eller non-fiction. Man kan säga att en non-fiction passar ofta bättre för voice-over i den meningen att det ofta inte är någon huvudperson ska illustreras eller någon historia som ska berättas. Men även fiction kan vara skriven så att en voice-over fungerar väl. Här gäller att prova och klargöra voice-over eller vocie-acting samt fiction eller non-fiction, och hitta bästa kombinationen.

En avgörande anledning att använda sig av AI-röst är produktionskostnaden uppskattningsvis halveras jämfört med den traditionella metoden med en människas röst. En AI-röst är outtröttlig och läser korrekt i motsats till en människas röst som blir trött och som de facto gör felläsningar.

Men en AI-röst kräver också att ljudboksmanus är korrekt. En felstavning slår direkt igenom, då AI-rösten inte vid inläsning kan korrigera felet. En AI-röst har svårt att uttala förkortningar, läsa på flera språk i samma text och att självmant pausera. Det är därför som ljudboksmanus blir den viktigaste delen i Förberedelsen, som nästa del handlar om.

Förberedelsen

Även om vi började med själva inläsningen i förra inlägget så är det med ljudboksproduktion som med allt annat – det gäller att förbereda.

I förberedelsen ingår några frågeställningar att besvara:

– Hur har du tänkt att ge ut ljudboken?

Du kan ge ut den via nätbokhandlare. Du kan också ge ut den själv på en egen webbsajt och ta betalt. Du kanske vill ge ut den via prenumerationstjänster som t.ex. Storytel eller Bookbeat – tänk då på att det kan vara svårt som liten författare att bli accepterad hos de stora prenumerationstjänsterna.

– Vilken budget har du?

För att kunna göra ett ljudboksprojekt lönsamt behöver du sälja en viss mängd ljudböcker. Då måste du göra en uppskattning av hur många som du tror kommer att köpa. Det i sin tur beror på vilken målgrupp du tror är intresserad av att lyssna till din ljudbok och hur stor den målgruppen är. Dessutom behöver du fundera på vad du tror att målgruppen är villig att betala. Du ska alltså göra en kalkyl i förberedelsefasen.

– Vilken röst ska läsa in boken?

Du ska välja den AI-röst som bäst återger innehållet och budskapet i din bok. Vi har i dagsläget 10 AI-röster att välja mellan i vår AI-röstkatalog.

– Du ska göra et ljudboksmanus

Vid inläsning med AI-röst är ett korrekt ljudboksmanus extra viktigt. En AI-röst läser det som står skrivet. En felstavning leder ofelbart till fel inläsning. Ju högre kvalité på ljudboksmanus ju högre kvalité på inläsningen är det självklara och enkla förhållandet. AI-rösten är korrekt.

Samtidigt som AI-röster kräver ett bättre ljudboksmanus, vilket kräver arbeta, än den traditionella metoden med en människas röst, så ger ett korrekt ljudboksmanus att såväl korrekturlyssningen som senare justeringer blir avsevärt färre och rejält mindre arbetskrävande. Det arbete som läggs ned i förberedelse-fasen tas igen i senare faser.

I ljudboksmanus ska du:

– skriva ut alla förkortningar
Förkortningar som ”bl.a t.ex. osv.”.  ska skrivas ut som ”bland annat  till exempel  och så vidare”. All text ska göras uttalbar.

– översätt allt till ett språk
I svenska texter kan det vara vanlig att ha engelskas uttryck. Till exempel kan ”case study” översättas till ”praktikfall”. Ett citat av till exempel Winston Churchill ska också översättas till svenska för att bli förståeligt.

– lägg in pauser
Vanligtvis skrivs text med mellanslag, mellanrum, nytt stycke och liknande. För en AI-röst är detta mellanslag, mellanrum och nya stycken ytterst viktiga för att få så naturlig pausering som möjligt. Ofta kan ”nytt stycke” behöva tillfogas/infogas beroende på hur original-texten är skriven.

 

Redigering/montering

Efter inläsningen har du ofta en ljudfil per kapitel som AI-rösten läst in. Inspelningen är reda korrekt vad avser nivå och brus liksom att pipanden, väsanden, smackanden och felsägningar saknas. Ai-rösten gör sitt jobb med akkuratess, jämfört med den människas röst, som har sina brister.

Det gör att redigeringen till största delen är en montering av de ljudfiler du har framställt. Intro-texten ”Du lyssnar till…”, de inlästa kapitel samt outro-texten ”du har lyssnat” till ska läggas i en serie och bilda den totala ljudfilen som utgör ljudboken i sin helhet. I vissa fall kan illustrationer i form av musik-snutt eller pling-ljud infogas mellan kapitel eller liknande. Det är också en del av monteringen.

När redigeringen/monteringen är klar ska en ljudfil produceras för korrekturlyssningen, vilket nästa del handlar om.

Korrekturlyssningen

ettPrecis som man korrekturläser en skriven bok ska en ljudbok korrekturlyssnas för att dels upptäcka eventuella felaktigheter i det inlästa materialet, men också för att lyssna till hur helheten fungerar.

Den bästa korrekturlyssningen sker genom att lyssna och samtidigt läsa texten ur ljudboksmanus. Då märker du enklast de fel som kan ha smugit sig in. Som jag beskrivit i förberedelse-fasen ovan ger korrekturlyssningen allt färre fel ju bättre kvalitén är ljudboksmanus. Det kan bli så att korrekturlyssnaren tycker det är lite ”tråkigt” efter att flera kapitel korrekturlyssnats och inte ett enda fel upptäckts.

Notera de fel du upptäcker och ange ungefär i minut och sekund var felet uppstår. Då blir det lättare att justera och redigeraren slipper leta länge.

Ställ sen samman alla noteringar från alla korrekturlyssnare, om det är flera, och skapa ett underlag för justering. Du kommer då se punkter som alla vill justera samt även få några påpekanden som är unika för varje korrekturlyssnare. I nästa steg ska vi ta oss an justeringen, vilket beskrivs i nästa del.

Justeringen

Som resultat av korrekturlyssningen framkommer ett underlag med allt som ska justeras. Det kan vara ord som uttals fel eller förkortningar som inte blev utskrivna i ljudboksmanus. 

Det bästa är att låta AI-rösten läsa om hela meningen eller stycket där felaktigheten förekommer, och byta ut den meningen eller stycket i den monterade ljudboken.

När du så till sist har justerat allt innehåll kommer vi fram till justeringen av ljudnivå och de mer ljudtekniska delarna. I Sverige finns ingen generell standard för vilken kvalité en ljudbok ska ha. I USA som har nått längre i utvecklingen har Amazon definierat något de kallar för ACX, som ställer upp vissa grundläggande krav på ljudet och föreskriver bl.a. följande tekniska ljudstandard:

– MP3-format med minst 192 kbps vid 44,1 kHz konstant bithastighet

– ljudnivå (RMS) mellan -23dB och -18 dB

– toppnivå -3dB

– max -60dB brusnivå

Lyckligtvis är AI-röstens ljudfiler redan producerade för att klara ACX-standarden, var för sällan någon justering behöver göras. (Med den traditionella metoden med en människas röst krävs ofta justering av nivåer – se där ännu en fördel för AI-rösten).

Nu är ljudboken klar för publicering och marknadsföring, vilket det handlar om i följande sista del.

Publiceringen

Äntligen är du klar med ljudfilen eller ljudfilerna som ska distribueras och nå lyssnarnas öron. Förutom själva distributionen ska du också göra reklam och marknadsföring för din ljudbok så att lyssnarna hittar den och finner den intressant att prova att lyssna på. I begreppet Publicering innefattar jag både Distribution och Marknadsföring.

Låt oss börja med distributionen. Det finns i grunden tre sätt att distribuera:

– Egen webbsajt

– Nätbokhandlare

– Prenumerationstjänsterna

Om du väljer att distribuera på Egen webbsajt och där ta betalt och leverera ljudboken såsom en nedladdningsbar länk, finns en rad lösningar att ta i bruk. Men då måste du själv sköta all marknadsföring och få besökare att landa på din egen webbsajt och våga köpa. Å andra sidan behåller du alla intäkter du får från ljudboken.

För att publicera till nätbokhandlarna och prenumerationsstjänsterna finns idag till exempel Digibook (https://www.digibook.se/) där allt sker på ett och samma ställe.

Oavsett vilken distributionsform du väljer så ska ljudboken marknadsföras.

Du behöver ha ett lockande omslag till ljudboken. Bilden kommer att användas såväl av nätbokhandlare som prenumerationstjänster och din egen webbsajt. Bildens ska göra jobbet av att väcka uppmärksamhet och fånga din blick. Ett tips är att nyttja kulören gul, som är en signalfärg för människan, som gör att vi reagerar och uppmärksammar. I omslagsbilden ska också boken titel ingå.

Tillsammans med omslaget bör också följande uppgifter visas: titel, författare, förlag, ISBN,uppläsare, upphovsrätt och ansvarsfriskrivningar, resursbilagor, inspelningsstudio och ansvarig redigerare/redaktör.

I beskrivningen av ljudboken ska du förklara för lyssnaren vad boken handlar om och om det är en faktabok ska du förklara hur boken är upplagd rent strukturmässigt. Syftet med beskrivningen är att den potentiella lyssnaren ska finna innehållet intressant samtidigt som förväntningarna på ljudbokens innehåll skapas. Det är alltså i beskrivningen som du kan påverka hur lyssnaren ska komma att uppfatta ljudboken.

I nätbokhandeln och hos prenumerationstjänsterna skapas automatiskt en provlyssningsfil. Om du distribuerar på egen webbsajt måste du själv se till att skapa en sådan fil.

Marknadsföringen, att berätta för alla om din fantastiska ljudbok skiljer sig inte nämnvärt från annan marknadsföring. Här är några konkreta tips för marknadsföring:

– skapa egen webbsajt för att beskriva hur boken producerats. Se till att sökmotorerna (Google) registrerar det du skriver och följ upp hur väl Google-sökningar leder till din webbsajt. Att människor söker sig till din ljudbok kallas pull marketing.

– lägg ut inlägg på sociala medier om din ljudbok. Berätta hur du gjort för att producera den. Sprid provlyssningen och entusiasmera din omgivning att lyssna.

– starta en diskussion i något av alla de forum på sociala media som finns (t.ex Facebook-grupper). Du kan t.ex. be människor om att lyssna lite på provlyssningsfilen och höra vad de tycker.

– om din ljudbok är en faktabok och handlar om ett specifikt ämne kand et vara klokt att gå med i något forum som fokuserar på ämnet. Låt säga att din ljudbok handlar om bin, då kan det vara klokt att gå med gruppen som kan heta Vi som älskar biodling.

Du kan naturligtvis också köpa digitala annonser. Det kan vara i klassiska massmedia såsom dagstidningarnas webbsajter. Det kan också vara annons på de digitala plattformar som sociala medier utgör, t.ex. Facebook, Instagram och Twitter som är de stora drakarna. Om din ljudbok täcker ett smalare område kan annonsering på en nättidning för området ge god utdelning. Låt säga att din ljudbok handlar om Karl XII – då kan en annons på Nättidningen Svensk Historia vara en god idé.

Såväl publicitet på sociala medier som annonsering kallas push marketing.

Du ser nu att det finns oändliga möjligheter för marknadsföring och metoderna utvecklas ständigt varför jag här bara beskrivet några få som kan inspirerar till flera metoder.

Ett stort lycka till och hoppas att din ljudbok säljer riktigt bra!

Om du har läst så här långt är du troligen intresserad av att veta hur lång tid det tar att producera en ljudbok. Kolla då in vår AI-ljudbokskalkylator här!