Kapitel 3. Grunderna i digitalljud

Det här kapitlet borde ge en kort introduktion om grunderna i digital ljudbehandling, utan att gå in på alltför mycket detaljer. Det kan naturligtvis vara något ofullständigt, men om du har frågor kan du ställa dem på Kwaves e-postlista eller rådfråga ytterligare litteratur.

Den analoga världen

För det första måste man veta att värden är analog, medan datorer fungerar digitalt. Det finns flera sätt att konvertera analogt ljud till digitalt ljud och tillbaka igen. Eftersom vägen från digitalt till analogt normalt är det omvända av vägen från analogt till digitalt, beskriver vi bara vägen från analogt till digitalt.

Konvertering från ljud till bitar

Konvertering från ljud till bitar

Innan man går vidare måste analogt ljud omvandlas till elektroniska signaler för att kunna ta sig in i datorn. Ett vanligt sätt att göra det är att använda en mikrofon och en förstärkare. Kombinationen tar ljud (ändringar i lufttryck) som indata och lämnar en spänning som utdata. Högre amplitud på tryckförändringarna representeras som högre spänningar vid förstärkarens utgång. Utgången kallas också en 'signal'. Istället för en mikrofon kan man förstås föreställa sig andra ljudkällor, och "förstärkaren" kan vara den som är integrerad på ljudkortet, där man normalt inte ser den.

Konvertering till en elektronisk signal

Konvertering till en elektronisk signal

I detta läge har den elektriska signalen tre begränsningar som man måste komma ihåg:

  1. Amplituden (volymen) är begränsad till någon maximal nivå. Det är en följd av de elektroniska förstärkarna bara kan hantera spänningar inom ett visst intervall. Det är inget problem, så länge ljudet inte blir för starkt. Om det skulle ske blir signalen klippt, vilket betyder att den elektriska signalen når sin marginal och resultatet blir stört.

  2. Frekvensomfånget är också begränsat. På grund av mikrofonernas mekaniska begränsningar och det begränsade frekvensomfånget hos förstärkare, är signalens frekvensomfång begränsat. Det finns inga fasta gränser där ljudet plötsligt försvinner, men under någon lägsta och över någon högsta frekvens börjar signalens amplitud minska mer och mer. Förekomsten av en maximal frekvens kan enkelt förstås som en begränsad hastighet som den elektriska signalen kan stiga och falla. Genom att använda högkvalitativa förstärkare och mikrofoner, kan gränserna utökas till intervall där det mänskliga örat inte längre kan höra resultatet, och därmed vara ointressanta. Det mänskliga örat kan normalt inte höra ljud ovanför 20 kHz.

  3. Signalen innehåller brus. Brus är den elakaste fienden till alla som måste hantera ljudsignaler på något sätt. Brus är en typiskt analog effekt, som gör ljudsignalen "oskarp" och störd. Det är alltid närvarande och kan inte undvikas. Man kan bara försöka använda komponenter av hög kvalitet som skapar så lågt brus som möjligt, så att man inte kan höra det. Normalt har brus en viss volym, så att de intressanta ljuden måste vara mycket starkare i förhållande till bruset. Det kallas signal-brusförhållandet, och ju större det är desto bättre är ljudkvaliteten. Ljud som har lägre volym än bruset går inte att höra.