Prijava ili Registracija besplatno!
Mario Brkić
Homepages
> Početna strana > Novosti > Blokovi > Digitalna obrada zvuka i Cool Edit Pro 2.0
Korisnički blok
Zdravo Gost
IP adresa: 38.103.63.58

Korisničko ime
Lozinka
Poruke
Prijava ili Registracija besplatno za slanje poruke!
Digitalna obrada zvuka i Cool Edit Pro 2.0
Datum 05/10/2008 15:38 Autor rhtrades Hitova 213
Print Pdf Email RSS
Osnove digitalne obrade zvuka

Kad govorimo o zvuku potrebno je reci da zapravo govorimo o zvučnim valovima.

Ljudsko uho ih registrira kao promjenu pritiska na bubnjiću u nekom vremenu.

Na slici jedan prikazan je sinusni signal konstantne amplitude. Najvažnije svojstvo takvog vala u

našim primjerima je da je on kontinuiran i neprekinut u svakom trenutku bez obzir koliko ga zumirali

po bilo kojoj osi. On je dakle neprekinut i u nekom trenutku može imati samo jedan iznos amplitude. Najveća frekvencija signala koju može čuti čovjek je oko 20 kHz, dok je za prosječne ljude ta granica na oko 17kHz. Ljudskom uhu nije

lako detektirati fazu zvuka. Na primjer ako crkveno zvono otkuca u 12.00 h mi ne bismo mogli nakon

jedne sekunde reći dali je upravo faza zvuka 0 ili 90 stupnjeva, ili neka druga. Zvukovi koje slušamo

svakodnevno nisu gotovo nikad čisti sinusni signali, nego beskonačna suma sinusoida, svaka sa svojom

varirajučom amplitudom i fazom. Suma svih njih dati će u svakom trenutku samo jednu vrijednost tj. iznos

tlaka na našem bubnjiću.

Zbog toga će se val zvuka prikazati u Cool Edit -u kao kontinuirani iznos amplitude u nekom vremenu.

Također mi možemo odabrati i spektralni prikaz istog. U spektralnom prikazu vidjet ćemo gotovo sve

frekvencije izvornog signala, respektivno prema njihovim amplitudama. Kako je u računalu nemoguće

raditi sa beskonačnim iznosima brojeva, koji bi bili potrebni ako bismo željeli kontinuirani val prikazati

unutar računala, potrebno je uzrokovati ulazni signal. Pri tome siječemo ulazni signal na konstantne

vremenske intervale i prikazujemo sve vrijednosti amplitude u tom intervalu jednom konstantnom

vrijednošću (slika 1).

 

Tako dolazimo do broja uzoraka u sekundi ili sample rate -a nekog signala. Kao što se vidi sa slike

uzorkovani signal sadrži puno manje informacija o obliku signala nego kontinuirani signal. Najveća

frekvencija koju možemo prikazati na takav način je zapravo polovica frekvencije uzorkovanja. To znači

 da nam sample rate od 20 kHz omogućuje prikaz frekvencije od maksimalno 10 kHz. Ta se frekvencija

 zove i Nyquist -ova frekvencija. Kako ljudsko uho prima najviše 20 kHz, bit će i frekvencija uzorkovanja

najmanje 40 kHz, odnosno 44kHz za CD kvalitetu zvuka. Naravno, nakon uzorkovanja potrebno je

diskretizirati i amplitudu na odrađeni broj intervala odnosno razina. Tako će nam 8 bitna kartica omogućiti

256 razina amplitude (približno AM kvaliteta) a 16 bina 65 536 razina analognog signala (usporedivo

sa CD kvalitetom). Taj postupak zovemo kvantizacijom . Tako će nam sample rate odrediti maksimalnu

moguću frekvenciju ulaznog signala, a broj razina maksimalan dinamički opseg ulazne amplitude.

Neki formati zapisa neće imati jednoliko raspoređene razine signala. Tako će imati će veći broj razina

za male amplitude, a manji za veće. To rezultira time da je dinamičko područje takvih kvantizatora

ekvivalentno onome sa 4096 razina amplitude, ali sa manjom distorzijom, poput one na FM radio difuziji.

Reprodukcija signala

Dakle kao što smo uzorkovanjem i kvantizacijom pretvorili analogni signal kontinuirane amplitude u

digitalni (A/D pretvorba) potrebno je kod reprodukcije obaviti obratnu transformaciju - D/A pretvorbu.

Kako D/A pretvornici rade gotovo bez grešaka, možemo reći da su jedini gubici kod takve obradbe

signala oni sadržani u frekvencijama većim od polovice frekvencije uzorkovanja i gubici kod kvantizacije,

 koji su ovisni o broju upotrijebljenih razina. Ako zanemarimo gubitke u pretpojačalima i pojačalima

(koji se mogu svesti na zanemariv iznos) možemo reći da ako signal pretvorimo u digitalni, obradimo

ga u programu poput Cool Edit -a, i pretvorimo natrag u analogni , nismo napravili značajniju pogrešku

a pritom smo se oslobodili ograničenja koja nam nameću elektroničke komponente, kutije s specijalnim

efektima i sl. Što se tiče kvalitete mi možemo kupiti kartice sa skupim i kvalitetnim A/D i D/A pretvornicima

 i niskošumnim pretpojačalima, ali ne postoji novac koji će za 16 bitnu karticu postići bolji odnos

signal/šum od 96 dB. Naravno, mogli bismo povećati širinu riječi i frekvenciju uzorkovanja, ali bi za

neznatno veću kvalitetu platili to puno većom cijenom i puno većom količinom digitalnih podataka. U

 svakom slučaju govorimo o prisutnosti šuma u našem signalu.

Filtriranje je jedna od najpopularnijih metoda u digitalnim signal procesorima ili programima koji

vrše obradbu audio signala. Filtri korigiraju fazu i amplitudu određenih frekvencija signala i mogo

funkcija Cool Edita bazira se na njihovoj primjeni. Tako se naprimjer uklanjanje šuma vrši funkcijom

 Noise Reduction koja dinamički odbacuje frekvencije čiji iznos amplitude nije iznad zadanih granica,

al opet ovisno o tome koliko se često ta frekvencija pojavljuje u signalu. Djelovanje pojedinog filtra

najlakše je isprobati primjenom pojedinog na tzv. bijeli šum, koji sadrži podjednaki iznos svih frekvencija.

 Pogledom u frekvencijskoj domeni možemo vidjeti koje su frekvencije prigušene a koje ne.
Brza Fourier - ova transformacija (Fast Fourier Transform (FFT)) je algoritam koji Cool Edit Pro koristi

 za izvedbu filtarskih funkcija, spektralnih analiza i sl.

MP3 - Tako cool... tako Cool Edit Pro

 

Ono što sam ja našao kao najvrednije kod programa Cool Edit Pro 2.0je svakako obrada .mp3 datoteka,

 bez ikakvog dodatnog plug in -a ili nečeg sličnog. Rekao bih neke osnovne svari o tom hvale vrijednom

formatu. Radi se zapravo o standardu MPEG 1 layer 3.
MPEG 1 standardizira tri različita načina kodiranja za digitalizirani zvuk, redom Layer 1, Layer 2 i Layer 3.

On ne standardizira encoder već samo tip informacija koje encoder treba proizvesti i zapisati u MPEG

datoteku, kao i način na koji dekoder treba shvatiti, dekompresirati i resintetizirati informaciju. Kodirani

zvuk može biti i dio kodiranog vida i tada govorimo o MPEG1 system stream -u. MPEG kod kodiranja ne

pokušava napraviti kodiranje bez gubitaka nego pokšava generirati zvuk koji će slušaču zvučati identično.

Kod kodiranja bez gubitaka redundancija u audiu se koristi da bi se kompresirao zvučni signal, i dekodirani

 se signal ne razlikuje od orginala. Sa druge strane precepcijski audio codec poput MPEG -a ne pokušava

ostvariti kodiranje bez gubitaka nego je cilj takvog kodiranja da dekodirani zvuk zvuči indentično ljudskom

slušaču. Pokušavaju se eliminirati sve komponente zvuka koje su irelevantne ljudskom uhu, naprimjer one

koje se ne čuju. Dakle grubo govoreći MPEG 1 enkoder transformira zvučni signal u frekvencijsku domenu,

eliminira frekvencijske komponente koje su maskirane jačim frekvencijskim komponentama i pakira taj

analizirani signal u MPEG 1 format zapisa.
Različiti slojevi kod MPEG su bili definirani jer svi oni imaju svoje prednosti. Uglavnom složenost

kodera/dekodera, vrijeme potrebno za obradbu i efikasnost raste od prvog ka trećem sloju. Layer 1 je

pogodan za aplikacije gdje se traži mala složenost enkodera. Layer 2 je nešto složeniji i obično se koristi

za aplikacije ˝jedan ka mnogima˝, kad jedan koder poslužuje više dekodera. Efikasnije otklanja

redundanciju i i bolje primjenjuje psihoakustički model ljudskog uha. Layer 3 je dakako najsloženiji i

usmjeren j aplikacijama nižeg bit rate -a , ekstrahiranjem redudantnih podataka i upotrebom Huffmanovog

kodiranja. Sva tri sloja hijerarhijski su kompatibilna tj. svaki od slojeva može dekodirati niže slojeve.
MP3 format odnosi se na MPEG 1 Layer 3 programske kodere i dekodera za windows.
Kako MPEG1 stvarno radi?
Primarni psihoakustički efekt koji MPEG koristi zove se ˝auditory masking˝, gdje dijelovi signala nisu

 prepoznatljivi od strane ljudskog uha. Naprimjer ako postoji zvuk otprilike konstantne frekvencije, svi

drugi tiši tonovi bliskih frekvencija se neće čuti. Da bi maknuo takve dijelove zvuka enkoder sadrži

psihoakustiči model (slika 3 ).

 

Slika 3

Taj model analizira ulazne signale po ulaznim vremenskim odsječcima i određuje mu spektralne

komponente. Tada primjenjuje maskiranje poput onog u našem uhu i ostavlja jedva primjetan šum na

svakom frekvencijskom pojasu koji se zove prag maskiranja. Paralelno tome radi se

vremensko -frekvencijsko mapiranje, koje rezultira spekrtralnim komponentama za potsekvencijsko

kodiranje. U fazi kodiranja i kvantizacije enkoder pokušava pronaći potreban broj bitova tako da uzima u

obzir i bitrate i zahtjeve od maskiranja uzimajući u obzir prag maskiranja. Informacija o raspodjeli

bitova po spektru sadržana je u nizu bitova kao dodatna informacija.
MPEG 1 podržava bitrate od 32kbit/s do 320 kbit/s. Layer 3 podržava također i promjenljivi bitrate,

 jer su bitovi različito dodijeljeni po frameovima.
Kada govorimo o odnosu signal/

Nema komentara.
2008. Sva prava pridržana
MemHT Portal is a free software released under the GNU/GPL License by Miltenovik Manojlo
Powered by Estrada-hr.com