Zvučna kompresija: princip i konfiguracija. Sinteza i prepoznavanje govora

Tokom vremena kada su istraživači također nastavili rješavati problem kreiranja govornog sučelja za računare, često je bilo potrebno proizvoditi opremu samostalno, omogućavajući vam ulazak u audio podatke u računar, kao i prikaz iz računara. Danas takvi uređaji mogu imati jedinstveni povijesni interes, jer modernim računarima mogu lako opremiti ulazne i izlazne uređaje, poput zvučnih adaptera, mikrofona, slušalica i zvučnih stupaca.

Nećemo produbiti detalje interni uređaj Ovi uređaji, ali reći ćemo o tome kako rade i daju neke preporuke za odabir zvučnih računarskih uređaja za rad sa sistemima prepoznavanja i sintezom govora.

Kao što smo već izgovorili u prethodnom poglavlju, zvuk nije ništa drugo do zračnih oscilacija, čija je frekvencija u frekvencijskom rasponu koja je osoba koja opažala. U različitim ljudima, točne granice raspona zvučnih frekvencija mogu se razlikovati, vjeruje se da zvučne oscilacije leže u rasponu od 16-20 000 Hz.

Zadatak mikrofona je pretvorba audio fluktuacije u električne oscilacije, koje se mogu nastaviti pojačati, filtrirati da uklonite smetnje i digitalizirani da biste unijeli zvučne informacije u računar.

Prema principu rada, najčešći mikrofoni su podijeljeni u ugljen, elektrodinamiku, kondenzator i elektrot. Neki od njihovih ovih mikrofona zahtijevaju njihov rad vanjski izvor Trenutni (na primjer, ugljen i kondenzator), drugi pod utjecajem zvučnih oscilacija mogu samostalno proizvesti naizmjenični električni napon (ovi su elektrodinamički i elektrodijski mikrofoni).

Takođe možete podijeliti mikrofoni u svrhu. Postoje studijski mikrofoni koji se mogu držati u ruci ili osigurati na postolju, postoje radio mikrofoni koji se mogu fiksirati na odjeći i tako dalje.

Postoje i mikrofoni dizajnirani posebno za računare. Takvi su mikrofoni obično pričvršćeni na stalku na površini tablice. Računalni mikrofoni mogu se kombinovati sa slušalicama, kao što je prikazano na Sl. 2-1.

Sl. 2-1. Slušalice sa mikrofonom

Kako odabrati iz svih raznolikosti mikrofona koji je najprikladniji za sisteme prepoznavanja govora?

U principu možete eksperimentirati sa bilo kojim mikrofonom koji imate, osim ako se ne može povezati na računalni audio adapter. Međutim, programeri sustava prepoznavanja govora preporučuju se stjecanje takvog mikrofona, koji će na radu biti na stalnoj udaljenosti usta zvučnika.

Ako se udaljenost između mikrofona i usta ne mijenja, prosječni električni signal koji dolazi iz mikrofona također će se previše promijeniti. To će imati pozitivan učinak na kvalitetu rada modernog sistema priznavanja govora.

Koji je problem ovdje?

Osoba može uspješno prepoznati govor, čija se količina mijenja u vrlo širokim granicama. Ljudski mozak je u stanju filtrirati tihi govor od smetnji, poput buke automobila koji prolaze niz ulicu, strane razgovore i muziku.

Što se tiče modernog sistema za priznavanje govora, njihove sposobnosti u ovoj oblasti mnogo se odlaze na željenu. Ako mikrofon stoji na stolu, a zatim kada se glava rotira ili mijenja položaj tijela, udaljenost između usta i mikrofona će se promijeniti. To će dovesti do promjene nivoa izlaznog signala mikrofona, što će zauzvrat pogoršati pouzdanost prepoznavanja govora.

Stoga će, pri radu sa sistemima prepoznavanja govora, najbolji rezultati bit će postignuti ako koristite mikrofon pričvršćene na glava, kao što je prikazano na Sl. 2-1. Kada koristite takav mikrofon, udaljenost između usta i mikrofona bit će trajna.

Takođe obraćamo vašu pažnju da svi eksperimenti sa sistemima prepoznavanja govora najbolje rade, zadržavajući se u mirnoj sobi. U ovom slučaju učinak smetnji bit će minimalan. Naravno, ako trebate odabrati sistem prepoznavanja govora koji može raditi u uvjetima jake smetnje, testovi se moraju provesti različito. Međutim, koliko je poznato autorima knjige, dok je poštivanje sistema za priznavanje govora još uvijek vrlo, vrlo nisko.

Mikrofon izvodi za američku konverziju zvučnih oscilacija u fluktuacijama električna struja. Ove oscilacije mogu se vidjeti na ekranu osciloskopa, ali ne žurite u trgovinu za kupovinu ovog skupih uređaja. Sva oscilografska istraživanja možemo potrošiti pomoću običnog računara opremljenog zvučnom adapterom, kao što su zvučni adapter za blaster. Kasnije ćemo vam reći kako to učiniti.

Na slici. 2-2 Pokazali smo oscilogram zvučni signal, Dobiveno kada izgovara dugačak zvuk a. Ovaj oscilogram dobiven je pomoću Goldwave programa, o kojem još uvijek govorimo u ovom poglavlju knjige, kao i korištenje zvučnog blaster i mikrofona audio adaptera, slično onoj prikazanoj na slici prikazanoj na slici prikazanoj na slici prikazanoj na slici prikazanoj na slici prikazanoj na slici prikazanoj na slici. 2-1.

Sl. 2-2. Oscilogram zvučnog signala

Program Goldwave omogućava vam istezanje oscilograma duž vremenske osi, što vam omogućava da vidite najmanja detalja. Na slici. 2-3 Pokazali smo istegnuti fragment zvučnog oscilograma gore spomenutog.

Sl. 2-3. Zvučni zvučni fragment oscilograma

Imajte na umu da se veličina ulaznog signala koji dolazi iz mikrofona periodično varira i uzima i pozitivne i negativne vrijednosti.

Ako je samo jedna frekvencija bila prisutna u ulaznom signalu (to jest, ako je zvuk bio "čist"), oblik signala dobivenog iz mikrofona bio bi sinusoidan. Međutim, kao što smo rekli, spektar ljudskih govornih zvukova sastoji se od skupa frekvencija, kao rezultat koji je oblik govornog signala oscilograma daleko od sinusoidnog.

Signal čija se vrijednost neprekidno mijenja vrijeme, nazvat ćemo analogni signal. Ovaj signal dolazi iz mikrofona. Za razliku od analognog, digitalnog signala je skup numeričkih vrijednosti koje variraju s vremenskim diskretnim.

Na računalo može obraditi zvučni signal, mora se prevesti iz analognog obrasca u digitalni, odnosno za predstavljanje u obliku niza numeričkih vrijednosti. Ovaj se proces naziva digitalizacijom analognog signala.

Digitalizacija zvučnog (i bilo kojeg analognog) signala vrši se pomoću posebnog uređaja koji se zove analog-to-digitalni pretvarač ADC (analogni digitalni pretvarač, ADC). Ovaj je uređaj na ploči audio adaptera i uobičajen je mikrocircuit.

Kako funkcionira analogni digitalni pretvarač?

Periodično mjeri nivo ulaznog signala i daje izlaznu numeričku vrijednost rezultata mjerenja. Ovaj proces je ilustriran na slici. 2-4. Ovdje su sivi pravokutnici označili ulazne vrijednosti izmjerene u određenom stalnom vremenskom intervalu. Skup takvih vrijednosti i digitalizirani je prikaz ulaznog analognog signala.

Sl. 2-4. Mjerenje ovisnosti amplitude signala od vremena

Na slici. 2-5 Pokazali smo vezu analognog digitalnog pretvarača u mikrofon. U ovom slučaju ulaz x 1 služi analogni signal, a digitalni signal se uklanja iz u 1--U N izlaza.

Sl. 2-5. Analogni digitalni pretvarač

Analog-to-digitalni pretvarači karakteriziraju dva važna parametra - frekvencija transformacije i broj kvantizacijskih nivoa ulaznog signala. Ispravan odabir ovih parametara ključan je za postizanje adekvatnog zastupanja u digitalnom obliku analognog signala.

Koliko često često trebate mjeriti vrijednost amplitude ulaznog analognog signala tako da zbog digitalizacije ne gubi informacije o promjenama u analognom signalu unosa?

Čini se da je odgovor jednostavan - ulazni signal mora se mjeriti što je češće moguće. Zaista, češće analogni digitalni pretvarač provodi takva mjerenja, što će biti praktične najmanje promjene amplitude ulaznog analognog signala.

Međutim, nepotrebno česta mjerenja mogu dovesti do neopravdanog rasta digitalnog toka podataka i beskorisnim troškovnim računarskim resursima prilikom obrade signala.

Srećom, pravi izbor Pretvorba frekvencije (frekvencija uzorkovanja) je dovoljno jednostavna. Da biste to učinili, dovoljno je kontaktirati Kotelnikov teoremu, poznatom onima vještima u području digitalne obrade signala. Teorema navodi da frekvencija konverzije mora biti dva puta veća od maksimalne frekvencije spektra transformiranog signala. Stoga, za digitalizaciju bez gubitka kvalitete zvučnog signala, čija frekvencija nalazi se u rasponu od 16-20.000 Hz, morate odabrati frekvenciju pretvorbe, a ne manje od 40.000 Hz.

Napomena, međutim, da je u profesionalnoj zvučnoj opremi frekvencija pretvorbe odabrana nekoliko puta navedene vrijednosti. To se učini kako bi se postigao vrlo visok kvalitet digitaliziranog zvuka. Za sustave prepoznavanja govora, ovaj kvalitet nije relevantan, tako da nećemo vam oštavati pažnju na takav izbor.

A koja učestalost transformacije potrebna za digitalizaciju zvuka ljudskog govora?

Budući da zvuci ljudskog govora leže u frekvencijskom rasponu od 300-4000 Hz, minimalna potrebna učestalost pretvorbe je 8000 Hz. Međutim, mnogi računalni programi Upotreba prepoznavanja govora Standard za konvencionalne audio adaptere. Frekvencija transformacije je 44.000 Hz. S jedne strane, ova učestalost transformacije ne dovodi do pretjeranog povećanja protoka digitalnih podataka, a druga - pruža digitalizaciju govora s dovoljnim kvalitetom.

Čak ni u školi naučili smo se da se s bilo kojom mjerenjima pojavljuju pogreške iz kojeg se nemoguće potpuno riješiti. Takve greške pojavljuju se zbog ograničene rezolucije mjernih instrumenata, kao i zbog činjenice da sam proces mjerenja može napraviti neke promjene izmjerene vrijednosti.

Analog-to-digitalni pretvarač predstavlja analogni signal unosa u obliku potoka brojeva ograničenog bita. Konvencionalni audio adapteri sadrže 16-bitne ADC blokove koji mogu predstavljati amplitudu ulaznog signala u obliku 216 \u003d 65536 različitih vrijednosti. ADC uređaji u visokoj zvučnoj opremi mogu biti 20-bitni, koji pružaju veću preciznost amplitude audio signala.

Moderni programi za prepoznavanje govora stvoreni su za obične računare opremljene uobičajenim zvučnim adapterima. Stoga, za provođenje eksperimenata prepoznavanjem govora nećete morati steći profesionalni audio adapter. Takav adapter kao zvučni Blaster prilično je pogodan za digitalizaciju govora da ga dodatno prepozna.

Uz koristan signal za mikrofon, obično padaju razni zvukovi - buka iz ulice, buke vjetra, stranih razgovora itd. Buka negativno utječe na kvalitetu rada sistema prepoznavanja govora, tako da se mora baviti tim. Jedan od načina na koji smo već spomenuli - današnji sustavi prepoznavanja govora najbolje se koristi u mirnoj sobi, ostaju s računarom jednom na jednom.

Međutim, mogu se stvoriti idealni uvjeti ne uvijek, tako da morate koristiti posebne metodeomogućujući vam da se riješite buke. Za smanjenje nivoa buke, koriste se posebni trikovi kada izgradnju mikrofona i posebnih filtera koji uklanjaju iz spektra analognog frekvencijskog signala koji ne nose korisne informacije. Pored toga, ova se tehnika koristi kao kompresija. dinamički raspon Nivo unosa.

Ispričajte sve to po redu.

Frefrektni filter Naziva se uređaj koji pretvara frekvencijski spektar analognog signala. U ovom slučaju, tijekom procesa transformacije (ili apsorpcija) nastaju oscilacija određenih frekvencija.

Možete zamisliti ovaj uređaj u obliku serije crne kutije sa jednim unosom i jednim izlazom. S obzirom na našu situaciju, mikrofon će biti povezan sa unosom frekvencije filtera, a analogni digitalni pretvarač će biti spojen na izlaz.

Filteri frekvencije su različiti:

· Donji frekvencijski filteri;

· Velika frekventna filtera;

· Prolazna filtera za trake;

· Isključeni filtri za trake.

Donji frekvencijski filteri (Filter niskog prolaza) uklanja se iz ulaznog spektra Sve frekvencije čije su vrijednosti ispod neke frekvencije praga ovisno o postavci filtra.

Budući da zvučni signali leže u rasponu od 16-20 000 Hz, sve frekvencije manje od 16 Hz mogu se izrezati bez pogoršanja kvalitete zvuka. Za prepoznavanje govora, važan je frekvencijski raspon od 300-4000 Hz, tako da možete smanjiti frekvencije ispod 300 Hz. U ovom slučaju, sva smetnja će se izrezati iz ulaznog signala, čiji frekvencijski spektar nalazi se ispod 300 Hz, a neće ometati proces prepoznavanja govora.

Slično, gornji frekvencijski filteri (High-cax filter) izrezuju se iz ulaznog spektra svih frekvencija iznad neke frekvencije praga.

Osoba ne čuje zvukove sa frekvencijom od 20.000 Hz i više, tako da se mogu izrezati iz spektra bez uočljive pogoršanja zvuka. Što se tiče prepoznavanja govora, ovde možete smanjiti sve frekvencije iznad 4000 Hz, što će dovesti do značajnog smanjenja nivoa visoke frekvencije.

Prenosni filter za trake (BAND-Filter) može se zamisliti kao kombinacija donjeg i gornje frekvencijskog filtra. Takav filter odgađa sve frekvencije ispod takozvane donja frekvencijakao i gore gornja frekvencija propusnost.

Stoga je za sistem prepoznavanja govora, filter propusne širine je prikladan, koji odgađa sve frekvencije osim frekvencija raspona od 300-4000 Hz.

Što se tiče filtera za snimanje paljenja (Band -Stop filter), oni vam omogućavaju izrezanje ulaznog spektra Sve frekvencije koje leže u navedenom rasponu. Takav je filter prikladan, na primjer, za suzbijanje buke koji zauzima čvrst dio spektra signala.

Na slici. 2-6 Pokazali smo vezu filtera propusne širine.

Sl. 2-6. Filtriranje zvučnog signala prije digitalizacije

Mora se reći da su uobičajeni zvučni adapteri instalirani u računaru u svom sastavu filter trake kroz koji analogni signal prolazi prije digitalizacije. Opremljena propusnost takvog filtra obično odgovara rasponu zvučnih signala, naime, 16-20.000 Hz (u različitim audio adapterima, vrijednosti gornje i donje frekvencije mogu se razlikovati u malim granicama).

I kako postići užnju propusnost od 300-4000 Hz, koja odgovara najuobnostivnijem dijelu ljudskog spektralnog spektra?

Naravno, ako imate tendenciju dizajniranja radio-elektroničke opreme, možete napraviti svoj filter iz mikro circuita operativnog pojačala, otpornika i kondenzatora. Otprilike prvih stvaralaca sistema za priznavanje govora.

ali industrijski sistemi Prepoznavanje govora mora biti obradivo na standardnom računarskom hardveru, tako da je put izrade posebnog filtra benda nije prikladan ovdje.

Umjesto toga, takozvani se koristi u savremenim sistemima prerade govora digitalni frekvencijski filteriimplementirano programski. Postalo je moguće nakon cPU Računar je postao dovoljno moćan.

Provedeni softver za digitalni frekvencijski filter pretvara ulaz digitalni signal na izlazni digitalni signal. U procesu pretvorbe, program procesuje poseban tok signala luminomenice amplitude signala koji dolazi iz analognog digitalnog pretvarača. Rezultat konverzije također će biti broj brojeva, međutim, ova nit će odgovarati već filtriranom signalu.

Govorimo o analognom digitalnom pretvaraču, primijetili smo takve važna karakteristikakao broj nivoa kvantizacije. Ako je u audio adapteru instaliran 16-bitni analogni digitalni pretvarač, a zatim nakon digitalizacije zvučne signale može biti predstavljeno kao 216 \u003d 65536 različitih vrijednosti.

Ako postoji malo nivoa kvantizacije, zatim tzv varati buku. Da bi se smanjio ovaj šum, u visokokvalitetnim sistemima digitalizacije zvuka, analogni digitalni pretvarači trebaju se primijeniti s maksimalnim raspoloživim brojem nivoa kvantizacije.

Međutim, postoji još jedan prijem koji vam omogućava da smanjite učinak kvantizacione buke na kvalitetu audio signala koji se koristi u digitalnim sistemima za snimanje zvuka. Kada koristite ovaj prijem prije digitalizacije, signal se prolazi kroz nelinearni pojačalo, podvlačenje signala sa malom amplitudom signala. Takav uređaj povećava slabe signale jače od jake.

Ovo je prikazano grafikom ovisnosti amplitude izlaznog signala iz amplitude ulaznog signala prikazanog na slici. 2-7.

Sl. 2-7. Nelinearna pojačanja prije digitalizacije

Na fazi obrnute pretvorbe digitaliziranog zvuka na analogno (ovaj korak u ovom poglavlju smatramo u ovom poglavlju) prije prikazivanja audio stupca, analogni signal se ponovo prolazi kroz nelinearnu pojačalu. Ovoga puta koristi se još jedno pojačalo, što naglašava signale s velikom amplitudom i ima karakteristiku prenosa (ovisnost amplitude izlaznog signala iz amplitude ulaznog signala), obrnuto je za vrijeme digitalizacije.

Kako sve ovo može pomoći kreativcima sistema za priznavanje govora?

Osoba, kao što je poznata, prilično je prepoznata od govora izgovorena mirnim šaputom ili prilično glasnim glasom. Može se reći da je dinamički raspon nivoa volumena uspješno prepoznatog govora za osobu prilično širok.

Današnji računalni sistemi Prepoznavanje govora, nažalost, dok se ne pohvalim. Međutim, s ciljem određenog širenja određenog dinamičkog raspona prije digitalizacije, možete preskočiti signal iz mikrofona kroz nelinearnu pojačala, od kojih je prijenos koji je prikazan na slici. 2-7. Ovo će smanjiti nivo buke kvantizacije tokom digitalizacije slabih signala.

Programeri sistema za priznavanje govora, opet su primorani da se fokusiraju prvenstveno na serijski proizvedene zvučne adaptere. Ne pružaju gore opisane nelinearne konverzije signala.

Međutim, možete stvoriti softver ekvivalent nelinearnog pojačala koji pretvara digitalizirani signal prije nego što je prenose u modul prepoznavanja govora. I iako takva pojačala programa neće moći smanjiti buku kvantizacije, moguće je naglasiti te nivoe signala koji nose najveće govorne informacije. Na primjer, možete smanjiti amplitudu slabih signala, eliminirajući signal od buke.

© 2014 stranica

Ili fotografska širina Foto materijal je odnos između maksimalne i minimalne vrijednosti izloženosti koje se mogu pravilno shvatiti na slici. S obzirom na digitalnu fotografiju, dinamički raspon je zapravo ekvivalentan omjeru maksimalnih i minimalnih mogućih vrijednosti korisnog električnog signala koji generira foto-senzor tokom izlaganja.

Dinamički raspon mjeri se u koracima izloženosti (). Svaki korak odgovara udvostručivanju količine svjetlosti. Na primjer, ako određena kamera ima dinamičan raspon od 8 eV, to znači da se maksimalna moguća vrijednost korisnog signala njegove matrice odnosi na minimum kao 2 8: 1, što znači da je kamera sposobna za snimanje unutar jedne Okvirni predmeti razlikuju se u svjetlini ne više od 256 puta. Preciznije, može ga uhvatiti objektima s bilo kojom svjetlinom, ali predmete čija će svjetlina preći maksimum dopuštena vrijednost Izaći ćemo na sliku zasljepljujuće bijele boje i predmeta čija će svjetlina biti ispod minimalne vrijednosti - crno ugljen. Detalji i teksture bit će razlikovati samo o tim predmetima čija je svjetlina složena u dinamičnom rasponu komore.

Da biste opisali odnos između svjetlišta najsvjetlijeg i najmalnog od prenosivih predmeta, ne koristi se prilično ispravan pojam "dinamički raspon scene". Bit će tačnije razgovarati o rasponu svjetline ili na nivou kontrasta, jer je dinamički raspon obično karakterističan za mjerni uređaj (u ovaj slučaj, Digitalne matrice kamere).

Nažalost, opseg svjetline mnogih prekrasnih scena s kojima smo suočeni pravi zivotMože primetno prelaziti dinamičan raspon digitalnog fotoaparata. U takvim je slučajevima fotograf primoran da odluči koje su predmete trebale raditi u svim dijelovima, a koji se može ostaviti izvan dinamičkog raspona bez predrasuda do kreativnog dizajna. Da bi učinilo najefikasnije, pomoću dinamičnog raspona fotoaparata, ponekad može preuzeti toliko detaljno razumijevanje principa rada fotonzorke, koliko je razvijena umjetnička.

Dinamički faktori raspona

Donja granica dinamičkog raspona postavljena je nivoom vlastite buke foto-senzora. Čak i neograničena matrica stvara pozadinsku električni signal, nazvan tamni šum. Takođe, nastaje smetnja kada se naplata prenosi na analogni digitalni pretvarač, a sam ADC uvodi određenu grešku u digitaliziranom signalu - takozvani. Uzorkovanje buke.

Ako slikate u potpunoj tami ili sa poklopcem na objektivu, kamera će snimiti samo ovu besmislenu buku. Ako dopustite da minimalni broj svjetlosti dođe do senzora, fotodiode će početi akumulirati električni naboj. Vrijednost naboja, što znači intenzitet korisnog signala, proporcionalan će se broju snimljenih fotona. Da bi snimci, barem neki značajni detalji, potrebno je da nivo korisnog signala prelazi pozadinski nivo buke.

Dakle, niža granica dinamičkog raspona ili, drugim riječima, prag osjetljivosti senzora formalno se može definirati kao izlazni nivo signala na kojem je omjer signala do buke veći od jedinice.

Gornja granica dinamičkog raspona određuje se posudom zasebnim fotodiodom. Ako će, tokom izlaganja, bilo koji fotodiodu nakupljati električni naboj ograničavajućih vrijednosti za sebe, a zatim piksel slike koji odgovara preopterećenom fotodidu apsolutno je bijela, a daljnje zračenje neće utjecati na njenu svjetlinu. Ovaj fenomen se naziva kliping. Što je veća frenetska sposobnost fotodiode, veća signal može se ublažiti u izlazu prije nego što zasiće.

Za veću jasnoću, okrećemo se karakterističnom krivulji, što je grafikon izlazne ovisnosti iz izlaganja. Na vodoravnoj osi, binarni logaritam zračenja dobivenog senzorom odgađa se, a na vertikalnom - binarnom logaritu veličinu električnog signala generiran od senzora kao odgovor na tu zračenje. Moj crtež je u velikoj mjeri uvjetovan i slijedi izuzetno ilustrativne svrhe. Karakteristična krivulja sadašnjeg sektora fotografija ima nešto složeniji oblik, a nivo buke je rijetko tako visok.

Grafikon je jasno vidljiv dvije kritične ukočene tačke: u prvom od njih nivo korisnog signala prelazi prag buke, a u drugom - fotodiodi dostižu zasićenost. Vrijednosti ekspozicije koje leže između ove dvije tačkice su dinamički raspon. U ovom apstraktnom primjeru jednak je koliko je lako primijetiti, 5 ev, I.E. Kamera je u mogućnosti da probavi pet udvostručenih izlaganja, što je ekvivalentno 32x (2 5 \u003d 32) u razliku za svjetlinu.

Zone izloženosti koji čine dinamički raspon su nejednake. Gornje zone karakteriše viši omjer signala i buke, a samim tim izgledaju jasnije i detaljnije od nižeg. Kao rezultat toga, gornja granica dinamičkog raspona je vrlo stvarna i primjetna - klizanje je zamotana svjetla na najmanju premještaju, dok donja granica sve više potone u buku, a prijelaz u crnu boju daleko je od rezanja.

Linearna ovisnost signala iz izloženosti, kao i oštri prinos visoravni, jedinstvene su karakteristike digitalnog fotografskog procesa. Za usporedbu, pogledajte uvjetno karakterističnu krivulju tradicionalne fotoplinke.

Oblik krivulje i posebno ugao nagiba uvelike ovisi o vrsti filma i iz postupka njegove manifestacije, ali glavna stvar koja ostaje razlika između filmskog rasporeda iz digitalnog - nelinearne prirode ovisnosti Optička gustina filma iz vrijednosti ekspozicije ostaje nepromijenjena.

Donja granica fotografske širine negativnog filma određena je gustoćom vela, a gornja - maksimalna dostižna optička gustoća fotoklora; Rotirajte filmove - naprotiv. I u sjeni i u svjetlima su glatki savijanje karakteristične krivulje, što ukazuje na pad u kontrastu prilikom približavanja granicama dinamičkog raspona, jer je ugao nagiba krivulje proporcionalan na kontrastu slike. Dakle, zona izloženosti koji leže na srednjem dijelu rasporeda imaju maksimalan kontrast, dok je u svjetlima i sjenila, kontrast je smanjen. U praksi je razlika između filma i digitalne matrice posebno uočljiva u svjetlima: gdje se u digitalnoj slici svjetlosti spaljuje s klipnim dijelovima, dijelovi na filmu i dalje se mogu razlikovati, iako niske kontrasto i Prelaz u čistu bijelu boju izgleda glatko i prirodno.

U sensetitometriji se koriste čak dva neovisna termina: zapravo fotografska širinaograničeno relativno linearnoj sekciji karakteristične krivulje i korisna fotografska širina, Pored linearnog presjeka, također baza i ramena grafike.

Značajno je da prilikom prerade digitalnih fotografija, u pravilu, primjenjuje manje ili više izražene krivulje u obliku slova S, što povećava kontrast u polutonu po cijeni smanjenja sjene i svjetla, što daje digitalnu sliku prirodniji i ugodniji pogled na oči.

Bigness

Za razliku od matrice digitalnog fotoaparata, ljudska vizija je osebujna, recimo, logaritamski pogled na svijet. Sekvencijalno udvostručenje količine svjetlosti opaženi su kao jednake promjene u svjetlini. Lagani brojevi mogu se čak usporediti sa muzičkim oktavima, jer se za dvostruko promijeni promjene zvučne frekvencije percipiraju glasine kao jedan muzički interval. Ovaj princip zapošljava druga čula. Nelinearnost percepcije vrlo proširuje raspon ljudskog osjetljivosti na poticaj različitih intenziteta.

Prilikom pretvaranja RAW datoteke (nije važno, alati za kameru ili u sirovom pretvaraču) koji sadrže linearne podatke, takozvani se na njega automatski odnosi na njega. Gamma krivulja, koja je dizajnirana da nelinearno poveća svjetlinu digitalne slike, vodeći je u skladu s osobitostima ljudske vizije.

Sa linearnim pretvorbom slika se dobija previše mračno.

Nakon korekcije gama, svjetlina dolazi u normalu.

Gamma krivulja kao što bi se protezala tamne tonove i stiskali svjetlost, čineći raspodjelu gradskih gradova. Kao rezultat toga, slika stiče prirodni izgled, ali buku i artefakte uzorkovanja u sjeni neminovno postaju primjetniji, koji se pogoršava samo malim brojem nivoa svjetline u donjim zonama.

Linearna distribucija gradova za svjetlinu.
Jedinstvena distribucija nakon primjene gama krivulje.

ISO i dinamički raspon

Uprkos činjenici da se u digitalnoj fotografiji koristi isti koncept fotoosjetljivosti fotografskog materijala kao na fotografiji filma, trebalo bi shvatiti da je to isključivo zbog tradicije tradicije, jer se pristupi promjenu fotosenzibilnosti u digitalnom i filmska fotografija se razlikuju u principu.

Poboljšanje ISO osjetljivosti u tradicionalnoj fotografiji znači zamjenu jednog filma u drugi s većim žitom, tj. Postoji objektivna promjena u svojstvima foto materijala. U digitalnom fotoaparatu osjetljivost senzora je strogo postavljena po svojim fizičkim karakteristikama i ne može se mijenjati doslovno. Povećanjem ISO-a, fotoaparat ne mijenja ne stvarna osjetljivost senzora, ali samo poboljšava električni signal koji generira senzor kao odgovor na zračenje i pravilno prilagođava algoritam digitalizacije za ovaj signal.

Važna posljedica toga je smanjiti efektivni dinamički raspon srazmjerno povećanju ISO-a, jer se sa korisnim signalom poboljšava buka. Ako ISO 100 digitalizira cijeli raspon vrijednosti signala - od nule do zasićenog točke, zatim s ISO 200, za maksimalno je samo polovina kapaciteta fotodioda. Sa svakom udvostručenom ISO osjetljivošću, gornja faza dinamičkog raspona je odsječena, a preostali koraci se zatežu na njegovo mjesto. Zato se upotreba ultra visokih ISO vrijednosti lišena praktičnog značenja. S istim uspjehom možete olakšati fotografiju u sirovom pretvaraču i dobiti uporedivu razinu buke. Razlika između porasta ISO-a i umjetnog osvjetljenja slike je da se s povećanjem ISO-a pojavi jačanje signala prije nego što je primljena u ADC-u, a samim tim i buka kvantizacije ne pojačana, za razliku od vlastite buke senzora, Dok je u RAW-pretvaraču, pojačanje podložno uključuje greške ADC-a. Pored toga, smanjenje digitalizacijskog raspona znači preciznije uzorkovanje preostalih ulaznih vrijednosti.

Uzgred, ISO je na nekim uređajima ispod osnovne vrijednosti (na primjer, prema ISO 50), ne proširuje dinamički raspon i jednostavno otpušta signal dva puta, koji je jednak snimku u ručnom pretvaraču. Ova se funkcija može uopće tretirati kao štetna, jer upotreba podmimičke vrijednosti ISO-a izaziva komoru za povećanje izloženosti da, s preostalim nepromijenjenim pragom senzora, povećava rizik od slaganja u svjetlima.

Pravi dinamički raspon

Postoji niz programa poput (DXO analizator, zastupnik, Rawdigger itd.) Dopustite vam da mjerite dinamički raspon digitalnog fotoaparata kod kuće. U principu, ovo nije sjajna potreba, jer se podaci za većinu kamera mogu slobodno naći na Internetu, na primjer, na web mjestu DXOMark.com.

Trebam li vjerovati rezultatima takvih testova? Sasvim. Sa jedinom rezervacijom da su svi ovi testovi definirani efikasni ili, ako ga možete izraziti, tehnički dinamički raspon, I.E. Odnos između nivoa zasićenja i nivo buke matrice. Za fotografa je koristan dinamički raspon prije svega važan, i.e. Broj zona izloženosti koji vam zaista omogućava da uhvatite neke korisne informacije.

Kao što se sećate, prag dinamičkog raspona određen je nivoom buke foto senzinzora. Problem je što u praksi niže zone koje formalno dovode u dinamičkom rasponu, sadrži sve previše buke kako bi se mogli koristiti za upotrebu. Ovdje se, mnogo ovisi o pojedinskom sticanju - prihvatljiv nivo buke koji svaka određuje za sebe.

Moje subjektivno mišljenje je da detalji u sjenama počinju izgledati manje ili više pristojno sa omjerom signala / buke najmanje osam. Na osnovu toga utvrđujem koristan dinamički raspon, kao tehnički dinamički raspon minus oko tri koraka.

Na primjer, ako se komora ogledala prema rezultatima pouzdanih testova ima dinamičan raspon od 13 eV, što je vrlo dobro za današnje standarde, tada će njen koristan dinamički raspon biti oko 10 EV, koji je općenito također vrlo temeljit . Naravno, govorimo o pucanju u sirovoj, sa minimalnim ISO i maksimalnim bit. Prilikom snimanja u JPEG-u, dinamički raspon snažno ovisi o postavkama kontrasta, ali u prosjeku treba odbaciti dva ili tri koraka.

Za usporedbu: foto-trgovionirani foto snimci imaju korisnu fotografsku širinu od 5-6 koraka; Crno-bijeli negativni filmovi daju 9-10 koraka sa standardnim postupcima manifestacije i ispisa i sa određenim manipulacijama - do 16-18 koraka.

Rezimiranje gore navedenog, pokušat ćemo formulisati nekoliko jednostavnih pravila, koja će vam pomoći da se izvučete iz senzora vaših fotoaparata maksimalne performanse:

  • Dinamički raspon digitalnog fotoaparata u potpunosti je dostupan samo prilikom snimanja u sirovoj boji.
  • Dinamički raspon smanjuje se sa povećanjem osjetljivosti na svjetlo, pa izbjegavajte visoke ISO vrijednosti ako nema oštre nužnosti.
  • Koristeći veće pražnjenje za sirove datoteke ne povećava pravi dinamični raspon, već poboljšava odvajanje tona u sjeni zbog više Nivo svjetline.
  • Izloženost desnoj strani. Zone gornje izloženosti uvijek sadrže maksimum korisne informacije Sa minimum buke i treba ih koristiti najefikasnije. Istovremeno, ne biste trebali zaboraviti na opasnost od isječanja - piksela koji su dostigli zasićenost apsolutno su beskorisni.

I glavna stvar: Nije potrebno brinuti o dinamičnom rasponu vaše kamere. Sa dinamičnim rasponom, u redu je. Vaša sposobnost da vidite svjetlost i kompetentno upravljanje izloženosti mnogo je važnija. Dobar fotograf neće se žaliti na nedostatak fotografske širine, ali će pokušati sačekati ugodnije rasvjete ili će promijeniti ugao ili će koristiti bljeskalicu, u reči, postupati u skladu sa okolnostima. Reći ću vam više: Neke scene su samo pobijedile zbog činjenice da se ne uklapaju u dinamički raspon kamere. Često je nepotrebno obilje dijelova jednostavno potrebno sakriti se u polu-zahvalna crnu siluetu koja fotografiju istovremeno sažeto i bogatije.

Visok kontrast nije uvijek loš - trebate samo moći raditi s tim. Naučite da iskorištavate nedostatke opreme kao i njegove prednosti, a iznenadit ćete se koliko će se vaše kreativne mogućnosti proširiti.

Hvala na pažnji!

Vasily A.

Post Scriptum

Ako je članak bio koristan i informativan za vas, možete pribrati projektu, donošenjem doprinosa njegovom razvoju. Ako vam se ne sviđa članak, ali imate misli o tome kako to učiniti bolje, vaša kritika će biti prihvaćena bez manje zahvalnosti.

Ne zaboravite da je ovaj članak objekt autorskih prava. Reprint i citiranje dopušteno je ako postoji postojeća referenca na originalni izvor, a korišteni tekst ne treba odabrati ili modificirati.

Ljudi koji su entuzijastični sa domaćim zvukom pokazuju zanimljiv paradoks. Spremni su za ukidanje slušalice, kako bi izgradili stupce sa egzotičnim emisijama, ali oni su neugodni pred muzičkim konzervi, kao da vuk ispred crvene zastave. A u stvari, zašto je moguć kvazor da izađe, a iz konzervi pokušajte kuhati nešto jestivije?

Periodično postoje pritužbe na forumu: "Savjetuju dobro zabilježene albume." To je razumljivo. Posebna audiofilna izdanja, iako će oduševiti da čuju prvu minutu, ali niko ne sluša kraj, boli repertoar. Što se tiče ostatka Phonotheka, problem se čini očiglednim. Možete uštedjeti, ali ne možete uštedjeti i isprazniti zujanje novca u komponente. Još uvijek ne volim slušati vašu omiljenu muziku na veliku količinu i mogućnost pojačala ovdje.

Danas čak i u Hi-res albumi, vrhovi fonograma i jačinu vožnju pogođene u klip. Vjeruje se da većina sluša muziku na svakom smeću, a samim tim, potrebno je "pitati GAT" da napravi svojevrsnu posvećenost.


Naravno, to se ne vrši posebno za uznemirenje audiofila. O njima uglavnom se malo ljudi sjeća. Pa, osim što su pogodili da puste master datoteke s kojima se kopira glavna cirkulacija - CD-ovi, MP3 i tako dalje. Naravno, čarobnjak je dugo spljošten od kompresora, niko neće svjesno pripremiti posebne verzije za HD pjesme. Da li je to određeni postupak vinilnog nosača, koji iz tog razloga i zvuči humanije. I za digitalni put sve završava isto - veliki debeli kompresor.

Dakle, trenutno svi 100% fonograma objavljuju, minus klasične muzike, podvrgnute se kompresiji prilikom mastere. Netko ovaj postupak obavlja manje ili više vješto, a neko je potpuno u glupoj. Kao rezultat toga, na forumima imamo hodočasnike s linijom dr. Plugina za sinuse, bolne usporedbe publikacija, pobjeći do vinila, gdje vam treba i glavni popper.

Najzamrze se na vidiku sve ove sramote doslovno se okrenulo u audio cipelama. Nema šale, čitaju izvor zvuka Sveti Pismo nazad! Moderni programi uređivanja zvuka imaju neki alat za obnovu zvučni talasOkupljeni ošišan.

U početku je ova funkcionalnost namijenjena studijama. Kada se miješaju, postoje situacije kada je Clipping Clipping napisao, a više nije moguće rešavanje sesije iz više razloga, a ovde dolazi do AID ARSENAL audio urednika - dekalipper, dekompressor itd.

I već za takav softver, svi hrabriji povlači ručke običnih slušatelja koji imaju krv iz ušiju nakon sljedeće novitete. Netko preferira izotopu, netko Adobe Audicija, netko operacije dijeli između nekoliko programa. Značenje obnove bivše dinamike je pravilno ispravljanje isječenih vrhova s \u200b\u200bklipnika, koji se odmaraju na 0 dB, podseća na brzinu.

Da, oko 100% oživljavanje izvora govora ne ide, jer se pojavljuju procesi interpolacije na prilično špekulativne algoritme. Ali ipak, neki od rezultata obrade izgledali su mi zanimljivim i vrijednim studija.

Na primjer, album Lana Del Rey "požuda za život", dosljedno mrštitelj, Pah, vožnja! U originalnoj pjesmi "Kada je svijet bio u ratu koji smo nastavili plesati" je takav.


I nakon niza dekaliplica i dekompresisa, postalo je takva. DR koeficijent se promijenio sa 5 na 9. Preuzmi i slušajte uzorak prije i nakon obrade.


Ne mogu reći da je metoda univerzalna i pogodna je za sve raspoređene albume, ali u ovom slučaju preferirao sam sačuvati u prikupljanju upravo ovu opciju tretirana s aktivistom rutrera, umjesto službene publikacije u 24 bita.

Čak i ako se umjetno povlačenje vrhova iz zvuka mljeveno ne vraća pravu dinamiku muzičkih performansi, vaš DAC će ipak reći hvala. Bilo mu je toliko teško da radi bez grešaka na graničnim nivoima, gdje je vjerovatnoća takozvanog intermoničnih vrhova (ISP) sjajna. A sada će do 0 dB drogati samo rijetke spoor signala. Pored toga, aktivirani fonogram prilikom komprimiranja u FLAC-u ili drugom kodeku bez gubitaka sada će biti manji u veličini. Više "Air" u signalu štedi prostor tvrdog diska.

Pokušajte oživjeti svoje najmraženije albume ubijene na "volumen ratu". Za rezervu govornika prvo morate sniziti nivo staze na -6 dB, a zatim pokrenite dekor. Oni koji ne vjeruju da se računari mogu jednostavno držati između CD playera i amplifirskog studija Expander. Ovaj uređaj U suštini se vrši na isti način - jer može obnavljati i povući vrhove komprimirane preko dinamike audio signala. Slični su uređaji od 80-90, a ne reći da bi bili vrlo skupi i kao eksperiment, isprobajte ih vrlo zanimljivim.


Dinamički kontroler DBX 3BX procesuje signal odvojeno u tri pruge - lf, sc i rf

Jednom kada su izjednačilici bili za gotovo komponentu audio sistema, a niko ih se nije bojao. Danas nije potrebno izravnati visoke frekvencije magnetne trake, ali s ružnom dinamikom potrebno je riješiti nešto, braća.

Dinamična kompresija (Kompresija dinamičkog raspona, DRC) je sužavanje (ili širenje u slučaju ekspandera) dinamičkog raspona fonograma. Dinamički rasponTo je razlika između najmireg i najglasnijeg zvuka. Ponekad će najmanji u fonogramu biti zvuk malo glasan nivo buke, a ponekad malo najmirniji najglasnije. Hardverski uređaji i programi koji obavljaju dinamičnu kompresiju nazivaju se kompresori, ističući četiri glavne grupe: kompresori, ograničenja, širi i kapije.

Svjetiljka analogna kompresor DBX 566

Smanjena i promocija kompresije

Kompresija spuštanja (Kompresija prema dolje) smanjuje jačinu zvuka kada započne prekoračenje određene vrijednosti praga, ostavljajući mirnije zvukove nepromijenjene. Ekstremna opcija nižeg kompresije je limitator. Kompresija unapređenja (Kompresija prema gore), naprotiv, povećava jačinu zvuka, ako je ispod praga, a da ne utječe na više glasni zvukovi. Istovremeno, obje vrste kompresije uzivaju dinamički raspon audio signala.

Kompresija spuštanja

Kompresija unapređenja

Expander i Gate

Ako kompresor smanjuje dinamički raspon, ekspander ga povećava. Kada nivo signala postane iznad razine praga, Expander ga još više povećava, čime se povećava razlika između glasnih i tihnih zvukova. Takvi se uređaji često koriste prilikom snimanja instalacije bubnja za odvajanje zvukova nekih bubnjeva od drugih.

Vrsta ekspandera, koja se ne koristi da ne poboljšava glasno i da se osuši tihi zvukovi koji ne prelaze nivo vrijednosti praga (na primjer, pozadinsko buku) se naziva Kapija buke.. U takvom uređaju, čim nivo zvuka postane manji od praga, signalni prolaz se zaustavlja. Tipično se kapija koristi za suzbijanje buke u pauzama. Na nekim modelima se može učiniti tako da zvuk kada se razina praga ne zaustavi oštro, već postepeno lutao. U ovom slučaju, brzina prigušenja postavlja se regulator propadanja (recesija).

Možda, kao i druge vrste kompresora, možda zavisan od frekvencije (i.e., na različite načine za obradu određenih frekvencijskih opsega) i može raditi u režimu bočni lanac. (vidi dolje).

Princip rada kompresora

Signal koji pada u kompresor podijeljen je u dvije kopije. Jedna kopija šalje se u pojačalo, u kojem se stepen pojačanja kontrolira vanjskim signalom, drugi primjerak - formira ovaj signal. Ulazi u uređaj pod nazivom Side-Lanac, gdje se mjeri signal, a koverta se stvara na temelju tih podataka koji opisuju promjenu u svojoj jačini.
Dakle, dogovoreni su najmoderniji kompresori, ovo je takozvana vrsta prehrane. U starijim uređajima (vrsta povratne informacije), nivo signala se mjeri nakon pojačala.

Postoje razne analogne tehnologije kontrole (promjenjivo pojačanje), svaka sa svojim prednostima i nedostacima: lampe, optički koristeći fotoresistra i tranzistuju. Pri radu sa digitalnim zvukom (u uređivaču zvuka ili DAW) mogu se koristiti vlastiti matematički algoritmi ili se može unijeti rad analogne tehnologije.

Glavni parametri kompresora

Prag.

Kompresor smanjuje audio signal ako je njegova amplituda primarila specifičnu vrijednost praga (prag). Obično je naznačeno u decibelima, sa nižim pragom (na primjer, -60 dB) znači da će se zvuk obraditi nego s višim pragom (na primjer, -5 dB).

Odnos.

Stepen smanjenja razine određuje se parametrom omjera: Omjer 4: 1 znači da ako nivo ulaza 4 DB prelazi prag, nivo izlaza bit će veći od praga za 1 dB.
Na primjer:
Threshold \u003d -10 dB
Ulazni signal \u003d -6 dB (na 4 dB iznad praga)
Izlazni signal \u003d -9 dB (na 1 dB iznad praga)

Važno je imati na umu da se suzbijaju nivo signala i neko vrijeme nakon što padne ispod nivoa praga, a ovaj put se određuje vrijednost parametra pustiti.

Kompresija s maksimalnom vrijednošću omjera ∞: 1 naziva se ograničavanjem. To znači da se bilo koji signal iznad nivoa praga potiskira prije razine praga (s izuzetkom kratkog razdoblja nakon naglog povećanja ulaznog jačine zvuka). Za detalje pogledajte ispod "Limiter".

Primjeri različitih vrijednosti omjera

Napad i puštanje

Kompresor pruža određenu kontrolu nad tim koliko brzo reagira na promjenu dinamike signala. Parametar napada definira vrijeme za koji kompresor smanjuje koeficijent dobitka na nivo, koji je određen parametrom omjera. Izdanje definira vrijeme za koji kompresor, naprotiv, povećava koeficijent dobitka ili se vraća u normalu ako se nivo ulaznog signala padne ispod vrijednosti praga.

Faze napada i izdavanja

Ovi parametri ukazuju na vrijeme (obično u milisekundi), koje će biti potrebno za promjenu jačanja na određenu količinu decibela, obično je 10 dB. Na primjer, u ovom slučaju, ako je napad postavljen na 1 ms, za smanjenje pojačanja za 10 dB, bit će potrebno 1 ms, a 20 dB - 2 ms.

U mnogim kompresorima, parametri napada i otpuštanja mogu se konfigurirati, ali u nekim su u početku postavljeni i nisu regulirani. Ponekad su označeni kao "automatski" ili "ovisan o programu", I.E. variraju ovisno o ulaznom signalu.

Koljeno.

Još jedan parametar kompresora: tvrdo / meko koljeno. Određuje da li je početak primjene kompresije oštar (tvrdi) ili postepen (mekan). Meko koljeno smanjuje snagu prijelaza iz sirovog signala na signal koji je podvrgnut kompresiji, posebno u visokim vrijednostima omjera i oštro povećava se.

Tvrdo koljena i meka kompresija koljena

Vrh i rms.

Kompresor može reagirati na vrhunske (kratkoročne maksimalne) vrijednosti ili na prosječnom nivou ulaza. Upotreba vršnih vrijednosti može dovesti do oštrih fluktuacija u stupnju kompresije, pa čak i na distorziju. Stoga, kompresori primjenjuju prosječnu funkciju (obično ovo je RMS) ulaznog signala u odnosu na vrijednost praga. Daje ugodniju kompresiju, blizinu ljudskoj percepciji glasnoće.

RMS je parametar koji odražava prosječnu zapreminu fonograma. Sa matematičkog stanovišta RMS (korijenski srednji kvadrat) je RMS vrijednost amplitude određenog broja uzoraka:

Stereo povezivanje.

Kompresor u režimu stereo povezivanja odnosi se na isti dobitak i stereo kanala. To izbjegava pomak stereopanorame, što može biti rezultat individualne obrade lijevih i desnih kanala. Takav pomak događa ako se, na primjer, bilo koji glasni element zategnuo ne u centru.

Dobitak šminke.

Budući da kompresor smanjuje cjelokupni nivo signala, obično se dodaje mogućnost fiksne dobitke na izlazu, što vam omogućava da dobijete optimalni nivo.

POGLEDATI ISPRED SEBE.

Funkcija koja je unaprijed dizajnirana je za rješavanje problema sa osebujnim i prevelikim i premalim vrijednostima i oslobađanju. Previše napada ne dozvoljava vam efikasno presretanje prijelaznika, ali premalo možda neće biti ugodno za slušatelja. Kada koristite funkciju na izgled, glavni signal odgađa se u odnosu na regulator, omogućava vam da započnete kompresiju unaprijed, čak i prije nego što signal dostigne vrijednost praga.
Jedini nedostatak ove metode je vremensko kašnjenje signala koji u nekim slučajevima neželje.

Upotreba dinamičke kompresije

Kompresija se koristi svuda, ne samo u muzičkim fonogramima, već i svugdje, gdje trebate povećati ukupni volumen, bez povećanja vršne razine, gdje se koristi jeftina oprema za reprodukciju zvuka ili ograničen kanal za prijenos (Alert sistem, amaterski radio, itd.).

Kompresija se nanosi prilikom reprodukcije pozadinska muzika (u prodavaonicama, restoranima itd.), gdje su bilo koja primjetna promjena volumena nepoželjna.

Ali najvažniji opseg primjene dinamičke kompresije je muzička proizvodnja i emitovanje. Kompresija se koristi za pružanje zvuka "gustoće" i "pogona" za bolju kombinaciju alata jedni s drugima, a pogotovo prilikom prerade vokala.

Vokalne stranke u rock i pop muzici obično su podvrgnute kompresiji da ih ističu na pozadini pratnje i dodaju jasnoću. Posebna vrsta kompresora, konfigurirana samo na određenim frekvencijama - odrednica, koristi se za suzbijanje šištajuće pozadine.

U instrumentalnim strankama se kompresija koristi i za efekte koji nisu izravno povezani sa volumenom, na primjer, brzo blijedeni zvukovi bubnja mogu postati produženiji.

U elektroničkoj plesnoj muzici (EDM) se često koristi bočno chaning (vidi dolje) - na primjer, bas može kontrolirati cijev ili nešto slično kako bi se spriječilo sukob basa i bubnjeva i stvaraju dinamičnu pulsaciju.

Kompresija se široko koristi u emitovanju prenosa (radio, televizija, internet emitiranje) za povećanje percipiranog volumena uz smanjenje dinamičkog raspona izvornog zvuka (obično CD). Većina zemalja ima zakonska ograničenja u trenutnom maksimalnom obimu, koja se može emitovati. Obično se ta ograničenja primjenjuju konstantnim hardverskim kompresorima u eteričnom lancu. Pored toga, povećanje uočenog volumena poboljšava "kvalitetu" zvuka sa stanovišta većine slušalaca.

vidjeti i Lokantnost rata.

Dosljedan porast volumena iste pjesme revna se za CD od 1983. na 2000.

Bočni

Još jedan često pronađeni prekidač kompresora je "bočni lanac". U ovom režimu, kompresija zvuka se ne pojavljuje ovisno o vlastitom nivou, ali ovisno o nivou signala koji ulazi u priključak koji se tako obično naziva - bočni lanac.

To se može naći nekoliko aplikacija. Na primjer, vokalistički shepelvit i sva slova "C" izdvajaju se iz ukupne slike. Preskočite glas kroz kompresor, a priključak bočnog lanca služi istim zvukom, ali propušten kroz ekvilajzer. Na ekvilajzeru uklanjate sve frekvencije, osim onih koji koriste vokalištvu kada izgovarate slovo "C". Obično oko 5 kHz, ali može biti od 3 kHz do 8 kHz. Ako tada stavite kompresor u režim bočnog lanca, tada će se kompresija glasa pojaviti u tim trenucima kada je izrečeno slovo "C". Dakle, ispostavilo se uređaj poznat kao "jelen" (de-esser). Ova metoda rada naziva se "frekvencija ovisna" (ovisna frekvencija).

Druga upotreba ove funkcije naziva se "Ducker". Na primjer, na radio stanici, muzika prolazi kroz kompresor, a riječi DJ-a - kroz bočni lanac. Kad DJ počne razgovarati, količina muzike se automatski smanjuje. Ovaj efekat se može uspješno koristiti u evidenciji, na primjer, smanjiti jačinu jastuke tastature tokom pjevanja.

Ograničavajući zid od opeke

Kompresor i ograničivač su približno isti, može se reći da je limitator visoki omjer kompresor (od 10: 1) i obično, niskog napadačkog vremena.

Postoji koncept ograničavanja zida od opeke - vrlo visok omjer ograničavajući se (od 20: 1 i više) i vrlo brzog napada. U idealnom slučaju, ne dopušta signal da prelazi nivo praga. Rezultat će biti neugodan za glasine, ali to će spriječiti oštećenje tehnologije za reprodukciju zvuka ili prekomjerne širine prekomjernog kanala. Mnogi proizvođači integriraju granični uređaji u tu svrhu.

Clipper vs. Gramič, meka i tvrda isjeckanja

Ova grupa metoda temelji se na činjenici da su preneseni signali podvrgnuti nelinearnim transformacijama amplitude, a u prenošenju i primanjem dijelova nelinearnosti se pretvara. Na primjer, ako predajnik koristi nelinearnu funkciju ÖU, u prijemniku - u 2. Dosljedna primjena konvergentnih funkcija dovest će do činjenice da, općenito, transformacija ostaje linearna.

Ideja nelinearnih metoda kompresije podataka svodi se na činjenicu da odašiljač može dati veći raspon promjena prenesenog parametra s istom amplitudom izlaznih signala (to jest veći dinamički raspon). Dinamički raspon - To se izražava u relativnim jedinicama ili decibellah stavom najveće prihvatljivog amplituda signala na najmanju:

; (2.17)
. (2.18)

Prirodna želja za povećanjem dinamičnog raspona smanjenjem u min ograničen je osjetljivošću opreme i povećanjem učinka smetnji i vlastitim bukom.

Najčešće se kompresija dinamičkog raspona vrši pomoću par konvergivnih funkcija logaritma i potencijala. Naziva se prva operacija promjene amplitude kompresija(kompresija), drugo - proširivanje (istezanje). Izbor ovih funkcija povezan je s njihovom najvećom mogućnošću kompresije.

Istovremeno, ove metode imaju nedostatke. Prvi od njih je taj što je logaritam malog broja negativan i u ograničenju:

to jest, osjetljivost je vrlo nelinearna.

Da biste smanjili ove nedostatke, obje funkcije su izmijenjene pofsom i aproksimacijom. Na primjer, za telefonske kanale, aproksirana funkcija je povezana (tip A,):

i A \u003d 87.6. Dobit od kompresije je 24db.

Kompresija podataka od nelinearnih postupaka provodi analogni sadržaji sa velikim greškama. Upotreba digitalnih alata može značajno poboljšati tačnost ili brzinu transformacije. Istovremeno, direktna upotreba sredstava računarska oprema (To jest, direktan izračun logaritma i eksponencijala) neće dati bolji rezultat zbog pogreške u malim brzinama i akumulaciji izračuna.

Kompresija podataka kompresijom zbog preciznosti ograničenja koriste se u slučajevima neodgovora, na primjer, za prijenos govora na telefonskim i radio kanalima.

Efektivno kodiranje

Efektivni kodovi su ponuđeni Sondonu, Fano i Hafmanu. Suština kodova je da su oni neujednačeni, odnosno s drugačijom kategorijom pražnjenja, a dužina koda obrnuto je proporcionalna vjerojatnosti njegovog izgleda. Još jedna izvanredna karakteristika efikasnih kodova - ne zahtijevaju odvojenosti, odnosno posebni znakovi koji odvaju kombinacije susjednih kodova. To se postiže promatranjem jednostavno pravilo: Kraći kodovi nisu početak dužeg. U ovom slučaju, čvrsti tok binarnih pražnjenja jedinstveno se dekodira, jer dekoder prvo otkriva najkraće kombinacije koda. Efektivne kodove dugo su bili čisto akademski, ali nedavno se koriste u formiranju baza podataka, kao i u komprimiranju informacija u savremenim modemima i u softverskim arhivarima.

Zbog neravnine, uvodi se prosječna dužina kodova. Srednja dužina - matematičko očekivanje dužine kodova:

Štaviše, L CP ima tendenciju za H (x) odozgo (to jest, l Sre\u003e H (x)).

Provedba stanja (2,23) poboljšana je povećanjem N.

Postoje dvije sorte efikasnih kodova: Shannon Fano i Hafman. Razmotrite njihov račun na primjeru. Pretpostavimo da su vjerojatnosti likova u redoslijedu značenja prikazana u tablici 2.1.

Tabela 2.1.

Vjerojalnosti simbola

N.
P I. 0.1 0.2 0.1 0.3 0.05 0.15 0.03 0.02 0.05

Simboli su rangirani, odnosno oni traže zaredom na silaznu verovatnoću. Nakon toga, prema Shennon Fano metodi, slijedeći postupak se periodično ponavlja: Cijela grupa događaja podijeljena je u dvije podskupine s istim (ili približno istim) ukupnim vjerojatnostima. Postupak se nastavlja sve dok jedan element ne ostane u sljedećoj podskupini, nakon čega se ovaj element eliminira, a s preostalim tim akcijama se nastavljaju. To se događa sve dok posljednje dvije podskupine ne ostanu jedan element. Nastavite razmatranje našeg primjera, koji je smanjen u tablici 2.2.

Tabela 2.2.

Chennon Fano metoda

N. P I.
4 0.3 I.
0.2 I. II.
6 0.15 I. I.
0.1 II.
1 0.1 I. I.
9 0.05 II. II.
5 0.05 II. I.
7 0.03 II. II. I.
8 0.02 II.

Kao što se može vidjeti iz tablice 2.2, prvi simbol s vjerojatnošću P 4 \u003d 0,3 sudjelovao je u dva postupka particioniranja i oba su vremena pogodila grupu s brojem i. U skladu s tim kodiran je dvobojnim kodom II. Drugi element u prvoj fazi particije pripadao je grupi I, u drugom - grupi II. Stoga je njegov kod 10. Kodeksi ostalih likova u dodatnim komentarima ne trebaju.

Obično su neujednačeni kodovi prikazani u obliku drveća kodova. Stablo koda je grafikon koji pokazuje dozvoljene kombinacije kodova. Predifficirajte upute rebara ovog grafikona, kao što je prikazano na slici.2.11 (izbor smjerova je proizvoljan).

Grafikon se vodi na sljedeći način: izmičite rutu za namjenski simbol; Broj ispusta za to jednak je broju ivica u ruti, a vrijednost svakog pražnjenja jednaka je smjeru odgovarajućeg rebra. Ruta se sastoji izvorna tačka (Na crtežu je označeno slovom A). Na primjer, ruta do Vertex 5 sastoji se od pet rebara, od čega je sve, pored potonjeg, ima smjer 0; Dobijamo kod 00001.

Izračunajte za ovaj primjer entropije i srednju dužinu riječi.

H (x) \u003d - (0,3 dnevnik 0,3 + 0,2 zapisnik 0.2 + 2 0.1 Log 0,1+ 2 0,05 Log 0.05+

0.03 Log 0.03 + 0.02 Log 0.02) \u003d 2,23 bita

l CP \u003d 0,3 2 + 0,2 2 + 0,15 3 + 0,1 3 + 0,1 4 + 0,05 5 +0,05 4+

0.03 6 + 0.02 6 = 2.9 .

Kao što se vidi, srednja dužina riječi je blizu entropije.

Hafman kodovi izgrađeni su na drugom algoritmu. Postupak kodiranja sastoji se od dvije faze. U prvoj fazi, jednokratna kompresija abecede je dosljedno. Jednokratna kompresija je zamjena posljednja dva znaka (sa nižim verovatnoćima), sa potpunom verovatnoćom. Kompresija se vrši dok ne ostanu dva znaka. Istovremeno ispunjavaju tablicu kodiranja u kojoj su nastale rezultirajuće vjerojatnosti, a također prikazuju rute za koje se novi likovi kreću u sljedećoj fazi.

U drugoj fazi dolazi sama kodiranje, što započinje iz posljednje faze: Prvi od dva znaka dodijeli kod 1, drugi - 0. Nakon toga, idite u prethodnu fazu. Na simbole koji nisu učestvovali u kompresiji u ovoj fazi, atributi kodeksi iz naknadne faze, a dva najnovija likova dvaput pripisuju simbolični kod dobiveni nakon lijepljenja i dodati u gornji kôd simbola 1, dolje - 0. Ako Simbol je dalje u lijepljivanju sudjelovanja, njegov kôd ostaje nepromijenjen. Postupak se nastavlja do kraja (to je do prve faze).

Tabela 2.3 prikazuje kodiranje duž hafmana algoritma. Kao što se može vidjeti iz tablice, kodiranje je provedeno u 7 faza. S lijeve strane su vjerojatnosti znakova, desno - srednji kodovi. Strelice pokazuju premještanje novoformiranih znakova. U svakoj fazi posljednja dva znaka razlikuju se samo s mlađim pražnjenjem, što odgovara tehnici kodiranja. Izračunavamo prosječnu dužinu riječi:

l CF \u003d 0,3 2 + 0,2 2 + 0,15 3 ++ 2 0,1 + +0,05 4 + 0,05 5 + 0,03 6 + 0,02 6 \u003d 2,7

Još je bliže entropiji: kôd je još efikasniji. Na slici. 2.12 prikazuje stablo Hafman koda.

Tabela 2.3.

Kodiranje na algoritmu Hafman

N. P I. Kod I. II. III IV V. VI Vii
0.3 0.3 11 0.3 11 0.3 11 0.3 11 0.3 11 0.4 0 0.6 1
0.2 0.2 01 0.2 01 0.2 01 0.2 01 0.3 10 0.3 11 0.4 0
0.15 0.15 101 0.15 101 0.15 101 0.2 00 0.2 01 0.3 10
0.1 0.1 001 0.1 001 0.15 100 0.15 101 0.2 00
0.1 0.1 000 0.1 000 0.1 001 0.15 100
0.05 0.05 1000 0.1 1001 0.1 000
0.05 0.05 10011 0.05 1000
0.03 0.05 10010
0.02

Oba kodove zadovoljavaju zahtjev dekodiranja jedinstvenosti: Kao što se može vidjeti iz tablica, kraće kombinacije nisu početak duža kodova.

S povećanjem broja simbola, povećava se efikasnost kodova, tako da u nekim slučajevima kodirane veće blokove (na primjer, ako govorimo o tekstovima, možete kodirati neke od najčešćih slogova, riječi, pa čak i fraza).

Učinak implementacije takvih kodova određuje se u odnosu na jedinstveni kod:

(2.24)

gdje je n broj jedinstvenih pražnjenja koda, koji se zamjenjuje efikasnim.

Izmjene Khafman kodova

Classic Hafman algoritam odnosi se na dvotoputan, I.E. Zahtijeva početni skup statističkih podataka o simbolima i porukama, a zatim gore opisane procedure. U praksi je nezgodna, jer povećava vrijeme obrade poruka i akumulaciju rječnika. Metode pojedinačne prolaske u kojima se kombiniraju postupci akumulacije i kodiranja. Takve metode se nazivaju i adaptivno kompresija duž Hafmana [46].

Suština adaptivne kompresije širom Hafmana svodi se na izgradnju početnog stabla koda i njegove dosljedne modifikacije nakon primitka svakog sljedećeg simbola. Kao i prije, drveće su ovdje binarni, i.e. Iz svake vrhove grafikona - drvo, javlja se maksimalno dva luka. Uobičajeno je nazvati originalni vrh roditelja, a dvije povezane sljedeće vrhove - djeca. Uvodimo koncept težine Vertexa - ovo je broj znakova (riječi) koji odgovaraju ovom Vertexu dobivenom kada se primijeni početni niz. Očito je da je zbroj vaga djece jednaka težini roditelja.

Nakon ulaska u sljedeći simbol ulaznog slijeda, stablo koda se revidira: Težine vrhova se preračunavaju i, ako je potrebno, vrhovi su preuređeni. Vladavina preuređenja vrhova na sljedeći način: Težine donjih vrhova su najmanji, a vrhovi koji su ostavljeni na stupcu imaju najmanje utege.

Istovremeno, vrhovi su numerirani. Numeriranje započinje nižim (obješenim, tj. Koje nemaju djecu) vrhove s lijeva na desno, zatim se prebaci na gornji nivo itd. do numeriranja posljednjeg, izvorne vertex. Istovremeno se postiže sljedeći rezultat: manje težina vrha, to je manje njen broj.

Permutacija se vrši uglavnom za viseće vrhove. Kada se razmatra permutacija, formulirano pravilo: vrhovi s velikom težinom imaju veći broj.

Nakon prelaska slijeda (naziva se i kontrola ili test), kombinacije koda dodijeljene su svim visećim vrhovima. Pravilo za dodjeljivanje pravila slično je gore: Broj pražnjenja koda jednak je broju vrhova kroz koji ruta radi od izvora do ovog visećeg vrha, a vrijednost određenog pražnjenja odgovara smjeru od roditelja "Dete" (recimo, prelazak na levo od roditelja odgovara vrednosti 1, desno - 0).

Dobivene kombinacije kodova unose se u memoriju kompresije kompresijskog uređaja zajedno sa svojim analozima i formiraju rječnik. Upotreba algoritma je sljedeća. Privremeni slijed znakova podijeljen je u fragmente u skladu s postojećim rječnikom, nakon čega se svaki od fragmenata zamjenjuje njenim kodom iz rječnika. Fragmenti nisu otkriveni u rječniku formiraju nove viseće vrhove, dobijaju težinu i ulaze se i u rječnik. To formira adaptivni algoritam za punjenje rječnika.

Da bi povećali efikasnost metode, poželjno je povećati veličinu rječnika; U ovom slučaju, koeficijent kompresije raste. Gotovo veličina rječnika je 4 - 16 KB memorije.


Ilustriramo algoritam dat primjerom. Na slici. 2.13 Prikazuje izvorni dijagram (naziva se i sa Hafmanovom stablom). Svaka vrpca od drva prikazuje pravokutnik, u koji se dvije znamenke upisane kroz frakciju: prvo znači broj vrhova, drugi je njegova težina. Kako možete biti sigurni da su utezi u maču i njihovi brojevi zadovoljni.

Pretpostavimo sada da simbol koji odgovara Vertexu 1, u testnom sekvenci sastao se sekundarno. Težina vrhova promijenjena, kao što je prikazano na Sl. 2.14 Kao rezultat toga, broj numeriranja Verteksa je prekršen. U sljedećoj fazi mijenjamo raspored visećih vrhova, za koje mijenjamo vrhove 1 i 4 i upravlja sve vrhove stabla. Rezultirajući grafikon prikazan je na slici. 2.15. Zatim se postupak nastavlja slično.

Treba imati na umu da svaki viseći vrh u Hafmanu odgovara specifičnom simbolu ili njihovoj grupi. Roditelj se razlikuje od djece po činjenici da je grupa likova, prikladna za jedan simbol u kratkom simbolu, a njegova djeca se razlikuju u posljednjem simbolu. Na primjer, roditelji odgovaraju simbolima "automobila"; Tada djeca mogu imati sekvence "kara" i "šarana".

Gore navedeni algoritam nije akademski i aktivno se koristi u programima - arhiva, uključujući prilikom komprimiranja grafičkih podataka (oni će se raspravljati u nastavku).

Lempel - Ziva algoritmi

To su najčešće korišteni algoritmi kompresije. Koriste se u većini programa - arhivera (na primjer, pkzip. Arj, LHA). Suština algoritama je da se neki skup znakova zamijeni prilikom arhiviranja u posebno generiranom rječniku. Na primjer, često se nalaze u poslovima fraze "na vašem odlaskom broja slova ..." može zauzimati u rječniku poziciji 121; Zatim, umjesto da pređete ili pohranu spomenute fraze (30 bajta) možete pohraniti broj fraze (1,5 bajta u binarnom - decimalnom obliku ili 1 bajt - u binarnoj).

Algoritmi su nazvani po autorima koji su ih prvi put ponudili 1977. Od toga, prvo - LZ77. Za arhiviranje, stvoren je takozvani klizni prozor koji se sastoji od dva dijela. Prvi dio, veći format služi za formiranje rječnika i ima veličinu reda nekoliko kilobajta. U drugom, manjim dijelom (obično do 100 bajtova) prihvaćaju trenutne likove teksta koji se gledaju. Algoritam pokušava pronaći u rječniku set likovima koji se poklapa sa gledanim prozorom. Ako je moguće, generira se kôd koji se sastoji od tri dijela: raseljavanje u rječniku u pogledu njegovog početnog podvrgavanja, dužini ovog podzire pored ovog karaktera supstrata. Na primjer, namjenski supstrat sastoji se od "aplikacijskih" simbola (samo 6 znakova), sljedeći simbol je "E". Zatim ako podstrest ima adresu (mjesto u rječniku) 45, a zatim zapis u rječniku ima oblik "45, 6. e". Nakon toga, sadržaj prozora prelazi na položaj, a potraga se nastavlja. Tako se formira i rječnik.

Prednost algoritma je lako formalizirani algoritam za sastavljanje rječnika. Pored toga, moguće je raspakirati i bez početnog rječnika (poželjno je imati testni niz) - rječnik se formira u procesu neobičnog.

Nedostaci algoritma pojavljuju se sa povećanjem veličine rječnika - vrijeme za pretragu se povećava. Pored toga, ako u trenutnom prozoru nedostaje niz znakova, svaki simbol je napisan na tri elementa, I.E. Ispada da nije kompresija, ali istezanje.

Najbolje karakteristike Ima LZSS algoritam predložen 1978. godine. Ima razlike u održavanju kliznog prozora i izlaznih kodova kompresora. Pored prozora, algoritam formira binarno stablo, slično hafmanovoj stablu da ubrza potragu za poremećajima: Svako podstrest napuštanje trenutnog prozora dodaje se stablo kao jedno od djece. Takav algoritam omogućava vam dodatno povećanje veličine trenutnog prozora (poželjno je da je njegova vrijednost jednaka stupnju dva: 128, 256 itd. Bajt). Kodovi sekvence se takođe formiraju drugačije: 1-bitni prefiks dodatno se uvodi za razlikovanje neprojećenih likova iz parova "Ofset, dužina".

Još veća kompresija dobiva se pomoću algoritama tipa LZW. Ranije opisani algoritmi imaju fiksnu veličinu prozora, što dovodi do nemogućnosti ulaska u rječnik fraza duži od veličine prozora. U LZW algoritmima (i njihovim prethodnikom LZ78) prozor View ima neograničenu veličinu, a rječnik akumulira frazu (a ne ukupnost likova kao prije). Rječnik ima neograničenu dužinu, a koder (dekoder) radi u režimu stanju pripravnosti. Kada se formira fraza koja se podudara s rječnikom, kodeks koincidencija se izdaje (I.E. Kodeks ove fraze u rječniku) i kodeks sljedećeg simbola iza njega. Ako se nakupljaju simboli, formira se nova fraza, ona se također unosi u rječnik, kao najkraći. Kao rezultat toga, formiran je rekurzivni postupak, pružajući brzo kodiranje i dekodiranje.

Dodatna prilika Kompresija pruža komprimirano kodiranje ponavljanih znakova. Ako u nizu, neki likovi slijede zaredom (na primjer, u tekstu može biti "prostora" znakova, u numeričkom slijedu - tekući nule, itd.), Ima smisla zamijeniti simbol svog para "; dužine "ili" znak, dužina ". U prvom slučaju, kod označava značajku da je niz kodiran (obično 1 bit), a zatim kod ponovnog simbola i dužinu sekvence. U drugom slučaju (predviđeno za najčešće ponovljene simbole) u prefiksu ukazuje na jednostavno znak ponavljanja.