Kompresia zvuku: princíp a konfigurácia. Syntéza a rozpoznávanie reči

Počas času, keď výskumníci tiež pokračovali v riešení problému vytvorenia rečového rozhrania pre počítače, bolo často potrebné vyrábať zariadenia nezávisle, čo vám umožní zadať zvukové informácie do počítača, ako aj zobraziť ho z počítača. Dnes môžu mať takéto zariadenia jedinečný historický záujem, pretože moderné počítače môžu ľahko vybaviť vstupné a výstupné zariadenia, ako sú zvukové adaptéry, mikrofóny, slúchadlá a zvukové stĺpy.

Nebudeme prehĺbiť podrobnosti interné zariadenie Tieto zariadenia, ale my to povedzme o tom, ako fungujú, a dávajú určité odporúčania na výber zvukových počítačových zariadení na prácu s syntézou rozpoznávania a syntézou reči.

Ako sme už hovorili v predchádzajúcej kapitole, zvuk nie je nič viac ako vzduchové oscilácie, ktorých frekvencia leží vo frekvenčnom rozsahu vnímanej osobou. V rôznych ľuďoch sa však presné limity rozsahu počuteľných frekvencií môžu líšiť, ale predpokladá sa, že zvukové oscilácie ležia v rozsahu 16-20 000 Hz.

Úlohou mikrofónu je previesť výkyvy zvuku do elektrických oscilácií, ktoré môžu byť naďalej vystužené, filtrované, aby sa odstránili rušenie a digitalizované na vstup do počítača.

Podľa princípu prevádzky sú najbežnejšie mikrofóny rozdelené na uhlie, elektrodynamické, kondenzátor a elektret. Niektoré z ich týchto mikrofónov vyžadujú svoju prácu externý zdroj Súčasný (napríklad uhlie a kondenzátor), iní pod vplyvom zvukových oscilácie môžu nezávisle produkovať striedavé elektrické napätie (to sú elektrodynamické a elektrické mikrofóny).

Môžete tiež rozdeliť mikrofóny na tento účel. Tam sú štúdio mikrofóny, ktoré môžu byť uchovávané v ruke alebo zaistení na stojane, existujú rádiové mikrofóny, ktoré môžu byť upevnené na oblečenie, a tak ďalej.

Existujú aj mikrofóny určené špeciálne pre počítače. Takéto mikrofóny sú zvyčajne pripevnené na stojane na povrchu stola. Počítačové mikrofóny môžu byť kombinované so slúchadlami, ako je znázornené na obr. 2-1.

Obr. 2-1. Slúchadlá s mikrofónom

Ako si vybrať zo všetkých rôznych mikrofónov Ten, ktorý je najvhodnejší pre systémy rozpoznávania reči?

V zásade môžete experimentovať s akýmkoľvek mikrofónom, ak nie je možné pripojiť k počítačovému audio adaptéra. Avšak, vývojári systémov rozpoznávania reči sa odporúča získať takýto mikrofón, ktorý v práci bude v stálej vzdialenosti úst rečníka.

Ak sa vzdialenosť medzi mikrofónom a ústami nezmení, priemerný elektrický signál prichádzajúci z mikrofónu sa tiež zmení. To bude mať pozitívny vplyv na kvalitu práce moderných systémov rozpoznávania reči.

Aký je problém?

Osoba je schopná úspešne rozpoznať reč, ktorých objem sa mení vo veľmi rozsiahlych limitoch. Ľudský mozog je schopný filtrovať pokojnú reč z rušenia, ako je hluk automobilov prechádzajúcich po ulici, zahraničných konverzácií a hudby.

Pokiaľ ide o moderné systémy rozpoznávania reči, ich schopnosti v tejto oblasti nechajte veľa požadovať. Ak mikrofón stoja na stole, potom, keď je hlava otáčaná alebo zmení polohu tela, vzdialenosť medzi ústami a mikrofónom sa zmení. To povedie k zmene úrovne výstupného signálu mikrofónu, čo zase zhoršuje spoľahlivosť rozpoznávania reči.

Preto pri práci s systémami rozpoznávania reči budú dosiahnuté najlepšie výsledky, ak používate mikrofón pripojený k hlavam, ako je znázornené na obr. 2-1. Pri použití takéhoto mikrofónu bude vzdialenosť medzi ústami a mikrofónom trvalá.

Zaujímame tiež vašu pozornosť, že všetky experimenty s systémami rozpoznávania reči sú najlepšie hotové, zadržiavajú sa v tichej miestnosti. V tomto prípade bude účinok rušenia minimálny. Samozrejme, ak potrebujete vybrať systém rozpoznávania reči, ktorý je schopný pracovať v podmienkach silného rušenia, musia sa vykonať testy odlišne. Avšak, pokiaľ je to známe autorom knihy, zatiaľ čo dodržiavanie systémov rozpoznávania reči je stále veľmi, veľmi nízke.

Mikrofón funguje pre americkú konverziu zvukových oscilácie v kolísaní elektrický prúd. Tieto oscilácie je možné vidieť na obrazovke osciloskopu, ale nie ponáhľať do obchodu na nákup tohto drahého zariadenia. Všetok oscilografický výskum môžeme minúť pomocou bežného počítača vybaveného zvukovým adaptérom, ako je adaptér zvuku. Neskôr vám povieme, ako to urobiť.

Na obr. 2-2 Ukázali sme oscilogram zvukový signál, Získané, keď ste vyslovili dlhý zvuk a. Tento oscilogram bol získaný pomocou programu Goldwave, o ktorom stále hovoríme v tejto kapitole knihy, ako aj pomocou zvukovej blaster a audio audio mikrofónu, podobný tomu, ktorý je znázornený na obr. 2-1.

Obr. 2-2. Oscilogram zvukového signálu

Program Goldwave vám umožňuje natiahnuť oscillogram pozdĺž osi času, ktorý vám umožní vidieť najmenšie detaily. Na obr. 2-3 sme ukázali natiahnutý fragment zvukového oscilogramu uvedeného vyššie.

Obr. 2-3. Zvukový zvukový oscilogram fragment

Upozorňujeme, že veľkosť vstupného signálu prichádzajúceho z mikrofónu sa pravidelne líši a berie pozitívne aj záporné hodnoty.

Ak bola vo vstupnom signáli prítomná iba jedna frekvencia (to znamená, že ak bol zvuk "čistý"), forma signálu získaného z mikrofónu by bola sínusová. Ako sme však povedali, spektrum ľudských zvukových zvukov sa skladá zo súboru frekvencií, v dôsledku čoho je forma oscilogramu signálu reči ďaleko od sínusového.

Signál, ktorého hodnotové zmeny časom nepretržite, zavoláme analógový signál. Tento signál pochádza z mikrofónu. Na rozdiel od analógu je digitálny signál sada numerických hodnôt, ktoré sa líšia s časovým diskrétnym.

K počítaču môže spracovať pípnutie, musí byť preložené z analógovej formy do digitálneho, to znamená, že reprezentovať vo forme množiny číselných hodnôt. Tento proces sa nazýva digitalizácia analógového signálu.

Digitalizácia zvuku (a akéhokoľvek analógového) signálu sa vykonáva pomocou špeciálneho zariadenia aNALOG-to-DIGITAL CONVERTER ADC (analógový pre digitálny konvertor, ADC). Toto zariadenie je na doske audio adaptéra a je bežným mikroobvodom.

Ako funguje analog-to-digitálny konvertor?

Pravidelne meria úroveň vstupného signálu a poskytuje výstupnú numerickú hodnotu výsledku merania. Tento spôsob je znázornený na obr. 2-4. Tu sivé obdĺžniky označili vstupné hodnoty merané v určitom konštantnom časovom intervale. Súbor takýchto hodnôt a je digitalizované znázornenie vstupného analógového signálu.

Obr. 2-4. Meranie závislosti amplitúdy signálu z času

Na obr. 2-5 Ukázali sme pripojenie analógovo-digitálneho konvertora k mikrofónu. V tomto prípade vstupy X 1 slúži analógový signála digitálny signál sa odstráni z výstupov U 1 -U N.

Obr. 2-5. ANALOG-DIGITAL CONVERTER

Analógové digitálne konvertory sú charakterizované dvoma dôležitými parametrami - transformačnou frekvenciou a počtom kvantizačných úrovní vstupného signálu. Správny výber týchto parametrov je rozhodujúci pre dosiahnutie primeranej reprezentácie v digitálnej forme analógového signálu.

Ako často často potrebujete merať hodnotu amplitúdy vstupného analógového signálu, takže kvôli digitalizácii nie je stratené informácie o zmenách vo vstupnom analógovom signáli?

Zdá sa, že odpoveď je jednoduchá - vstupný signál musí byť meraný tak často, ako je to možné. Čím častejšie, častejšie sa analógovo-digitálny konvertor vykonáva takéto merania, tým lepšie sa sledujú najmenšie zmeny v amplitúde vstupného analógového signálu.

Avšak zbytočne časté merania môžu viesť k neoprávnenému rastu digitálneho dátového toku a zbytočných výpočtových počítačových zdrojov pri spracovaní signálu.

Našťastie, správna voľba Frekvenčná konverzia (vzorkovacia frekvencia) je dostatočne jednoduchá. Aby to urobilo, postačuje kontaktovať teorem Kotelnikov, ktorá je známa odborníkom v oblasti spracovania digitálneho signálu. Theorem uvádza, že frekvencia konverzie musí byť dvakrát vyššia ako maximálna frekvencia spektra transformovaného signálu. Preto pre digitalizáciu bez straty kvality zvukového signálu, ktorej frekvencia leží v rozsahu 16-20,000 Hz, musíte vybrať frekvenciu konverzie, nie menej ako 40 000 Hz.

Všimnite si však, že v profesionálnom zvukovom zariadení sa frekvencia konverzie zvolí niekoľkokrát zadanej hodnoty. To sa robí na dosiahnutie veľmi vysokej kvality digitalizovaného zvuku. Pre systémy rozpoznávania reči, táto kvalita nie je relevantná, takže vašu pozornosť nebudeme zaostriť.

A akú frekvenciu transformácie je potrebná na digitalizáciu zvuku ľudskej reči?

Keďže zvuky ľudskej reči leží vo frekvenčnom rozsahu 300-4000 Hz, minimálna potrebná frekvencia konverzie je 8000 Hz. Avšak, mnoho počítačové programy Rozpoznanie reči Použite štandard pre konvenčné audio audio. Frekvencia transformácie je 44 000 Hz. Na jednej strane táto frekvencia transformácie nevedie k nadmernému zvýšeniu toku digitálnych dát a druhá - poskytuje digitalizáciu reči s dostatočnou kvalitou.

Aj v škole sme učili, že s akýmikoľvek meraniami vznikajú chyby, z ktorých je nemožné zbaviť sa úplne. Takéto chyby sa vyskytujú v dôsledku obmedzeného riešenia meracích prístrojov, ako aj z dôvodu skutočnosti, že samotný proces merania môže vykonať niektoré zmeny nameranej hodnoty.

Analog-to-digitálny konvertor predstavuje vstupný analógový signál vo forme prúdu počtu obmedzených bitov. Konvenčné audio adaptéry obsahujú 16-bitové ADC bloky, ktoré môžu predstavovať amplitúdu vstupného signálu vo forme 216 \u003d 65536 rôznych hodnôt. Zariadenia ADC v špičkových zvukových zariadeniach môžu byť 20-bitové, čo poskytuje väčšiu presnosť amplitúdy audio signálu.

Moderné systémy a programy rozpoznávania reči boli vytvorené pre bežné počítače vybavené obvyklými zvukovými adaptérmi. Preto, na vykonávanie experimentov s rozpoznávaním reči, nebudete musieť získať profesionálny audio adaptér. Takýto adaptér ako zvukový blaster je celkom vhodný pre digitalizáciu reči, aby ste ju ďalej rozpoznali.

Spolu s užitočným signálom pre mikrofón, rôzne zvuky zvyčajne klesajú - hluk z ulice, hluk vetra, zahraničné rozhovory atď. Hluk má negatívny vplyv na kvalitu práce systémov rozpoznávania reči, takže sa s ním musí zaoberať. Jedným zo spôsobov, ako sme už spomenuli - dnešné systémy rozpoznávania reči najlepšie využívať v tichej miestnosti, zostávajú s počítačom na jednom.

Ideálne podmienky však môžu byť vytvorené vždy, takže musíte použiť ŠPECIÁLNE METÓDYUmožňuje vám zbaviť sa hluku. Aby sa znížili hladiny hluku, pri konštrukcii mikrofónov a špeciálnych filtrov sa používajú špeciálne triky, ktoré odstránia zo spektra analógového frekvenčného signálu, ktoré nenesie užitočné informácie. Okrem toho sa táto technika používa ako kompresia. dynamický rozsah Vstupné úrovne.

Povedzte o tom všetko v poriadku.

Frekvenčný filter Zariadenie, ktoré konvertuje frekvenčné spektrum analógového signálu, sa nazýva. V tomto prípade sa počas procesu transformačného procesu (alebo absorpcie) dochádza k osciláciám určitých frekvencií.

Toto zariadenie si dokážete predstaviť vo forme série čierneho boxu s jedným vstupom a jedným výstupom. Pokiaľ ide o našu situáciu, mikrofón bude pripojený k vstupu frekvenčného filtra a analóg-to-digitálny konvertor bude pripojený k výstupu.

Frekvenčné filtre sú odlišné:

· Nižšie frekvenčné filtre;

· Horné frekvenčné filtre;

· Pobytové filtre;

· Bashed pásové filtre.

Nižšie frekvenčné filtre (Low-Pass Filter) sa odstráni zo vstupného spektra všetky frekvencie, ktorých hodnoty sú pod určitou prahovou frekvenciou v závislosti od nastavenia filtra.

Vzhľadom k tomu, že zvukové signály ležia v rozsahu 16-20 000 Hz, môžu byť všetky frekvencie menšie ako 16 Hz odrezať bez zhoršenia kvality zvuku. Pre rozpoznávanie reči je dôležitý frekvenčný rozsah 300-4000 Hz, takže môžete rezať frekvencie pod 300 Hz. V tomto prípade bude všetky rušenie vyrezané zo vstupného signálu, ktorého frekvenčné spektrum, ktoré leží pod 300 Hz a nebudú zasahovať do procesu rozpoznávania reči.

Podobne horné frekvenčné filtre (High -pass filter) sú vyrezané z vstupného spektra všetky frekvencie nad určitú prahovú frekvenciu.

Osoba nepočuje zvuky s frekvenciou 20 000 Hz a vyššie, takže môžu byť vyrezané zo spektra bez výrazného zhoršenia kvality zvuku. Pokiaľ ide o rozpoznávanie reči, tu môžete znížiť všetky frekvencie nad 4000 Hz, čo povedie k výraznému zníženiu úrovne vysokofrekvenčného rušenia.

Prenosný pásikový filter (Pásikový filter) možno predstaviť ako kombináciu spodného a horného frekvenčného filtra. Takýto filter oneskoruje všetky frekvencie pod tzv. spodná frekvenciaako aj vyššie horná frekvenčná šírka pásma.

Pre systém rozpoznávania reči je teda vhodný filter šírky pásma, ktorý oneskoruje všetky frekvencie okrem frekvencií rozsahu 300-4000 Hz.

Pokiaľ ide o filtre pásu zapaľovania (pásik -STOP filter), umožňujú vám vyrezať vstupné spektrum všetky frekvencie ležiace v určenom rozsahu. Takýto filter je vhodný napríklad na potláčanie hluku, ktorý zaberá pevnú časť spektra signálu.

Na obr. 2-6 Ukázali sme pripojenie filtra šírky pásma.

Obr. 2-6. Filtrovanie zvukového signálu pred digitalizáciou

Treba povedať, že obvyklé zvukové adaptéry inštalované v počítači sú v ich zložení pásu filtra, cez ktorý analógový signál prechádza pred digitalizáciou. Šírka pásma takéhoto filtra zvyčajne zodpovedá rozsahu zvukových signálov, konkrétne 16-20,000 Hz (v rôznych audio adaptéroch, hodnoty hornej a dolnej frekvencie sa môžu líšiť v malých limitoch).

A ako dosiahnuť užšiu šírku pásma 300-4000 Hz, čo zodpovedá najinmatívnejšej časti ľudského spektrálneho spektra?

Samozrejme, ak máte tendenciu navrhnúť rádioelektronické zariadenia, môžete vytvoriť filter z mikroobvodu operačného zosilňovača, rezistorov a kondenzátorov. Približne prví tvorcovia systémov rozpoznávania reči.

ale priemyselné systémy Rozpoznávanie reči musí byť funkčné na štandardnom počítačovom hardvéri, takže cesta výroby špeciálneho pásového filtra tu nie je vhodná.

Namiesto toho sa tzv používa v moderných systémoch spracovania reči digitálne frekvenčné filtreimplementované programovo. Stalo sa to po cPU Počítač je dostatočne silný.

Digitálny frekvenčný filter implementovaný softvér premieňa vstupný digitálny signál do výstupného digitálneho signálu. V procese konverzie program spracováva špeciálny prúd signálu luminiscencie amplitúdy signálu pochádzajúceho z analógovo-digitálneho konvertora. Výsledkom konverzie bude aj počet čísel, avšak toto vlákno bude zodpovedať už filtrovanému signálu.

Hovoriť o analógovo-digitálnom konvertore, zaznamenali sme také dôležitou charakteristikouako počet úrovní kvantizácie. Ak je v audio adaptéri nainštalovaný 16-bitový analóg-to-digitálny konvertor, potom po digitalizácii sú hladiny zvuku predstavované ako 216 \u003d 65536 rôzne hodnoty.

Ak je niekoľko úrovní kvantizácie, potom tzv cheat hluk. Aby sa zmenšil tento hluk, vo vysoko kvalitných systémoch zvukovej digitalizácie by sa mali analógovo digitálne konvertory aplikovať s maximálnym dostupným počtom úrovní kvantovania.

Existuje však ďalší príjem, ktorý vám umožní znížiť účinok kvantitačného hluku na kvalitu zvukového signálu, ktorý sa používa v systémoch na nahrávanie digitálnych zvukov. Pri použití tejto príjmu pred digitalizáciou sa signál prechádza cez nelineárny zosilňovač, podčiarknuté signály s malou amplitúdenou signálu. Takéto zariadenie zvyšuje slabé signály silnejšie ako silné.

To je ilustrované grafom závislosti amplitúdy výstupného signálu z amplitúdy vstupného signálu znázorneného na obr. 2-7.

Obr. 2-7. Nelineárna amplifikácia pred digitalizáciou

Na reverznej konverzii fáze digitalizovaného zvuku do analógu (tento krok v tejto kapitole považujeme za zobrazenie zvukového stĺpca, analógový signál sa opäť prechádza cez nelineárny zosilňovač. Tentokrát sa použije ďalší zosilňovač, ktorý zdôrazňuje signály s veľkou amplitúdenou a má prenosovú charakteristiku (závislosť amplitúdy výstupného signálu z amplitúdy vstupného signálu), inverzný, ktorý sa použil počas digitalizácie.

Ako to všetko môže pomôcť tvorcom system rozpoznávania reči?

Osoba, ako je známa, je celkom dobre uznaná rečou vysloveným tichým šepotom alebo pomerne hlasným hlasom. Dá sa povedať, že dynamický rozsah úrovní hlasitosti úspešne uznaného prejavu pre osobu je pomerne široký.

Dnešný počítačové systémy Rozpoznávanie reči, bohužiaľ, kým sa neboja. Avšak, s cieľom určitej expanzie určeného dynamického rozsahu pred digitalizáciou, môžete preskočiť signál z mikrofónu cez nelineárny zosilňovač, z ktorých je znázornená na obr. 2-7. To zníži hladinu hluku kvantizácie počas digitalizácie slabých signálov.

Vývojári systémov rozpoznávania reči sú opäť nútené zamerať sa predovšetkým na sériovo vyrábané zvukové adaptéry. Neposkytujú vyššie uvedenú nelineárnu konverziu signálu.

Môžete však vytvoriť softvérový ekvivalent nelineárny zosilňovač, ktorý prevádza digitalizovaný signál pred odoslaním do modulu rozpoznávania reči. A hoci takýto programový zosilňovač nebude schopný znížiť hluk kvantizácie, je možné zdôrazniť tie úrovne signálu, ktoré nesú najväčšie informácie o reči. Môžete napríklad znížiť amplitúdu slabých signálov, pričom eliminuje signál z hluku.

© 2014 Site

Alebo fotografická zemepisná šírka Fotografický materiál je vzťah medzi maximálnymi a minimálnymi hodnotami expozície, ktoré môžu byť správne zachytené na obrázku. S odkazom na digitálnu fotografiu je dynamický rozsah skutočne rovnocenný s pomerom maximálnych a minimálnych možných hodnôt užitočného elektrického signálu generovaného fotografickým seopesorom počas expozície.

Dynamický rozsah sa meria v krokoch expozície (). Každý krok zodpovedá zdvojnásobeniu množstva svetla. Napríklad, ak má určitá kamera dynamický rozsah 8 EV, znamená to, že maximálna možná hodnota užitočného signálu jeho matrice označuje minimálne 2 8: 1, čo znamená, že kamera je schopná zachytiť v rámci jedného Objemové objekty sa líšia v jasnosti najviac 256-krát. Presnejšie, môže to zachytiť objekty s ľubovoľným jasom, ale objektmi, ktorých jas bude prekročiť maximum prípustná hodnota Poďme sa dostať na obrázok oslnivého bielej a objektov, ktorých jas bude pod minimálnou hodnotou - uhlie čierna. Podrobnosti a textúry budú odlíšiteľné len na týchto predmetoch, ktorých jas je naskladaný v dynamickom rozsahu komory.

Ak chcete opísať vzťah medzi jasom najjasnejších a najmodernejších z odnímateľných objektov, nie sú celkom správne termín "dynamický scénický rozsah". Bude to správnejšie hovoriť o rozsahu jasu alebo na úrovni kontrastu, pretože dynamický rozsah je zvyčajne charakteristika meracieho zariadenia (v tento prípad, Matrice digitálnych fotoaparátov).

Bohužiaľ, rozsah jasu mnohých krásnych scén, s ktorými sme čelia skutočný životmôže znateľne prekročiť dynamický rozsah digitálneho fotoaparátu. V takýchto prípadoch je fotograf nútený rozhodnúť, ktoré objekty by sa mali vypracovať vo všetkých častiach, a ktorý z nich môže byť ponechaný mimo dynamického rozsahu bez toho, aby bol dotknutý kreatívny dizajn. Aby sa čo najefektívnejšie využili dynamický rozsah fotoaparátu, niekedy to môže trvať toľko dôkladného pochopenia princípu práce fotosenzora, koľko vyvinutá umelecká.

Faktory dynamického rozsahu

Dolná hranica dynamického rozsahu je nastavená na úrovni vlastného hluku fotografie Seensora. Dokonca aj nevestná matica generuje elektrický signál pozadia, nazývaný tmavý hluk. Aj rušenie nastane, keď sa nabíjanie prenesie na analóg-to-digitálny konvertor a samotný ADC predstavuje určitú chybu v digitalizovanom signáli - tzv. Odber vzoriek hluku.

Ak podniknete obrázok v úplnej tme alebo s vekom na šošovke, potom fotoaparát zaznamená len tento nezmyselný hluk. Ak povolíte, aby sa minimálny počet svetla dostal na senzor, fotodódy začne hromadiť elektrický náboj. Hodnota nábytok, čo znamená intenzitu priaznivého signálu, bude úmerná počtu zachytených fotónov. Aby ste na snímku, aspoň niektoré zmysluplné detaily, je potrebné, aby úroveň užitočného signálu presahovala hladinu šumu pozadia.

Tak, dolná hranica dynamického rozsahu alebo inými slovami, hranica citlivosti snímača formálne môže byť definovaná ako výstupná hladina signálu, pri ktorej je pomer signálu k šumu väčší ako jednotka.

Horná hranica dynamického rozsahu je určená kontajnerom samostatnej fotodiódy. Ak sa počas expozície akákoľvek fotodióda hromadí elektrický náboj limitných hodnôt pre seba, potom je pixel obrazu zodpovedajúci preťaženému fotodidu, absolútne biely a ďalšie ožarovanie neovplyvní jeho jasu. Tento fenomén sa nazýva orezávanie. Čím vyššia je frenetická schopnosť fotodiódy, tým väčšia je signál schopný podávať na výstupe pred dosiahnutím nasýtenia.

Pre väčšiu jasnosť sa obrátime na charakteristickú krivku, ktorá je grafom závislosti od výstupného signálu od expozície. Na horizontálnej osi sa binárny logaritmus ožarovania získaný senzorom odloží a na vertikálnom binárnom logaritme rozsahu elektrického signálu generovaného senzorom v reakcii na toto ožarovanie. Môj výkres je do značnej miery podmienený a sleduje výnimočne ilustratívne účely. Charakteristická krivka súčasnej fotografie Seensor má o niečo zložitejšiu formu a hladina hluku je zriedka ako vysoká.

Graf je zreteľne viditeľný dva kritické tuhé body: V prvom z nich je úroveň užitočného signálu prekročí hranicu hluku, a v druhej - fotodódy dosiahnu sýtosť. Hodnoty expozície ležiace medzi týmito dvoma bodkami sú dynamický rozsah. V tomto abstraktnom príklade sa rovná, aké ľahké je si všimnúť, 5 EV, t.j. Fotoaparát je schopný stráviť päť zdvojnásobení expozície, ktorá je ekvivalentná 32X (2 5 \u003d 32) v rozdiele jasu.

Expozičné zóny, ktoré tvoria dynamický rozsah, sú nerovné. Horné zóny sú charakterizované vyšším pomerom signálu k šumu, a preto vyzerajú jasnejšie a podrobnejšie ako nižšie. Výsledkom je, že horná hranica dynamického rozsahu je veľmi reálna a viditeľná - orezanie je zabalené svetlá pri najmenšej nadmernej expozícii, zatiaľ čo spodná hranica je čoraz viac potopená v hluku a prechod na čiernu farbu je ďaleko od taktu.

Lineárna závislosť signálu z expozície, ako aj ostrého výťažku na plošinu, sú jedinečné vlastnosti digitálneho fotografického procesu. Pre porovnanie sa pozrite na podmienenú charakteristickú krivku tradičnej fotoplinky.

Tvar krivky a najmä uhol sklonu výrazne závisí od typu filmu az postupu jej prejavu, ale hlavnou vecou, \u200b\u200bktorá zostáva rozdiel medzi filmovým harmonogramom z digitálnej - nelineárny charakter závislosti Optická hustota filmu z hodnoty expozície zostáva nezmenená.

Dolná hranica fotografickej zemepisnej šírky negatívneho filmu je určená hustotou závoja a horná - maximálna dosiahnuteľná optická hustota fotoklór; Otočiť filmy - naopak. Obaja v tieni, ako aj vo svetlách sú hladké ohyby charakteristickej krivky, čo svedčí o kvapke, keď sa približujú k hranici dynamického rozsahu, pretože uhol sklonu krivky je úmerný kontrastu obrazu. Expozičné zóny ležiace na strednej časti harmonogramu majú teda maximálny kontrast, zatiaľ čo vo svetlách a tieňoch sa kontrast znižuje. V praxi je rozdiel medzi filmom a digitálnou maticou obzvlášť dobre viditeľný vo svetlách: kde je v digitálnom obraze svetla spálený s orezaním, časti na fóliu sú stále rozlíšiteľné, aj keď nízke kontrast, a Prechod na čistú bielu farbu vyzerá hladko a prirodzene.

V Sensitometrii sa používajú aj dva nezávislé termíny: Vlastne fotografická zemepisná šírkaohraničené relatívne lineárnou časťou charakteristickej krivky a užitočná fotografická zemepisná šírka, Okrem lineárnej časti, tiež základnej a ramennej grafiky.

Je pozoruhodné, že pri spracovaní digitálnych fotografií, to spravidla aplikuje viac alebo menej výraznú krivku v tvare S, ktorá zvyšuje kontrast v poltone za náklady na jeho zníženie tieňov a svetiel, čo dáva digitálny obraz Prírodný a príjemný pohľad oka.

Veľkoleposť

Na rozdiel od matrice digitálneho fotoaparátu je ľudská vízia zvláštna, povedzme, logaritmický pohľad na svet. Sekvenčné zdvojnásobenie množstva svetla je vnímané ako rovnaké zmeny v jasnosti. Ľahké čísla sa môžu dokonca porovnať s hudobnými oktávmi, pretože dvojnásobné zmeny zvukovej frekvencie sú vnímané povesti ako jeden hudobný interval. Tento princíp zamestnáva iné zmysly. Nekvalita vnímania je veľmi rozširujúca sa rozsah citlivosti ľudí k stimulu rôznych intenzity.

Pri konverzii surového súboru (nezáleží na tom, že nástroje na kameru alebo v surovom meniči) obsahujúce lineárne údaje sa na ňu automaticky vzťahuje takto tzv. Gamma krivka, ktorá je navrhnutá tak, aby nelineárne zvýšila jas digitálneho obrazu, čo ju vedie v súlade so zvláštnymi ľudskými víziami.

S lineárnou konverziou sa obraz dostanete príliš tmavý.

Po korekcii gama sa jasu prichádza do normálu.

Gamma krivka, ako by sa roztiahla tmavé tóny a stlačí svetlo, čím sa distribúcia odstupňovania uniforme. V dôsledku toho obraz získava prirodzený vzhľad, ale hluk a artefakty odberu vzoriek v tieni nevyhnutne stávajú výraznejšími, čo je len zhoršené malým počtom úrovní jasu v dolných zónach.

Lineárne rozdelenie gradácie jasu.
Jednotná distribúcia po použití gama krivky.

ISO a dynamický rozsah

Napriek tomu, že v digitálnej fotografii sa používa rovnaká koncepcia fotosenzitivity fotografického materiálu ako na fotografii filmu, je potrebné chápať, že ide len o tradícii tradície, pretože prístupy k zmene fotosenzitivity v digitálnom a filmová fotografia sa v zásade líši.

Zlepšenie citlivosti ISO v tradičnej fotografii znamená nahradenie jedného filmu inému s väčším zrnom, t.j. Existuje objektívna zmena vlastností fotografického materiálu. V digitálnom fotoaparáte je citlivosť senzora ukladá svojimi fyzikálnymi vlastnosťami a nemôže byť zmenený doslova. So zvýšením ISO sa fotoaparát nezmení skutočnú citlivosť snímača, ale len zvyšuje elektrický signál generovaný senzorom v reakcii na ožarovanie a správne nastaví algoritmus digitalizácie pre tento signál.

Dôležitým dôsledkom tohto je znížiť účinný dynamický rozsah v pomere k zvýšeniu ISO, pretože s užitočným signálom je zvýšený hluk. Ak ISO 100 digitalizuje celú škálu hodnôt signálu - od nuly do bodu nasýtenia, potom s ISO 200, len polovica kapacity fotodiód je akceptovaná na maximum. S každým zdvojením citlivosti ISO je horný stupeň dynamického rozsahu odrezaný a zostávajúce kroky sú utiahnuté na jeho miesto. Preto je použitie ultra-vysokých hodnôt ISO zbavené praktického významu. S tým istým úspechom môžete fotografiu odľahčiť v surovom meniči a získať porovnateľnú úroveň hluku. Rozdiel medzi zvýšením ISO a umelým osvetlením obrazu je, že so zvyšujúcim sa ISO, posilňovanie signálu dochádza skôr, ako sa prijíma v ADC, a preto sa hluk kvantizácie nezvyšuje, na rozdiel od vlastného hluku snímača, Kým v surovom konverzátore, amplifikácia podlieha zahrnutiu chýb ADC. Okrem toho pokles digitalizácie rozsah znamená presnejší odber vzoriek zostávajúcich vstupných hodnôt.

Mimochodom, ISO je k dispozícii na niektorých zariadeniach pod základnou hodnotou (napríklad na ISO 50), nerozširuje dynamický rozsah a jednoducho uvoľňuje signál dvakrát, čo sa rovná snímku v surovom meniči. Táto funkcia môže byť dokonca ošetrená ako škodlivá, pretože použitie podávacej hodnoty ISO, vyvoláva komoru na zvýšenie expozície, že so zostávajúcou nezmenenou prahovou hodnotou snímača zvyšuje riziko získania orezania svetiel.

Skutočný dynamický rozsah

Existuje množstvo programov, ako sú (DXO Analyzer, Imatest, RawDigger atď.) Dovoľte vám merať dynamický rozsah digitálneho fotoaparátu doma. V zásade to nie je veľká potreba, pretože údaje pre väčšinu kamier môžu byť voľne nájdené na internete, napríklad na webovej stránke DXOMARK.com.

Mal by som sa domnievať výsledky takýchto testov? Celkom. S jedinou rezerváciou, že všetky tieto testy sú definované alebo, ak ho môžete vyjadriť, technický dynamický rozsah, t.j. Vzťah medzi úrovňou nasýtenia a hladinou hluku matrice. Pre fotograf je užitočný dynamický rozsah primárne dôležitý, t.j. Počet expozičných zón, ktoré vám skutočne umožňujú zachytiť niektoré užitočné informácie.

Ako si pamätáte, prah dynamického rozsahu je špecifikovaná hladinou hluku fotografií Seensor. Problém je v tom, že v praxi, že dolné zóny formálne prichádzajúce v dynamickom rozsahu, obsahuje všetko príliš veľa hluku, aby mohli byť použité na použitie. Tu je veľa závisí od individuálneho stláčania - prijateľnej úrovne hluku, z ktorých každý určuje pre seba.

Mojím subjektívnym názorom je, že detaily v tieni začínajú vyzerať viac alebo menej slušne s pomerom signálu / hluku aspoň osem. Na tomto základe určujem pre seba užitočný dynamický rozsah, ako technický dynamický rozsah mínus asi tri kroky.

Napríklad, ak má zrkadlová komora podľa výsledkov spoľahlivých testov dynamický rozsah 13 EV, ktorý je veľmi dobrý pre dnešné normy, potom jeho užitočný dynamický rozsah bude asi 10 eV, ktorý je vo všeobecnosti tiež veľmi dôkladný . Samozrejme, hovoríme o streľbe v surovom, s minimálnym ISO a maximálnym bitom. Pri snímaní v JPEG, dynamický rozsah závisí dôrazne na nastaveniach kontrastu, ale v priemere by sa mali zlikvidovať dva alebo tri kroky.

Pre porovnanie: farebné fotografie fotografie majú užitočnú fotografickú zemepisnú šírku 5-6 krokov; Čierne a biele záporné filmy dávajú 9-10 krokov so štandardným manifestom a tlačovými postupmi a s určitými manipuláciami - až 16-18 krokov.

Zhrnutie vyššie uvedeného, \u200b\u200bpokúsime sa formulovať niekoľko jednoduchých pravidiel, ktoré vám pomôžu vytlačiť z senzora vášho maximálneho výkonu fotoaparátu:

  • Dynamický rozsah digitálneho fotoaparátu je plne prístupný len pri snímaní v surovom stave.
  • Dynamický rozsah sa znižuje so zvyšujúcou sa citlivosťou na ľahkú váhu, a preto sa vyhýbajú vysokým hodnotám ISO, ak neexistuje ostrá nevyhnutnosť.
  • Použitie vyššieho vypúšťania na surové súbory nezvyšuje skutočný dynamický rozsah, ale zlepšuje tonálnu separáciu v tieni kvôli viac Úrovne jasu.
  • Vystavenie doprava. Zóny hornej expozície vždy obsahujú maximum užitočná informácia S minimálnym hlukom a mal by sa používať najúčinnejšie. Zároveň by ste nemali zabudnúť na nebezpečenstvo orezania - pixelov, ktoré dosiahli nasýtenie, sú absolútne k ničomu.

A hlavná vec: Nie je potrebné sa obávať dynamického rozsahu fotoaparátu. S dynamickým rozsahom je v poriadku. Vaša schopnosť vidieť svetlo a kompetentne riadiť expozíciu je oveľa dôležitejšia. Dobrý fotograf sa nebude sťažovať na nedostatok fotografickej zemepisnej šírky, ale bude sa snažiť čakať na pohodlnejšie osvetlenie, alebo zmení uhol, alebo bude používať blesk, v Slovo, bude konať v súlade s okolnosťami. Poviem vám viac: Niektoré scény vyhrali len kvôli tomu, že sa nezhodujú do dynamického rozsahu fotoaparátu. Často je zbytočná hojnosť častí jednoducho potrebná na skrytie do poloperatenej čiernej siluety, ktorá robí fotografiu v rovnakom čase stručne a bohatšia.

Vysoký kontrast nie je vždy zlý - musíte s ním schopní pracovať. Naučte sa využívať nevýhody zariadení, ako aj jeho výhody, a budete prekvapení, koľko sa vaše kreatívne príležitosti rozšíri.

Ďakujem za pozornosť!

Vasily A.

Post scriptum

Ak bol článok užitočný a informatívny pre vás, môžete tento projekt podporovať a prispievať svojmu rozvoju. Ak ste sa vám nepáčili, ale máte myšlienky, ako to urobiť lepšie, vaša kritika bude akceptovaná bez menej vďačnosti.

Nezabudnite, že tento článok je predmetom autorského práva. Prepätie a citácia je povolená, ak existuje existujúci odkaz na pôvodný zdroj a použitý text by nemal byť vybratý alebo modifikovaný.

Ľudia, ktorí sú nadšení s domácim zvukom demonštrujú zaujímavý paradox. Sú pripravení strkať počúvať miestnosť, vybudovať stĺpy s exotickými žiaričemi, ale sú v rozpakoch pred hudobným konzervovaním, ako keby bol vlk pred červenou vlajkou. A v skutočnosti, prečo nie je možné, aby sa začiarkavacie políčko sa dostal von, a z konzervy sa snažia variť niečo viac jedlejšie?

Pravidelne existujú sťažnosti na fóre: "Odporúčame dobre zaznamenané albumy". Je to pochopiteľné. Špeciálne audiofilné edície, hoci potešia vypočutie prvej minúty, ale nikto nepočúva koniec, bol to bolí repertoár. Ako pre zvyšok Phonotheka sa zdá byť zrejmé. Môžete uložiť, ale nemôžete uložiť a vyprázdniť bzučanie peňazí do komponentov. Stále nemám rád počúvať svoju obľúbenú hudbu na vysokej hlasitosti a možnosti zosilňovača tu.

Dnes, dokonca aj v albumoch Hi-Res, vrcholy zvuku zvuku a objem poháňaných do orezania. Predpokladá sa, že väčšina počúva hudbu na každej junke, a preto je potrebné "opýtať sa GAT", aby urobil druh oddanosti.


Samozrejme, to sa nerobí konkrétne na rozrušenie audiofilov. O nich všeobecne málo ľudí. No, okrem toho, že uhádli, aby umožnili hlavné súbory, s ktorými je hlavná cirkulácia kopírovaná - CD, MP3, a tak ďalej. Samozrejme, že sprievodca je sploštený kompresorom, nikto nebude vedome pripraviť špeciálne verzie pre HD stopy. Je to určitý postup pre vinylového nosiča, ktorý z tohto dôvodu a znie viac ľudí. A pre digitálnu cestu, všetko končí rovnaký - veľký hrubý kompresor.

Takže v súčasnosti všetky 100% publikovaných zvukových záznamov, mínus klasickej hudby, je vystavená kompresii pri koncovke. Niekto tento postup vykonáva viac či menej šikovne, a niekto je úplne v hlúpe. V dôsledku toho máme pútnikov na fórach s radom DR plugin pre sínus, bolestivé porovnania publikácií, uniknúť do Vinylu, kde potrebujete aj hlavný popper.

Najviac mrazito pri pohľade všetkých týchto pohanov sa doslova v audio topánkach. Žiadny vtip, čítali zvukový zdroj Svätý písmo dozadu! Moderné programy na úpravu zvuku majú nejaký nástroj na reštaurovanie zvuková vlnaOrezané.

Spočiatku bola táto funkcia určená na štúdiá. Keď sa zmieša, existujú situácie, keď sa prišlo k zápisu, a už nie je možné remieťať reláciu z viacerých dôvodov, a tu prichádza na pomoc ARSENAL AUDIOTION AUDIOSTI - DECALIPPER, Dekompresor, atď.

A už pre takýto softvér, všetko odvážnejší ťahá rukoväte obyčajných poslucháčov, ktorí majú krv z uší po ďalšej novinke. Niekto preferuje Izotop, niekto Adobe Audition, niekto operácie zdieľa medzi niekoľkými programami. Význam obnovenia bývalej dynamiky je správne opraviť vrcholové špičky signálu, ktoré spočívajú v 0 dB, pripomínajú zariadenie.

Áno, asi 100% oživenie zdroja reči nejde, pretože procesy interpolácie na pomerne špekulatívnych algoritmov. Ale stále, niektoré z výsledkov spracovania mi vyzerali zaujímavé a hodné štúdia.

Napríklad album lana del Rey "Lust pre život", dôsledne zamračený, Pah, Jazda! V pôvodnej pieseň "Keď bol svet vo vojne, nechal sme tancovať" Boli to takto.


A po sérii dekódov a dekompresorov sa to stalo takto. Koeficient DR sa zmenil z 5 na 9. Stiahnutie a počúvajte vzorku pred a po spracovaní.


Nemôžem povedať, že metóda je univerzálna a je vhodná pre všetky nasadené albumy, ale v tomto prípade som uprednostňoval zachovať v zbierke presne túto možnosť liečenú s aktivistom Rutraker namiesto oficiálnej publikácie v 24 bitoch.

Aj keď umelé ťahanie vrcholov zo zvuku mleté \u200b\u200bnie je vracia skutočnú dynamiku hudobného výkonu, váš DAC bude stále poďakovať. Bolo to pre neho tak ťažké pracovať bez chýb na limitných úrovniach, kde je veľká pravdepodobnosť tzv. Intersmonických vrchov (ISP). A teraz až do 0 dB bude len zriedkavé spoors signálu. Okrem toho, spustený zvukový záznam pri stlačení v FLAC alebo inom bezstratku kodek bude teraz menší. Viac "Air" v signáli šetrí priestor na pevný disk.

Snažte sa oživiť svoje najnáročnejšie albumy zabité na "objemovej vojne". Pre rezervu reproduktora musíte najprv znížiť úroveň skladby na -6 dB a potom spustite delenie. Tí, ktorí neveria, počítače sa môžu jednoducho držať medzi CD prehrávačom a zosilňovačom Studio Expander. Toto zariadenie V podstate sa vykonáva rovnakým spôsobom - pretože môže obnoviť a vytiahnuť vrcholy komprimované cez dynamiku audio signálu. Existujú podobné zariadenia od 80-90s, nehovorí, že sú veľmi drahé, a ako experiment, skúste ich veľmi zaujímavé.


Radič dynamického rozsahu DBX 3BX spracováva signál samostatne v troch pruhoch - LF, SC a RF

Akonáhle boli vyrovnávacie prostriedky pre samozrejmosť z audio systému, a nikto ich nebál. Dnes nie je potrebné vyrovnať vysoké frekvencie magnetickej pásky, ale so škaredou dynamikou je potrebné niečo vyriešiť, bratia.

Dynamická kompresia (Dynamická kompresia rozsahu, DRC) je zúženie (alebo expanzia v prípade expandéra) dynamického rozsahu zvukového záznamu. Dynamický rozsahToto je rozdiel medzi najkvalitnejším a najhlasnejším zvukom. Niekedy je najjemnejšia vo fonograme zvuk trochu hlasnej úrovne hluku, a niekedy trochu tichšie najviac nahlas. Hardvérové \u200b\u200bzariadenia a programy vykonávajúce dynamickú kompresiu sa nazývajú kompresory, zvýrazňujúc štyri hlavné skupiny: kompresory, obmedzovač, expandéry a brány.

Analógový kompresor DBX 566

Znížená a podpora kompresie

Zníženie kompresie (Kompresia smerom nadol) Znižuje hlasitosť zvuku, keď začne prekročiť určitú prahovú hodnotu, zanedbajú sa nezmenené tichšie. Extrémna možnosť nižšej kompresie je obmedzovač. Vylepšená kompresia (Kompresia smerom nahor), naopak, zvyšuje objem zvuku, ak je pod prahom, bez toho, aby sa ovplyvnilo viac hlasné zvuky. Súčasne, obidva typy kompresie úzke dynamický rozsah zvukového signálu.

Zníženie kompresie

Vylepšená kompresia

Expandér a brána

Ak kompresor znižuje dynamický rozsah, expandér ho zvyšuje. Keď sa úroveň signálu stane nad prahovou úrovňou, expandér ho zvyšuje ešte viac, čím sa zvyšuje rozdiel medzi hlasnými a tichými zvukmi. Takéto zariadenia sa často používajú pri nahrávaní inštalácie bubna na oddelenie zvukov niektorých bubnov od iných.

Typ expandéra, ktorý sa nepoužíva, aby nezvyšoval hlasný, a vyschnúť tiché zvuky, ktoré nepresahujú hladinu prahovej hodnoty (napríklad hluk pozadia), sa nazýva Šumu.. V takomto zariadení, akonáhle sa hladina zvuku stane nižšou ako prahová hodnota, signálový priechod sa zastaví. Typicky sa brána používa na potláčanie hluku v pauzach. Na niektorých modeloch môže byť vykonané tak, že zvuk, keď sa prahová úroveň nezastavuje ostro, ale postupne sa potuluje. V tomto prípade je rýchlosť zostroja nastavená regulátorom rozpadu (recesia).

Brána, podobne ako iné typy kompresorov, možno frekvenčný závislý (t.j. rôznymi spôsobmi spracovania určitých frekvenčných pásiem) a môže pracovať v režime bočný reťazec. (Pozri nižšie).

Princíp prevádzky kompresora

Signál padajúci do kompresora je rozdelený na dve kópie. Jedna kópia sa odosiela do zosilňovača, v ktorom je stupeň zosilnenia riadený externým signálom, druhá kópia - tvorí tento signál. Vstúpi do zariadenia nazývaného bočného reťazca, kde sa meria signál, a obálka sa vytvára na základe týchto údajov popisujúcich zmenu v jeho objeme.
Takže najmodernejšie kompresory sú usporiadané, toto je tzv. Typ spätného dopredu. V starších zariadeniach (typ spätnej väzby) sa úroveň signálu meria po zosilňovači.

Existujú rôzne analógové kontrolné technológie (amplifikácia premenlivého zisku), každý s jeho výhodami a nevýhodami: lampy, optické pomocou fotoreresskej a tranzistu. Pri práci s digitálnym zvukom (v zvukovom editore alebo dave) sa môžu použiť ich vlastné matematické algoritmy alebo môže byť zadaná prevádzka analógovej technológie.

Hlavné parametre kompresorov

Prah.

Kompresor znižuje audio signál, ak je jeho amplitúda primárnami špecifická prahová hodnota (prahová hodnota). Zvyčajne je uvedené v decibeloch, pričom nižšia prahová hodnota (napríklad -60 dB) znamená, že zvuk bude spracovaný ako s vyššou prahovou hodnotou (napríklad -5 dB).

Pomeru.

Stupeň zníženia úrovne je určený parametrom pomeru: Pomer 4: 1 znamená, že ak je vstupná hladina 4 dB prekročiť prahovú hodnotu, výstupná úroveň bude vyššia ako prahová hodnota 1 dB.
Napríklad:
Prahová hodnota \u003d -10 dB
Vstupný signál \u003d -6 dB (na 4 dB nad prahom)
Výstupný signál \u003d -9 dB (na 1 dB nad prahom)

Je dôležité mať na pamäti, že potlačenie úrovne signálu pokračuje a určitý čas po spadne pod prahovú úroveň, a tentoraz je určený podľa hodnoty parametra vydanie.

Kompresia s maximálnou hodnotou pomeru ∞: 1 sa nazýva obmedzujúce. To znamená, že akýkoľvek signál nad úrovňou prahovej hodnoty je potlačený pred prahovou hodnotou (s výnimkou krátkeho obdobia po prudkom zvýšení vstupného objemu). Podrobnosti nájdete v časti "Obmedzovač".

Príklady rôznych hodnôt pomeru

Útoku a uvoľnenie

Kompresor poskytuje určitú kontrolu nad tým, ako rýchlo reaguje na zmenu dynamiky signálu. Parameter útoku definuje čas, na ktorý kompresor znižuje koeficient zisku na úroveň, ktorá je určená parametrom pomeru. Uvoľnenie definuje čas, počas ktorého kompresor, naopak, zvyšuje koeficient zisku, alebo sa vracia do normálu, ak úroveň vstupného signálu klesne pod prahovú hodnotu.

Fázy útoku a uvoľnenia

Tieto parametre ukazujú čas (zvyčajne v milisekundách), ktorý bude vyžadovaný na zmenu posilnenia na určité množstvo decibel, je zvyčajne 10 dB. Napríklad v tomto prípade, ak je útok nastavený na 1 ms, aby sa znížil zisk o 10 dB, bude potrebná 1 ms a 20 dB - 2 ms.

V mnohých kompresoroch môžu byť parametre útoku a uvoľňovania nakonfigurované, ale v niektorých sú pôvodne nastavené a nie sú regulované. Niekedy sú označené ako "AUTOMATICKÝ" ALEBO "PROGRAMOVANÝ", t.j. v závislosti od vstupného signálu.

Koleno.

Ďalší parameter kompresora: tvrdé / mäkké koleno. Určuje, či je začiatok aplikácie kompresie ostrý (tvrdý) alebo postupný (mäkký). Mäkké koleno znižuje spúšťanie prechodu zo surového signálu na signál podrobený kompresiu, najmä pri vysokých pomeroch a prudký zvyšuje objem.

Tvrdé koleno a mäkká kompresia kolena

Vrchol a rms.

Kompresor môže reagovať na maximálne hodnoty (krátkodobé maximum) alebo na priemernej úrovni vstupu. Použitie maximálnych hodnôt môže viesť k prudkým výkyvom v stupni kompresie a dokonca aj na skreslenie. Preto kompresory aplikujú v priemere funkcie (zvyčajne to je RMS) vstupný signál pri jej porovnaní s prahovou hodnotou. Poskytuje pohodlnejšiu kompresiu, v blízkosti ľudského vnímania objemu.

RMS je parameter, ktorý odráža priemerný objem fonogramu. Z matematického hľadiska je RMS (root stredný námestie) je hodnota RMS amplitúdy určitého počtu vzoriek:

Stereo spájanie.

Kompresor v režime stereo prepojenia aplikuje rovnaký zisk na obe stereo kanály. Tým sa vyhne posunutiu stereopanoramy, čo môže byť výsledkom individuálneho spracovania ľavého a pravého kanála. Takéto posunutie nastane, ak napríklad žiadny hlasný prvok nepály v strede.

Zisk make-upu.

Keďže kompresor znižuje celkovú úroveň signálu, je zvyčajne pridané možnosť pevného zisku na výstupu, čo vám umožňuje získať optimálnu úroveň.

POZERAŤ SA DOPREDU.

Funkcia vyhľadávania je určená na riešenie problémov zvláštnych príliš veľkých a príliš malých hodnôt útok a uvoľnenie. Príliš veľa útokov vám nedovoľujú efektívne zachytiť prechody, ale príliš malé nemusí byť pohodlné pre poslucháča. Pri použití funkcie vyhľadávania je hlavný signál oneskorený vzhľadom na regulátor, umožňuje spustiť kompresiu vopred, ešte predtým, ako signál dosiahne prahovú hodnotu.
Jedinou nevýhodou tejto metódy je časové oneskorenie signálu, ktoré v niektorých prípadoch nežiaduce.

Použitie dynamickej kompresie

Kompresia sa používa všade, nielen v hudobných zvukových záznamoch, ale aj všade, kde potrebujete zvýšiť celkový objem, bez zvýšenia maximálnych hladín, kde sa používa lacné zvukové reprodukčné zariadenie alebo obmedzený prenosový kanál (upozornený systém, amatérske rádio, atď.).

Počas hrania sa aplikuje kompresia hudba v pozadí (v predajniach, reštauráciách atď.), kde sú akékoľvek viditeľné objemové zmeny nežiaduce.

Ale najdôležitejším rozsahom použitia dynamickej kompresie je hudobná produkcia a vysielanie. Kompresia sa používa na získanie zvuku "hustotu" a "Drive" pre lepšiu kombináciu nástrojov medzi sebou, a najmä pri spracovaní vokálov.

Vokálne strany v rockovej a popovej hudbe sú zvyčajne vystavené kompresii, aby ich zdôraznili na pozadí sprievodu a pridávajú jasnosť. Špeciálny typ kompresora, nakonfigurovaný len na určitých frekvenciách - Desesser, sa používa na potláčanie syčacieho pozadia.

V prístrojových stranách sa kompresia používa aj pre účinky, ktoré nie sú priamo spojené s objemom, napríklad, rýchlo vyblednuté zvuky bubna sa môžu predĺžiť.

V elektronickej tanečnej hudbe (EDM) sa často používa bočné spojenie (pozri nižšie) - napríklad basová linka môže byť riadená hlaveňou alebo niečím podobným, aby sa zabránilo konfliktu basov a bicích a vytvoriť dynamickú pulzáciu.

Kompresia je široko používaná vo vysielacej prevodovke (rádio, televízia, internetové vysielanie), aby sa zvýšil vnímaný objem a zároveň znižuje dynamický rozsah zdrojového zvuku (zvyčajne CD). Väčšina krajín má právne obmedzenia na okamžitý maximálny objem, ktorý môže byť vysielaný. Typicky sú tieto obmedzenia implementované konštantnými hardvérovými kompresormi v éterickej reťazci. Okrem toho zvýšenie vnímaného objemu zlepšuje "kvalitu" zvuku z hľadiska väčšiny poslucháčov.

pozri tiež Hlasitosť vojny.

Jednotlivé zvýšenie objemu rovnakej skladby remnteged pre CD od roku 1983 do 2000.

Bočné chanovanie

Ďalším často nájdeným spínačom kompresora je "bočný reťazec". V tomto režime sa kompresia zvuku nevyskytuje v závislosti od vlastnej úrovne, ale v závislosti od úrovne signálu vstupujúceho do konektora, ktorý je tak obvykle nazývaný - bočný reťazec.

To možno nájsť niekoľko aplikácií. Napríklad spevák Shepelvit a všetky písmená "C" vyniknú z celkového obrazu. Vynecháte svoj hlas cez kompresor, a konektor bočného reťazca slúži rovnakému zvuku, ale vynechal cez ekvalizér. Na ekvalizéne odstránite všetky frekvencie, s výnimkou tých, ktoré používajú spevák, keď vyslovuje písmeno "C". Zvyčajne asi 5 kHz, ale môže byť od 3 kHz do 8 kHz. Ak potom vložte kompresor do režimu bočného reťazca, potom sa vyskytne kompresia hlasu v týchto momentoch, keď je výslovné písmeno "C". Ukázalo sa teda zariadenie známe ako "desesser" (de-eser). Tento spôsob práce sa nazýva "závislá od frekvencie" (závislá od frekvencie).

Ďalšie použitie tejto funkcie sa nazýva "DUCKER". Napríklad na rozhlasovej stanici prechádza hudba cez kompresor, a slová DJ - cez bočný reťazec. Keď DJ spustí chatovanie, hlasitosť hudby sa automaticky zníži. Tento účinok môže byť úspešne použitý v záznamoch, napríklad znížiť objem dávok klávesnice počas spevu.

Obmedzenie tehlovej steny

Kompresor a obmedzovač sú približne rovnaké, možno ho povedať, že obmedzovač je kompresor s vysokým pomerom (od 10: 1) A zvyčajne nízka doba útoku.

Existuje koncepcia tehlovej steny - veľmi vysoký limit pomeru (od 20: 1 a vyššie) a veľmi rýchly útok. V ideálnom prípade neumožňuje signál prekročiť prahovú úroveň. Výsledok bude nepríjemný pre povesť, ale to zabráni poškodeniu zvukovej reprodukčnej technológie alebo nadmernej šírke pásma kanála. Mnohí výrobcovia integrujú obmedzovače zariadenia na tento účel.

CLIPPER VS Obmedzovač, mäkké a tvrdé orezávanie

Táto skupina metód je založená na skutočnosti, že vysielané signály sú podrobené nelineárnej amplitúdovej transformácie a pri prenose a prijímaní častí nelinearity sa konvertujú. Napríklad, ak vysielač používa nelineárnu funkciu ÖU, v prijímači - U 2. Konzistentné uplatňovanie konvergentných funkcií povedie k tomu, že všeobecne transformácia zostáva lineárna.

Myšlienka nelineárnych metód kompresie údajov sa znižuje na skutočnosť, že vysielač môže poskytnúť väčší rozsah zmeny v prenášanej parametri s rovnakou amplitúdenou výstupných signálov (to znamená, že väčší dynamický rozsah). Dynamický rozsah - Toto je vyjadrené v relatívnych jednotkách alebo postojoch decibellah najväčšej prípustnej amplitúdy signálu na najmenšie:

; (2.17)
. (2.18)

Prírodná túžba zvýšiť dynamický rozsah znížením U min je obmedzený citlivosťou zariadenia a zvýšenie účinku interferencie a jeho vlastného hluku.

Najčastejšie sa kompresia dynamického rozsahu vykonáva pomocou dvojice konvergentných funkcií logaritmovania a potenciácie. Prvá prevádzka meniacej sa amplitúdy sa nazýva kompresia(kompresia), druhá - rozširovanie (strečing). Voľba týchto funkcií súvisí s ich najväčšou kompresnou schopnosťou.

Zároveň tieto metódy majú nevýhody. Prvým z nich je, že logaritmus malého počtu je negatívny a v limite:

to znamená, že citlivosť je veľmi nelineárna.

Ak chcete znížiť tieto nevýhody, obe funkcie sa modifikujú posunutím a aproximáciou. Napríklad pre telefónne kanály je aproximovaná funkcia súvisí (typ A,):

a \u003d 87,6. Zisk z kompresie je 24dB.

Kompresia dát nelineárnymi postupmi je implementovaná analógovými zariadeniami s veľkými chybami. Použitie digitálnych nástrojov môže významne zlepšiť presnosť alebo rýchlosť transformácie. V rovnakej dobe priame využívanie finančných prostriedkov počítačové vybavenie (To znamená, že priamy výpočet logaritmov a exponenciálov) nedá lepší výsledok v dôsledku nízkej rýchlosti a hromadeniu výpočtu.

Kompresia dát kompresiou z dôvodu obmedzení presnosti sa používa v prípadoch neregisie, napríklad na prenos reči na telefónne a rozhlasové kanály.

Účinné kódovanie

Efektívne kódy boli ponúknuté spoločnosti Sundon, Fano a Hafman. Podstatou kódov je, že sú nerovnomerné, to znamená, že s inou kategóriou vypúšťania a dĺžka kódexu je nepriamo úmerná pravdepodobnosti jeho vzhľadu. Ďalšou pozoruhodnou vlastnosťou efektívnych kódov - nevyžadujú oddeľovače, to znamená, že špeciálne znaky oddeľujú kombinácie susedného kódu. To sa dosahuje pozorovaním jednoduché pravidlo: Kratšie kódy nie sú začiatkom dlhšie. V tomto prípade je tuhý prúd binárnych výtokov jednoznačne dekódovaný, pretože dekodér ukazuje najkratšie kombinácie kódu. Účinné kódy na dlhú dobu boli čisto akademické, ale nedávno sa používali pri tvorbe databáz, ako aj pri kompresii informácií v moderných modemoch av softvérových archívoch.

Kvôli nerovnosti je zavedená priemerná dĺžka kódu. Stredná dĺžka - Matematické očakávania dĺžky kódu:

okrem toho L CP má tendenciu h (x) zhora (to znamená LUD\u003e H (x)).

Implementácia stavu (2.23) je zvýšená zvýšením N.

Existujú dva odrody účinných kódov: Shannon Fano a Hafman. Zvážte ich potvrdenie o príklade. Predpokladajme, že pravdepodobnosť znakov v sekvencii sú významy uvedené v tabuľke 2.1.

Tabuľka 2.1.

Pravdepodobnosti symbolov

N.
P I. 0.1 0.2 0.1 0.3 0.05 0.15 0.03 0.02 0.05

Symboly sú zaradené, to znamená, že hľadajú v rade na zostupnej pravdepodobnosti. Potom sa podľa metódy Shennon Fano, pravidelne opakuje nasledujúci postup: Celá skupina udalostí je rozdelená na dve podskupiny s rovnakými (alebo približne rovnakými) celkových pravdepodobností. Postup pokračuje, kým jeden prvok nezostane v nasledujúcej podskupine, po ktorom je tento prvok eliminovaný, a so zostávajúcimi tieto opatrenia pokračovať. To sa stane, kým posledné dve podskupiny zostávajú jedným prvkom. Pokračovať v zvážení nášho príkladu, ktorý je znížený v tabuľke 2.2.

Tabuľka 2.2.

Metóda Chennon Fano

N. P I.
4 0.3 I.
0.2 I. II.
6 0.15 I. I.
0.1 II.
1 0.1 I. I.
9 0.05 II. II.
5 0.05 II. I.
7 0.03 II. II. I.
8 0.02 II.

Ako je zrejmé z tabuľky 2.2, prvý symbol s pravdepodobnosťou P4 \u003d 0,3 sa zúčastnil dvoch postupov rozdelenia a oba časy zasiahli skupinu s číslom I. V súlade s týmto je kódovaný dvojitým kódom II. Druhý prvok v prvej fáze oddielu patril do skupiny I, na druhej skupine II. Preto jeho kód 10. Kódy zvyšku znakov v dodatočných pripomienkach nepotrebujú.

Zvyčajne sú nerovné kódy zobrazené vo forme kódových stromov. Kódový strom je graf, ktorý označuje povolené kombinácie kódu. Predpísanie smeru rebier tohto grafu, ako je znázornené na obr ..2.11 (výber smerov je ľubovoľná).

Graf sa riadi nasledovne: tvorí trasu pre vyhradený symbol; Počet vypúšťaní je rovný počtu okrajov v trase a hodnota každého vypúšťania sa rovná smeru zodpovedajúceho rebra. Trasa sa skladá zdrojový bod (Na kresbe je označený písmenom A). Napríklad trasa do vrcholu 5 pozostáva z piatich rebier, z ktorých všetko, okrem toho, má smer 0; Dostaneme kód 00001.

Vypočítať pre tento príklad entropie a strednú dĺžku slova.

H (x) \u003d - (0,3 log 0,3 + 0,2 log 0,2 + 2 0,1 log 0,1+ 2 0.05 LOG 0,05+

0.03 LOG 0.03 + 0.02 LOG 0,02) \u003d 2,23 bitov

l Cp \u003d 0,3 2 + 0,2 2 + 0,15 3 + 0,1 3 + 0,1 4 + 0,05 5 +0,05 4+

0.03 6 + 0.02 6 = 2.9 .

Ako je možné vidieť, stredná dĺžka slova je blízka entropii.

Kódy Hafman sú postavené na inom algoritme. Postup kódovania sa skladá z dvoch stupňov. V prvej fáze je jednorazová kompresia abecedy dôsledne. Jednorazová kompresia je výmena posledných dvoch znakov (s nižšími pravdepodobnosťmi), s celkovou pravdepodobnosťou. Kompresia sa vykonáva, kým nezostanú dva znaky. Zároveň vyplňte kódovaciu tabuľku, v ktorej sú pripevnené výsledné pravdepodobnosti, a tiež zobrazuje trasy, pre ktoré sa v ďalšej fáze pohybujú nové znaky.

V druhej fáze dochádza k samotné kódovanie, čo začína z poslednej fázy: prvý z dvoch znakov prideľte kód 1, druhý - 0. Potom choďte do predchádzajúcej fázy. K symbolom, ktoré sa nezúčastnili na kompresii v tomto štádiu, atribútov kódy z nasledujúceho štádia a na dva najnovšie znaky dvakrát pripisujú symbolový kód získaný po lepení a pridajte k hornému symbolu kódu 1, nižšie - 0. Symbol je ďalej v lepení, jeho kód zostáva nezmenený. Postup pokračuje až do konca (to znamená až do prvej etapy).

Tabuľka 2.3 ukazuje kódovanie pozdĺž algoritmu Hafman. Ako je možné vidieť z tabuľky, kódovanie sa uskutočnilo v 7 etáp. Na ľavej strane sú pravdepodobnosti znakov, vpravo - medziľahlé kódy. Šípky zobrazujú pohybujúce sa novo vytvorené znaky. V každej fáze sa posledné dva znaky líšia len s mladším vybitím, ktorý zodpovedá technike kódovania. Vypočítame priemernú dĺžku slova:

l C \u003d 0,3 2 + 0,2 2 + 0,15 3 ++ 2 0,1 3 + + 00,05 4 + 0,05 5 + 0,03 6 + 0,02 6 \u003d 2.7

Je ešte bližšie k entropii: kód je ešte efektívnejší. Na obr. 2.12 ukazuje kód kódu Hafman.

Tabuľka 2.3.

Kódovanie algoritmu Hafman

N. P I. kód I. II. Iii Iv V. Vi Vii
0.3 0.3 11 0.3 11 0.3 11 0.3 11 0.3 11 0.4 0 0.6 1
0.2 0.2 01 0.2 01 0.2 01 0.2 01 0.3 10 0.3 11 0.4 0
0.15 0.15 101 0.15 101 0.15 101 0.2 00 0.2 01 0.3 10
0.1 0.1 001 0.1 001 0.15 100 0.15 101 0.2 00
0.1 0.1 000 0.1 000 0.1 001 0.15 100
0.05 0.05 1000 0.1 1001 0.1 000
0.05 0.05 10011 0.05 1000
0.03 0.05 10010
0.02

Obe kódy spĺňajú požiadavku dekódovania jedinečnosti: Ako možno vidieť z tabuliek, kratšie kombinácie nie sú začiatkom dlhších kódov.

S rastúcim počtom symbolov, účinnosť kódy zvýšiť, takže v niektorých prípadoch kódované väčšie bloky (napríklad, ak hovoríme o textoch, môžete kódovať niektoré z najčastejších slabík, slov a dokonca aj frázy).

Účinok implementácie takýchto kódov je určený v porovnaní s jednotným kódom:

(2.24)

kde n je počet jednotných kódov, čo je nahradené účinným.

Úpravy kódy Khafman

Klasický algoritmus Hafman sa vzťahuje na dvojstupňový, t.j. Vyžaduje počiatočný súbor štatistík na symboloch a správach a potom vyššie opísané postupy. V praxi je nepohodlné, pretože zvyšuje čas spracovania správ a akumuláciu slovníka. Jednostranné metódy, v ktorých sú kombinované akumulácie a kódujúce postupy. Takéto metódy sa nazývajú aj adaptívna kompresia pozdĺž Hafman [46].

Podstatou adaptívnej kompresie cez Hafman sa znižuje na výstavbu počiatočného kódu a jeho konzistentnú modifikáciu po prijatí každého ďalšieho symbolu. Ako predtým, stromy tu sú binárne, t.j. Z každého vrcholu grafu - drevo sa vyskytne maximálne dva oblúky. Je zvyčajné zavolať pôvodného vrcholu rodičom a dve súvisiace ďalšie vrcholy - deti. Predstavujeme koncepciu hmotnosti vrcholu - toto je počet znakov (slová) zodpovedajúce tomuto vrcholu získanému pri použití počiatočnej sekvencie. Samozrejme, súčet šupín detí sa rovná hmotnosti rodiča.

Po zadaní nasledujúceho symbolu vstupnej sekvencie je kódový strom revidovaný: Hmotnosť vrcholov sa prepočítajú av prípade potreby sú usporiadané vrcholy. Pravidlo preusporiadania vrcholov nasledovne: Hmotnosť dolných vrcholov sú najmenšie a vrcholy, ktoré sú ponechané na stĺpci, majú najmenšie váhy.

Zároveň sú uvedené vrcholy. Číslovanie začína s nižším (zavesením, t.j. ktorí nemajú deti) vrcholy zľava doprava, potom prevedené do horné poschodie atď. na číslovanie posledného, \u200b\u200bzdrojového vrcholu. Zároveň sa dosiahne nasledujúci výsledok: čím menej hmotnosti vrcholu, tým menej jeho číslo.

Perutácia sa vykonáva hlavne na zavesenie vrcholov. Keď sa permutácia, formulované pravidlo je považované za: topy s vysokou hmotnosťou majú väčšie číslo.

Po prechode sekvencie (je tiež nazývaná kontrola alebo test), sú kombinácie kódov priradené všetkým visiacim vrcholom. Pravidlo priradenia pravidiel je podobné vyššie uvedenému: Počet kódových výbojov je rovný počtu vrcholov, cez ktoré trasa prebieha zo zdroja na tento závesný vrchol a hodnota špecifického vypúšťania zodpovedá smer od rodiča "Dieťa" (povedzme, prechod vľavo od rodiča zodpovedá hodnote 1, doprava - 0).

Získané kombinácie kódov sa zadávajú do pamäte kompresného zariadenia spolu s analógmi a tvoria slovník. Použitie algoritmu je nasledovné. Stlačiteľná sekvencia znakov je rozdelená na fragmenty v súlade s existujúcim slovník, po ktorom je každý z fragmentov nahradený jeho kódom zo slovníka. Fragmenty, ktoré neboli zistené v slovníku formu tvoria nové závesné vrcholy, priberajú hmotnosť a sú tiež zadané do slovníka. To je tvorené adaptívnym algoritmom pre doplnenie slovníka.

Na zvýšenie účinnosti spôsobu je žiaduce zvýšiť veľkosť slovníka; V tomto prípade rastie kompresný koeficient. Prakticky veľkosť slovníka je 4 - 16 kb pamäte.


Ilitovať algoritmus uvedený príkladom. Na obr. 2.13 ukazuje zdrojový diagram (je tiež nazývaný s Stromom Hafman). Každý vrchol dreva je znázornený obdĺžnikom, v ktorom sú dve číslice zapísané cez frakciu: prvá znamená číslo vrcholov, druhá je jeho hmotnosť. Ako sa dá uistiť, že verzia váhy a ich čísla sú splnené.

Predpokladajme, že symbol zodpovedajúci vrchnemu 1, v testovacej sekvencii stretol sekundárne. Zmena hmotnosti vrcholov, ako je znázornené na obr. 2.14 V dôsledku toho je porušený počet číslovanie vrcholu. V ďalšom štádiu zmeníme usporiadanie visiacich vrcholov, pre ktoré meníme vrcholy 1 a 4 a hodnotíme všetky vrcholy stromu. Výsledný graf je znázornený na obr. 2.15. Ďalej, postup pokračuje podobne.

Treba pripomenúť, že každý závesný vrchol v Strom Hafman zodpovedá konkrétnemu symbolu alebo ich skupine. Rodič sa líši od detí tým, že skupina postáv, je pre neho vhodné, že jeden symbol krátkodobý, ako jeho deti, a tieto deti sa líšia v poslednom symbolu. Napríklad rodičia zodpovedajú symbolom "vozidla"; Potom deti môžu mať sekvencie "Kara" a "Carp".

Vyššie uvedený algoritmus nie je akademický a aktívne sa používa v programov - archívoch, a to aj pri kompresii grafických údajov (budú diskutované nižšie).

LEMPEL - ZIVA Algoritmy

Toto sú najčastejšie používané kompresné algoritmy. Používajú sa vo väčšine programov - Archers (napríklad Pkzip. ARJ, LHA). Podstatou algoritmov je, že niektorý súbor znakov je vymenený pri archivácii v špeciálne generovanom slovníku. Napríklad, často sa nachádza v záležitostiach frázy "na vašom písmennom odchádzajúcom čísle ..." môže obsadiť v polohe 121 slovníka; Potom namiesto prenosu alebo uloženia uvedenej frázy (30 bajtov) môžete uložiť číslo frázy (1,5 bajtov v binárne - desatinné formy alebo 1 binárne binárne).

Algoritmy sú pomenované po autoroch, ktorí ich najprv ponúkli v roku 1977. Z týchto, prvý - LZ77. Pre archiváciu je vytvorená takzvaná posuvné okno pozostávajúce z dvoch častí. Prvá časť, väčší formát, slúži na vytvorenie slovníka a má veľkosť rádovo niekoľko kilobajtov. V druhej, menšej časti (zvyčajne až 100 bajtov) sú akceptované aktuálnymi znakmi zobrazeného textu. Algoritmus sa snaží nájsť v slovníku znakov, ktoré sa zhodujú s zobrazeným oknom. Ak je to možné, je generovaný kód pozostávajúci z troch častí: posunutie v slovníku, pokiaľ ide o jeho počiatočné podreťazc, dĺžku tohto substrátu vedľa tohto podkladového charakteru. Napríklad vyhradený substrát pozostáva z symbolov "aplikácie" (iba 6 znakov), nasledujúci symbol je "E". Potom, ak má podklad adresu (miesto v slovníku) 45, potom záznam v slovníku má formulár "45, 6. E". Potom sa obsah okna posúva do polohy a vyhľadávanie pokračuje. Takto sa vytvorí slovník.

Výhodou algoritmu je ľahko formalizovaný algoritmus na kompiláciu slovníka. Okrem toho je možné rozložiť a bez počiatočného slovníka (je žiaduce mať testovaciu sekvenciu) - slovník je vytvorený v procese UniMber.

Nevýhody algoritmu sa objavujú so zvýšením veľkosti slovníka - čas na vyhľadávanie sa zvyšuje. Okrem toho, ak v aktuálnom okne chýba reťazec znakov, každý symbol je napísaný na tri-elementový kód, t.j. Ukazuje sa, že nie je kompresia, ale natiahnutie.

Najlepšie charakteristiky Má algoritmus LZSS navrhnutý v roku 1978. Má rozdiely v údržbe posuvného okna a výstupných kódov kompresora. Okrem okna, algoritmus tvorí binárny strom, podobne ako HAFMAN Strom, aby sa urýchlilo vyhľadávanie náhodných bodov: Každé podklady opúšťajúce prúdové okno je pridané do stromu ako jeden z detí. Takýto algoritmus vám umožňuje ďalej zvýšiť veľkosť aktuálneho okna (je žiaduce, aby jeho hodnota rovnala stupňu dvoch: 128, 256 atď. Byte). Sekvenčné kódy sú tiež vytvorené inak: 1-bitová predpona sa dodatočne zavádza na rozlíšenie nepredstavených znakov z párov "ofset, dĺžka".

Ešte väčšia kompresia sa získa pomocou algoritmov typu LZW. Predtým opísané algoritmy majú pevnú veľkosť okna, ktorá vedie k nemožnosti vstupu do slovníka fráz je dlhšia ako veľkosť okna. V algoritmoch LZW (a ich predchodca LZ78) má okno pohľadu neobmedzenú veľkosť a slovník akumuluje frázu (a nie súhrn znakov ako predtým). Slovník má neobmedzenú dĺžku a snímač (dekodér) pracuje v režime pohotovostného režimu. Keď je tvorená fráza, ktorá sa zhoduje so slovníkom, je vydaný kód zhody (tj kód tejto frázy v slovníku) a kód nasledujúceho symbolu za ním. Ak sú symboly akumulovať nová fráza, je tiež zadaná do slovníka, ako najkratšia. Výsledkom je, že je vytvorený rekurzívny postup, ktorý poskytuje rýchle kódovanie a dekódovanie.

Dodatočná príležitosť Kompresia poskytuje komprimované kódovanie opakovaných znakov. Ak v sekvencii, niektoré znaky nasledujú v rade (napríklad v texte, môže to byť "medzery" znaky, v numerickej sekvencii - tečúce nuly atď.), Dáva zmysel nahradiť svoj pár "symbol; dĺžka "alebo" znak, dĺžka ". V prvom prípade kód označuje funkciu, že sekvencia je kódovaná (zvyčajne 1 bit), potom kód opakujúceho sa symbolu a dĺžku sekvencie. V druhom prípade (poskytnuté pre najbežnejšie opakované symboly) v predponu indikuje jednoducho znak opakovania.