Skaņas kompresija: princips un konfigurācija. Sintēze un runas atpazīšana

Laikā, kad pētnieki arī turpināja atrisināt problēmu veidot runas saskarni datoriem, bieži vien bija nepieciešams, lai ražotu iekārtas neatkarīgi, ļaujot jums ievadīt audio informāciju datorā, kā arī parādīt to no datora. Šodien šīm ierīcēm var būt unikāla vēsturiska interese, jo mūsdienu datori var viegli aprīkot ievades un izejas ierīces, piemēram, skaņas adapterus, mikrofonus, austiņas un skaņas kolonnas.

Mēs nebūs dziļi informēti iekšējā ierīce Šīs ierīces, bet mēs pastāstīsim par to, kā viņi strādā, un sniedz dažus ieteikumus, lai izvēlētos skaņas datoru ierīces, lai strādātu ar atpazīšanas sistēmām un runas sintēzi.

Kā mēs jau esam runājis iepriekšējā nodaļā, skaņa nav nekas vairāk kā gaisa svārstības, kura frekvence atrodas frekvenču diapazonā, ko uztver persona. Dažādos cilvēkos, precīzi ierobežojumi diapazonā skaņas frekvenču var atšķirties, tomēr tiek uzskatīts, ka skaņas svārstības atrodas diapazonā no 16-20,000 Hz.

Mikrofona uzdevums ir pārvērst audio svārstības elektriskajās svārstībās, ko var turpināt pastiprināt, filtrē, lai novērstu traucējumus un digitalizētu, lai ievadītu skaņas informāciju datorā.

Saskaņā ar darbības principu visbiežāk mikrofoni ir sadalīti oglēs, elektrodinamikā, kondensatorā un elektronikā. Daži no šiem mikrofoniem ir nepieciešams viņu darbs ārējais avots Pašreizējais (piemēram, ogļu un kondensators), citi, kas ietekmē skaņas svārstības, var patstāvīgi radīt maiņstrāvas elektrisko spriegumu (tie ir elektrodinamiskie un elektroenerģijas mikrofoni).

Jūs varat arī sadalīt mikrofonus šim nolūkam. Ir studijas mikrofoni, kurus var turēt rokā vai nostiprināt uz statīva, ir radio mikrofoni, kurus var piestiprināt pie apģērba, un tā tālāk.

Datoriem ir arī mikrofoni. Šādi mikrofoni parasti piestiprina uz statīva uz galda virsmas. Datoru mikrofonus var apvienot ar austiņām, kā parādīts 1. attēlā. 2-1.

Fig. 2-1. Austiņas ar mikrofonu

Kā izvēlēties no visiem mikrofoniem, kas ir vislabāk piemēroti runas atpazīšanas sistēmām?

Principā jūs varat eksperimentēt ar jebkuru mikrofonu, ja vien to nevar savienot ar datora audio adapteri. Tomēr runas atpazīšanas sistēmu izstrādātājiem ieteicams iegūt šādu mikrofonu, kas darbā būs pastāvīgs runātāja mutes attālums.

Ja attālums starp mikrofonu un muti nemainās, vidējais elektriskais signāls, kas nāk no mikrofona, arī mainīsies pārāk daudz. Tas pozitīvi ietekmēs mūsdienu runas atpazīšanas sistēmu darba kvalitāti.

Kāda ir problēma šeit?

Persona spēj veiksmīgi atpazīt runu, kura apjoms mainās ļoti plašās robežās. Cilvēka smadzenes spēj filtrēt kluso runu no traucējumiem, piemēram, automašīnu troksnis, kas iet pa ielu, ārvalstu sarunām un mūziku.

Attiecībā uz mūsdienu runas atpazīšanas sistēmām, to spējas šajā jomā ir daudz vēlama. Ja mikrofons stāv uz galda, tad kad galva ir pagriezta vai mainās ķermeņa stāvokli, mainīsies attālums starp muti un mikrofonu. Tas novedīs pie maiņas līmeņa mikrofona izejas signālu, kas savukārt pasliktinās uzticamību runas atpazīšanu.

Tāpēc, strādājot ar runas atpazīšanas sistēmām, vislabākie rezultāti tiks sasniegti, ja jūs izmantojat mikrofonu, kas pievienots virsrakstiem, kā parādīts 1. attēlā. 2-1. Lietojot šādu mikrofonu, attālums starp muti un mikrofons būs pastāvīgs.

Mēs arī pievēršam jūsu uzmanību, ka visi eksperimenti ar runas atpazīšanas sistēmām vislabāk tiek darīts, saglabājot klusā telpā. Šajā gadījumā traucējumu ietekme būs minimāla. Protams, ja jums ir jāizvēlas runas atpazīšanas sistēma, kas spēj strādāt spēcīgas iejaukšanās apstākļos, testi ir jāveic atšķirīgi. Tomēr, ciktāl tas ir pazīstams ar grāmatas autoriem, bet runas atpazīšanas sistēmu ievērošana joprojām ir ļoti zema.

Mikrofons uzstājas, lai ASV pārveidotu skaņas svārstības svārstībās elektriskā strāva. Šīs svārstības var redzēt osciloskopa ekrānā, bet nav jāsteidzas uz veikalu, lai iegādātos šo dārgo ierīci. Visi oscilogrāfisko pētījumu mēs varam tērēt, izmantojot regulāru datoru, kas aprīkots ar skaņas adapteri, piemēram, skaņas blastera adapteri. Vēlāk mēs jums pateiks, kā to izdarīt.

Att. 2-2 Mēs parādījām oscilogrammu skaņas signāls, Iegūst, kad izteica ilgu skaņu a. Šī oscillogramma tika iegūta, izmantojot Goldwave programmu, par kuru mēs joprojām pateiksim šajā grāmatas nodaļā, kā arī izmantojot skaņas blasteru un mikrofonu audio adapteri, kas ir līdzīgs, kas parādīts 1. attēlā. 2-1.

Fig. 2-2. Skaņas signāla oscilogramma

Goldwave programma ļauj jums izstiepties oscilogramu gar laika ass, kas ļauj jums redzēt mazākās detaļas. Att. 2-3 Mēs parādīja izstieptu fragmentu skaņas oscillogram minēts iepriekš.

Fig. 2-3. Skaņas skaņas oscillogramma fragments

Lūdzu, ņemiet vērā, ka no mikrofona ienākuma signāla lielums periodiski atšķiras un ņem gan pozitīvas, gan negatīvas vērtības.

Ja ievades signālam bija tikai viena frekvence (tas ir, ja skaņa bija "tīra"), no mikrofona iegūtā signāla forma būtu sinusoidāls. Tomēr, kā mēs teicām, cilvēka runas skaņu spektrs sastāv no frekvenču kopuma, kā rezultātā runas signāla oscilogrammas forma ir tālu no sinusoidāla.

Signālu, kura vērtība mainās ar laiku nepārtraukti, mēs zvanīsim analogais signāls. Šis signāls nāk no mikrofona. Atšķirībā no analogā digitālais signāls ir skaitlisko vērtību kopums, kas atšķiras ar laiku diskrētu.

Lai datoru var apstrādāt pīkstienu, tas ir jātulko no analogā veidlapas digitālajā, tas ir, lai pārstāvētu formā kopumu skaitliskās vērtības. Šo procesu sauc par analogo signāla digitalizāciju.

Skaņas (un jebkura analogā) signāla digitalizācija tiek veikta, izmantojot īpašu ierīci, ko sauc analogais līdz digitālais pārveidotājs ADC (analogais digitālais pārveidotājs, ADC). Šī ierīce ir uz kuģa audio adaptera un ir kopīgs mikrocirkūciju.

Kā darbojas analogais līdz digitālais pārveidotājs?

Tas periodiski mēra ieejas signāla līmeni un nodrošina mērīšanas rezultāta izejas skaitlisko vērtību. Šis process ir parādīts 1. attēlā. 2-4. Šeit pelēkie taisnstūri iezīmēja ievades vērtības noteiktā pastāvīgā laika intervālā. Šādu vērtību kopa un ir digitalizēta ieejas analogā signāla attēlošana.

Fig. 2-4. Mērīšana atkarības amplitūdas signāla no laika

Att. 2-5 Mēs parādījām savienojumu ar analogo līdz digitālo pārveidotāju uz mikrofonu. Šādā gadījumā ievade x 1 kalpo analogais signāls, un digitālais signāls tiek noņemts no U 1 -u N rezultātiem.

Fig. 2-5. Analogais-digitālais pārveidotājs

Analog-to-digitālajiem pārveidotājiem raksturo divi svarīgi parametri - transformācijas biežums un kvantēšanas līmeņa skaitu ievades signālu. Pareiza šo parametru izvēle ir būtiska, lai sasniegtu atbilstošu pārstāvību analogā signāla digitālā formā.

Cik bieži Jums bieži ir nepieciešams izmērīt ievades analogās signāla amplitūdas vērtību, lai digitalizācijas dēļ netiktu zaudēta informācija par izmaiņām ievades analogā signāla?

Šķiet, ka atbilde ir vienkārša - ievades signāls jāmēra pēc iespējas biežāk. Patiešām, biežāk analogais līdz digitālais pārveidotājs veic šādus mērījumus, jo labāk ir izsekot mazākās ievades analogās signāla amplitūdas izmaiņas.

Tomēr nevajadzīgi biežas mērījumi var izraisīt nepamatotu izaugsmi digitālo datu plūsmu un bezjēdzīgi tērēt datoru resursus, apstrādājot signālu.

Par laimi, pareizā izvēle Frekvences konversija (paraugu ņemšanas biežums) ir pietiekami vienkārša. Lai to izdarītu, pietiek sazināties ar Kotelnikov teorēmu, kas pazīstams ar tiem, kas ir kvalificēti digitālās signālu apstrādes jomā. Theorem norāda, ka pārrēķina biežums ir divas reizes lielāks par pārveidotā signāla spektra maksimālo frekvenci. Tāpēc digitalizācijai, nezaudējot skaņas signāla kvalitāti, kuras frekvence ir 16-20 000 Hz, jums ir jāizvēlas konversijas biežums, ne mazāk kā 40 000 Hz.

Tomēr ņemiet vērā, ka profesionālā skaņas iekārtā konversijas biežums ir izvēlēts vairākas norādītās vērtības. Tas tiek darīts, lai panāktu ļoti augstu digitalizētu skaņu kvalitāti. Runas atpazīšanas sistēmām šī kvalitāte nav būtiska, tāpēc mēs nevaram pievērst jūsu uzmanību šādai izvēlei.

Un kāda ir transformācijas biežums, lai digitētu cilvēka runas skaņu?

Tā kā cilvēka runas skaņas atrodas 300-4000 Hz frekvences diapazonā, konversijas minimālais biežums ir 8000 Hz. Tomēr daudzi datorprogrammas Runas atpazīšanas standarts parastajiem audio adapteriem. Transformācijas frekvence ir 44 000 Hz. No vienas puses, šī transformācijas biežums nerada pārmērīgu digitālo datu plūsmas pieaugumu, un otrs - runas digitalizācija ar pietiekamu kvalitāti.

Pat skolā mēs mācījāmies, ka ar jebkādiem mērījumiem rodas kļūdas, no kurām nav iespējams pilnībā atbrīvoties. Šādas kļūdas rodas sakarā ar mērinstrumentu ierobežoto izšķirtspēju, kā arī tāpēc, ka mērīšanas process pats var veikt dažas izmaiņas mērītajā vērtībā.

Analogs-to-digitālais pārveidotājs atspoguļo ievades analogo signālu, kas ir ierobežotas bitu skaita plūsma. Parastie audio adapteri satur 16 bitu ADC blokus, kas var atspoguļot ieejas signāla amplitūdu 216 \u003d 65536 dažādas vērtības. ADC ierīces augstas klases skaņas iekārtās var būt 20 bitu, nodrošinot lielāku audio signāla amplitūdas precizitāti.

Mūsdienu sistēmas un runas atpazīšanas programmas tika izveidotas parastajiem datoriem, kas aprīkoti ar parastajiem skaņu adapteriem. Tāpēc, lai veiktu eksperimentus ar runas atpazīšanu, jums nav nepieciešams iegādāties profesionālu audio adapteri. Šāds adapteris kā skaņas blasteris ir diezgan piemērots runas digitalizēšanai, lai to vēl vairāk atpazītu.

Kopā ar noderīgu signālu mikrofonam, dažādi trokšņi parasti samazinās - troksnis no ielas, vēja troksnis, ārvalstu sarunas utt. Troksnis negatīvi ietekmē runas atpazīšanas sistēmu darba kvalitāti, tāpēc tai ir jārisina. Viens veids, kā mēs jau esam minējuši - Šodienas runas atpazīšanas sistēmas vislabāk izmantot klusā telpā, uzturoties ar datoru vienu.

Tomēr ideālos apstākļus var izveidot ne vienmēr, tāpēc jums ir jāizmanto Īpašas metodesļaujot jums atbrīvoties no trokšņa. Lai samazinātu trokšņa līmeni, tiek izmantoti speciālie triki, veidojot mikrofonus un īpašus filtrus, kas no analogās frekvences signāla, kas nesasniedz noderīgu informāciju. Turklāt šī metode tiek izmantota kā kompresija. dinamiskais diapazons Ievades līmeņi.

Pastāstiet par to visu kārtībā.

Frekvenču filtrs Tiek saukts par ierīci, kas pārvērš analogā signāla frekvenču spektru. Šajā gadījumā notiek dažu frekvenču svārstību transformācijas procesā (vai absorbcija).

Jūs varat iedomāties šo ierīci formā virkni melnā kaste ar vienu ievadi un vienu izeju. Attiecībā uz mūsu situāciju mikrofons tiks savienots ar frekvenču filtra ievadi, un analogais līdz digitālais pārveidotājs tiks savienots ar izeju.

Frekvenču filtri ir atšķirīgi:

· Zemu frekvenču filtri;

· Augšējā frekvenču filtri;

· Noņemiet sloksnes filtrus;

· Bashed sloksnes filtri.

Zemākas frekvences filtri (Zema caurlaides filtrs) tiek noņemts no ieejas spektra Visas frekvences, kuru vērtības ir zemākas par dažu sliekšņa frekvenci atkarībā no filtra iestatījuma.

Tā kā skaņas signāli atrodas diapazonā no 16-20,000 Hz, visas frekvences, kas ir mazākas par 16 Hz, var izgriezt, neizturot skaņas kvalitāti. Runas atpazīšanai ir svarīga 300-4000 Hz frekvenču diapazons, lai jūs varētu samazināt frekvences zem 300 Hz. Šajā gadījumā visi traucējumi tiks izgriezti no ieejas signāla, kura frekvenču spektrs atrodas zem 300 Hz, un tie netraucēs runas atpazīšanas procesu.

Līdzīgi augšējā frekvenču filtri (Augstas pakāpes filtrs) tiek izgrieztas no ievades spektra visām frekvencēm virs dažiem sliekšņa frekvences.

Persona nedzird skaņas ar biežumu 20 000 Hz un augstāk, tāpēc tos var izgriezt no spektra bez ievērojamu skaņas kvalitātes pasliktināšanās. Attiecībā uz runas atpazīšanu, šeit jūs varat samazināt visas frekvences virs 4000 Hz, kas radīs ievērojamu augstfrekvences traucējumu līmeni.

Nosūtītāja sloksnes filtrs (Band -Pass filtru) var iedomāties kā apakšējā un augšējā frekvenču filtra kombināciju. Šāds filtrs aizkavē visas frekvences zem tā sauktās apakšējā frekvencekā arī iepriekš augšējā frekvenču joslas platums.

Tādējādi runas atpazīšanas sistēmai joslas platuma filtrs ir ērts, kas kavē visas frekvences, izņemot 300-4000 Hz diapazona frekvences.

Attiecībā uz aizdedzes sloksnes filtriem (BAND -Stop filtrs), tie ļauj izgriezt no ievades spektra visām frekvencēm, kas atrodas norādītajā diapazonā. Šāds filtrs ir ērts, piemēram, lai nomāktu troksni, kas aizņem cietu daļu no signāla spektra.

Att. 2-6 Mēs parādījām savienojumu ar joslas platuma filtru.

Fig. 2-6. Skaņas signāla filtrēšana pirms digitalizācijas

Jāsaka, ka parastie skaņas adapteri, kas uzstādīti datorā, ir to sastāvā sloksnes filtrs, caur kuru analogais signāls iet pirms digitalizācijas. Šāda filtra joslas platums parasti atbilst skaņu signālu diapazonam, proti, 16-20 000 Hz (dažādos audio adapteros, augšējā un apakšējā frekvences vērtības var atšķirties nelielos ierobežojumos).

Un kā panākt šaurāku joslas platumu 300-4000 Hz, kas atbilst visvairāk informatīvo daļu no cilvēka spektra?

Protams, ja jums ir tendence izstrādāt radio-elektronisko iekārtu, jūs varat padarīt savu filtru no mikroshēmas operatīvo pastiprinātāju, rezistori un kondensatori. Aptuveni pirmie Runas atpazīšanas sistēmu veidotāji.

bet rūpniecības sistēmas Runas atpazīšanai jābūt praktiskai ar standarta datoru aparatūru, tāpēc šeit nav piemērots speciāla joslas filtra ceļš.

Tā vietā, tā saukto tiek izmantota mūsdienu runas apstrādes sistēmās digitālo frekvenču filtriīstenots programmiski. Tas kļuva iespējams pēc procesors Dators ir kļuvis pietiekami spēcīgs.

Digitālā frekvenču filtrs ieviesta programmatūra pārvērš ievades digitālo signālu izejas digitālajam signālam. Konversijas procesā programma apstrādā īpašu plūsmu signāla signāla amplitūdas luminiscenci, kas nāk no analogā līdz digitālā pārveidotāja. Pārveidošanas rezultāts arī būs skaitļu skaits, tomēr šis pavediens atbilst jau filtrētam signālam.

Runājot par analogo līdz digitālo pārveidotāju, mēs atzīmējām svarīga īpašībakā kvantēšanas līmeņa skaitu. Ja Audio adapterī ir instalēts 16 bitu analogais līdz digitālais pārveidotājs, pēc tam pēc digitalizējot skaņas signālu līmeņus var attēlot kā 216 \u003d 65536 dažādas vērtības.

Ja ir maz kvantēšanas līmeņa, tad tā sauktais pievilt troksni. Lai samazinātu šo troksni, augstas kvalitātes skaņas digitalizācijas sistēmās analogie digitālie pārveidotāji jāpiemēro ar maksimālo pieejamo kvantēšanas līmeņa skaitu.

Tomēr ir vēl viena uzņemšana, kas ļauj samazināt kvantēšanas trokšņa ietekmi uz audio signāla kvalitāti, ko izmanto digitālās skaņas ierakstīšanas sistēmās. Lietojot šo uztveršanu pirms digitalizācijas, signāls tiek nodots caur nelineāru pastiprinātāju, uzsverot signālus ar nelielu signāla amplitūdu. Šāda ierīce uzlabo vājas signālus, kas ir spēcīgāki par spēcīgiem.

To ilustrē grafiks atkarību amplitūdas izejas signāla no amplitūdas ievades signāla parādīts attēlā. 2-7.

Fig. 2-7. Nelineāra pastiprināšana pirms digitalizācijas

Digitizētā audio apgrieztā konversijas posmā uz analogo (mēs uzskatām šo soli zemāk šajā nodaļā) pirms audio kolonnas parādīšanas, analogais signāls atkal tiek pagājis caur nelineāru pastiprinātāju. Šoreiz tiek izmantots cits pastiprinātājs, kas uzsver signālus ar lielu amplitūdu un ir pārneses raksturojums (atkarība no izejas signāla amplitūdas no ieejas signāla amplitūdas), apgriezts, kas tika izmantots digitalizācijas laikā.

Kā tas viss var palīdzēt Runas atpazīšanas sistēmu veidotājiem?

Persona, kā zināms, ir diezgan labi atzīta runa izteica ar klusu čuksti vai diezgan skaļu balsi. Var teikt, ka veiksmīgi atzītā runas apjoma līmeņa dinamiskais diapazons ir diezgan plašs.

Šodienas datoru sistēmas Runas atzīšana, diemžēl, līdz tas lepojas ar to. Tomēr, lai pirms digitalizētu noteiktā dinamiskā diapazonā noteiktu dinamisko diapazonu, jūs varat izlaist signālu no mikrofona caur nelineāru pastiprinātāju, kura pārsūtīšanas īpašība ir parādīta 1. attēlā. 2-7. Tas samazinās trokšņa līmeni kvantēšanas vāju signālu digitalizācijas laikā.

Runas atpazīšanas sistēmu izstrādātāji atkal ir spiesti galvenokārt koncentrēties uz seriāli ražotiem skaņu adapteriem. Tie nesniedz iepriekš aprakstīto nelineāro signālu konvertāciju.

Tomēr jūs varat izveidot programmatūras ekvivalentu nelineāra pastiprinātāju, kas pārvērš digitalizētu signālu pirms nosūtīšanas uz runas atpazīšanas moduli. Un, lai gan šāda programmas pastiprinātājs nevarēs samazināt kvantēšanas troksni, ir iespējams uzsvērt šos signālu līmeņus, kas pārvadā vislielāko runas informāciju. Piemēram, jūs varat samazināt vājo signālu amplitūdu, novēršot signālu no trokšņa.

Vai fotogrāfijas platums Foto materiāls ir saikne starp maksimālo un minimālo iedarbības vērtību, kas var būt pareizi uztverti attēlā. Atsaucoties uz digitālo fotogrāfiju, dinamiskais diapazons faktiski ir līdzvērtīgs attiecība maksimālo un minimālo iespējamo vērtību noderīgas elektrisko signālu, ko rada fotoattēls rodas iedarbības laikā.

Dinamisko diapazonu mēra iedarbības posmos (). Katrs solis atbilst gaismas daudzuma dubultošanai. Piemēram, ja noteikta kamera ir dinamisks diapazons 8 EV, tas nozīmē, ka maksimālā iespējamā vērtība noderīgā signāla tā matricas attiecas uz minimālo kā 2 8: 1, kas nozīmē, ka kamera spēj uzņemties vienā Rāmja objekti, kas atšķiras no spilgtuma ne vairāk kā 256 reizes. Precīzāk, tas var uztvert to objektus ar jebkuru spilgtumu, bet objektiem, kuru spilgtums pārsniegs maksimumu pieļaujamā vērtība Pieņemsim izkļūt uz Žilbinoša balta priekšstatu un objektus, kuru spilgtums būs zemāks par minimālo vērtību - ogles melnā krāsā. Sīkāka informācija un tekstūras būs atšķiramas tikai uz tiem objektiem, kuru spilgtums ir sakrautas kameras dinamiskajā diapazonā.

Lai aprakstītu saikni starp spilgtuma spilgtumu un visvairāk tumšo no noņemamo priekšmetu, ne gluži pareizu terminu "dinamiskā ainas diapazons" bieži tiek izmantots. Tas būs pareizāks runāt par spilgtuma diapazonu vai kontrastu līmenī, jo dinamiskais diapazons parasti ir mērīšanas ierīces īpašība ( Šis gadījums, Digitālo kameru matricas).

Diemžēl daudzu skaistu ainavu spilgtuma klāsts, ar kuru mēs saskaramies īsta dzīvevar ievērojami pārsniegt digitālās kameras dinamisko klāstu. Šādos gadījumos fotogrāfs ir spiests izlemt, kuri objekti ir jāizstrādā visās daļās, un kuras var atstāt ārpus dinamiskā diapazona, neskarot radošo dizainu. Lai visefektīvāk izmantotu kameras dinamisko klāstu, dažreiz tas var būt tik daudz rūpīgas izpratnes par fotosensora darba principu, cik daudz attīstīta mākslinieciskā.

Dinamiskie diapazona faktori

Dinamiskā diapazona apakšējo robežu nosaka tās paša fotoattēla trokšņa līmenis. Pat Unlit Matrix ģenerē fona elektrisko signālu, ko sauc par tumšu troksni. Arī iejaukšanās rodas, ja maksa tiek nodota analogajam līdz digitālajam pārveidotājam, un ADC pati ievieš noteiktu kļūdu digitalizētajā signālam - tā sauktajam. Trokšņa paraugu ņemšana.

Ja jūs uzņemat attēlu pilnā tumsā vai ar vāku uz objektīva, tad kamera ierakstīs tikai šo bezjēdzīgo troksni. Ja jūs atļaujiet minimālo gaismas skaitu, lai nokļūtu sensorā, fotodiodes sāks uzkrāt elektrisko lādiņu. No maksas vērtība, kas nozīmē intensitāti faktiskā signāla, būs proporcionāla skaitam uzņemto fotonu. Lai veiktu momentuzņēmumu, vismaz dažas nozīmīgas detaļas, ir nepieciešams, lai noderīgā signāla līmenis pārsniedz fona trokšņa līmeni.

Tādējādi dinamiskā diapazona apakšējā robeža vai, citiem vārdiem sakot, sensora jutības slieksni formāli var definēt kā izejas signāla līmeni, kurā signāls-trokšņa attiecība ir lielāka par ierīci.

Dinamiskā diapazona augšējo robežu nosaka atsevišķas fotodeodes konteiners. Ja ekspozīcijas laikā jebkura fotodiods uzkrāt elektrisko lādiņu par sevi, tad attēla pikseļi, kas atbilst pārslodzes fotodīdam, ir absolūti balta, un turpmāka apstarošana neietekmēs tās spilgtumu. Šo parādību sauc par izgriezumu. Jo augstāka ir fotodiodes frenētiskā spēja, jo lielāks signāls spēj dot izeju pirms piesātinājuma sasniedz.

Lai iegūtu lielāku skaidrību, mēs vēršamies pie raksturīgās līknes, kas ir atkarības izejas signāla grafiks no iedarbības. Uz horizontālās ass, binārais logaritms apstarošanu, kas iegūts sensors tiek atlikta, un uz vertikālo - bināro logaritmu lieluma elektriskā signāla, ko sensors, reaģējot uz šo apstarošanu. Mans zīmējums lielā mērā ir atkarīga no ārkārtīgi ilustratīviem nolūkiem. Pašreizējā fotoattēla raksturīgajai līknei ir nedaudz sarežģītāka forma, un trokšņa līmenis ir tik augsts.

Grafiks ir skaidri redzams divi kritiski stīvi punkti: pirmajā no tiem, līmenis noderīgā signāla šķērso trokšņa slieksni, un otrajā - fotodiodos sasniedz piesātinājumu. Iedarbības vērtības, kas atrodas starp šiem diviem punktiem, ir dinamisks diapazons. Šajā abstraktā piemērā tas ir vienāds ar to, cik viegli ir pamanāms, 5 ev, t.s. Kamera spēj sagremot piecus divkāršošanas iedarbību, kas ir līdzvērtīga 32x (2 5 \u003d 32) spilgtuma atšķirībā.

Iedarbības zonas, kas veido dinamisko diapazonu, ir nevienlīdzīgas. Augšējās zonas raksturo augstāks signāls-trokšņa attiecība, un tāpēc izskatās skaidrāks un detalizētāks nekā zemāks. Rezultātā dinamiskā diapazona augšējā robeža ir ļoti reāla un pamanāma - apgriešana ir iesaiņota gaismas pie mazākās pārmērīgas pārnesuma, bet zemākā robeža arvien vairāk griežas troksnī, un pāreja uz melnu krāsu ir tālu no tik sagriezta.

Lineārā atkarība no signāla no iedarbības, kā arī asu ienesīgumu uz plato, ir unikālas iezīmes digitālā fotogrāfijas procesu. Salīdzinājumam apskatiet tradicionālās fotoplinkas nosacīto raksturīgo līkni.

Līknes forma un jo īpaši slīpuma leņķis lielā mērā ir atkarīga no filmas veida un no tā izpausmes procedūras, bet galvenais, kas joprojām ir atšķirība starp filmu grafiku no digitālās - nelineārās dabas atkarības no Filmas optiskā blīvums no iedarbības vērtības paliek nemainīgas.

Negatīvās plēves fotoattēla platuma apakšējo robežu nosaka plīvums plīvuru un augšējo vienu - maksimālo iespējamo optisko blīvumu photocloor; Pagrieziet plēves - gluži pretēji. Gan ēnas, gan gaismās ir gludas raksturīgās līknes līknes, norādot kritumu kontrastu, tuvojoties dinamiskā diapazona robežām, jo \u200b\u200blīknes slīpuma leņķis ir proporcionāls attēla kontrastam. Tādējādi iedarbības zonas, kas atrodas grafika vidējā daļā, ir maksimālais kontrasts, bet gaismā un ēnās ir samazināts kontrasts. Praksē atšķirība starp filmu un digitālo matricu ir īpaši labi pamanāma gaismās: kur digitālajā attēlā gaismas tiek nodedzināta ar izgriezumu, daļas uz filmas joprojām ir atšķiramas, lai gan zema kontrasts, un Pāreja uz tīru baltu krāsu izskatās gluda un dabiska.

Sensitometrijā tiek izmantoti pat divi neatkarīgi noteikumi: Faktiski fotogrāfijas platumsierobežoja relatīvi lineāra raksturīgās līknes daļa, un noderīga fotogrāfiskā platuma, Papildus lineārajai sekcijai, arī bāzes un plecu grafiku.

Jāatzīmē, ka, apstrādājot digitālās fotogrāfijas, tā kā parasti piemēro vairāk vai mazāk izteiktas S formas līknes, kas palielina kontrastu halftonā pēc tā samazinājuma izmaksām Ēnu un gaismas, kas dod digitālo attēlu dabiskāks un patīkams acu izskats.

Burbulis

Atšķirībā no digitālās kameras matricas cilvēka vīzija ir savdabīga, pieņemsim, ka logaritmisks skats uz pasauli. Gaismas daudzuma secīgu dubultošana tiek uztverta kā vienādas izmaiņas spilgtumā. Gaismas numurus var pat salīdzināt ar muzikāliem oktāviem, jo \u200b\u200brumors kā viens mūzikas intervāls uztver divkāršu skaņas biežuma izmaiņas. Šis princips nodarbina citas sajūtas. Uztveres nelinearitāte ir ļoti paplašināta cilvēka jutības diapazonā līdz dažādu intensitātes stimulēšanai.

Pārveidojot neapstrādātu failu (tas nav svarīgi, kameras instrumenti vai RAW Converter), kas satur lineāros datus, tā sauktā automātiski attiecas uz to. Gamma līkne, kas ir paredzēta, lai nelineāli palielinātu digitālā attēla spilgtumu, vadot to atbilstoši cilvēka redzes īpatnībām.

Ar lineāro konversiju, attēls tiek iegūts pārāk tumšs.

Pēc gamma korekcijas spilgtums ir normāli.

Gamma līkne, jo tas stiept tumšus signālus un izspiež gaismu, padarot gradāciju sadalījumu vienveidīgāku. Rezultātā attēls iegūst dabisku izskatu, bet paraugu ņemšanas troksnis un artefakti ēnās neizbēgami kļūst pamanāmāka, ko lielā mērā saasina neliels skaits spilgtuma līmeņa zemākajās zonās.

Lineārā spilgtuma gradāciju sadalījums.

Vienota izplatīšana pēc gamma līknes piemērošanas.

ISO un dinamiskais diapazons

Neskatoties uz to, ka digitālajā fotogrāfijā, tas pats jēdziens fotosensitivitātes fotogrāfijas materiāla tiek izmantots kā filmas fotogrāfijā, ir jāsaprot, ka tas ir tikai tāpēc, ka tradīcijas tradīcijas, jo pieejas, lai mainītu fotosensitivitāti digitālā veidā un filmu fotogrāfija principā atšķiras.

ISO jutības uzlabošana tradicionālajā fotogrāfijā nozīmē aizstāt vienu filmu uz citu ar lielāku graudu, t.i. Foto materiālu īpašībās ir objektīvi mainīti. Digitālajā kamerā sensora jutība stingri nosaka tās fiziskās īpašības un to nevar mainīt burtiski. Pieaugot ISO, kamera nemaina sensora reālu jutību, bet tikai uzlabo sensora radīto elektrisko signālu, atbildot uz apstarošanu un pareizi pielāgo digitalizācijas algoritmu šim signālam.

Tā svarīga sekas ir samazināt efektīvu dinamisko diapazonu proporcionāli ISO palielināšanai, jo ar noderīgu signālu tiek uzlabots troksnis. Ja ISO 100 digitalizē visu signālu vērtību diapazonu - no nulles līdz piesātinājuma punktam, tad ar ISO 200, tikai puse no fotodiodes ir pieņemts maksimāli. Ar katru ISO jutības dubultošanu dinamiskā diapazona augšējais posms ir izslēgts, un atlikušie soļi ir pastiprināti tās vietā. Tāpēc Ultra augsto ISO vērtību izmantošana ir liegta praktiskā nozīme. Ar tādiem pašiem panākumiem jūs varat atvieglot fotoattēlu RAW Converter un iegūt līdzīgu trokšņa līmeni. Atšķirība starp ISO pieaugumu un mākslīgu attēla apgaismojumu ir tāds, ka ar pieaugošo ISO, signāla stiprināšana notiek pirms tā saņemšanas ADC, un tāpēc kvantēšanas troksnis nav uzlabots, atšķirībā no sensora trokšņa, RAW-CONVERTER, pastiprinājums ir pakļauts ADC kļūdām. Turklāt digitalizācijas diapazona samazināšanās nozīmē precīzāku atlikušo ieejas vērtību paraugu ņemšanu.

Starp citu, ISO ir pieejams dažās ierīcēs zem bāzes vērtības (piemēram, uz ISO 50), tas nepaziņo dinamisko diapazonu, un vienkārši atslābina signālu divreiz, kas ir vienāds ar momentuzņēmumu RAW Converter. Šo funkciju var pat uzskatīt par kaitīgu, jo ISO nepietiekamā vērtības izmantošana izraisa palātu, lai palielinātu iedarbību, kas ar atlikušo nemainīgo slieksni sensora, tas palielina risku, ka apgaismot gaismas.

Patiesais dinamiskais diapazons

Ir vairākas programmas, piemēram, (DXO analizators, imatest, rawdigger uc) ļauj izmērīt digitālās kameras dinamisko klāstu mājās. Principā tas nav liels nepieciešams, jo dati par lielāko kameru var brīvi atrast internetā, piemēram, uz DXOMARK.com tīmekļa vietnē.

Vai es uzskatu, ka šādu testu rezultāti? Diezgan. Ar vienīgo atrunu, ka visi šie testi ir definēti efektīvi vai, ja jūs varat izteikt to, tehnisko dinamisko diapazonu, ti. Attiecības starp piesātinājuma līmeni un matricas trokšņa līmeni. Fotogrāfam lietderīgais dinamiskais diapazons galvenokārt ir svarīgs, t.sk. Iedarbības zonu skaits, kas patiešām ļauj jums uzņemt kādu noderīgu informāciju.

Atceroties, dinamiskā diapazona slieksni nosaka fotoattēla novērotāja trokšņa līmenis. Problēma ir tā, ka praksē zemākas zonas formāli ienākošās dinamiskajā diapazonā, satur visu pārāk lielu troksni, lai tos varētu izmantot, lai tos izmantotu. Šeit daudz ir atkarīgs no individuālas saspiešanas - pieņemams trokšņa līmenis katram nosaka pats par sevi.

Mans subjektīvais viedoklis ir tāds, ka detaļas ēnās sāk izskatīties vairāk vai mazāk pienācīgas ar signāla / trokšņa attiecību vismaz astoņas. Pamatojoties uz to, es sev nodošu lietderīgu dinamisku diapazonu, kā tehnisko dinamisko diapazonu mīnus apmēram trīs soļus.

Piemēram, ja spoguļa kamerai saskaņā ar uzticamu testu rezultātiem ir dinamisks klāsts 13 EV, kas ir ļoti labs šodienas standartiem, tad tās lietderīgais dinamiskais diapazons būs aptuveni 10 ev, kas kopumā ir ļoti rūpīgi . Protams, mēs runājam par šaušanu neapstrādātā, ar minimālu ISO un maksimālo bitu. Fotografējot JPEG, dinamiskais diapazons ir atkarīgs no kontrasta iestatījumiem, bet vidēji divi vai trīs soļi ir jāiznīcina.

Salīdzinājumam: Krāsu tirgotiem fotoattēlu šāvieniem ir noderīgs fotoattēlu platums 5-6 soļiem; Melnās un baltās negatīvās filmas sniedz 9-10 soļus ar standarta izpausmes un drukāšanas procedūrām, un ar noteiktām manipulācijām - līdz 16-18 soļiem.

Apkopojot iepriekš minēto, mēs centīsimies formulēt dažus vienkāršus noteikumus, kas palīdzēs jums izspiest no jūsu kameras sensora maksimālā veiktspēja:

Digitālais diapazons digitālās kameras ir pilnībā pieejama tikai tad, ja fotografējot neapstrādātu.
Dinamiskais diapazons samazinās, palielinoties gaismas jutīgumam, un tāpēc izvairīties no augstām ISO vērtībām, ja nav asas nepieciešamības.
Izmantojot augstāku izlādi par neapstrādātiem failiem nepalielina patieso dinamisko diapazonu, bet uzlabo tonālo atdalīšanu ēnās dēļ vairāk Spilgtuma līmeņi.
Tiesības uz labo pusi. Augstākās ekspozīcijas zonas vienmēr satur maksimāli noderīga informācija Ar minimālu troksni un visefektīvāk jāizmanto. Tajā pašā laikā, jums nevajadzētu aizmirst par draudiem noķeršanas - pikseļi, kas sasnieguši piesātinājumu, ir absolūti bezjēdzīgi.

Un galvenais: nav jāuztraucas par kameras dinamisko klāstu. Ar dinamisku diapazonu, tas ir labi. Jūsu spēja redzēt gaismu un kompetenti pārvaldīt ekspozīciju, ir daudz svarīgāka. Labs fotogrāfs nesūdzos par fotogrāfisko platuma trūkumu, bet centīsies gaidīt ērtāku apgaismojumu vai mainīs leņķi, vai arī izmantos zibspuldzi, darbosies saskaņā ar apstākļiem. Es jums pastāstīšu vairāk: dažas ainas uzvarēja tikai tāpēc, ka tie neietilpst kameras dinamiskajā diapazonā. Bieži vien nevajadzīga daļa daļu ir vienkārši nepieciešams, lai paslēptu daļēji rīvētu melnā siluetā, kas padara fotoattēlu vienlaicīgi īslaicīgi un bagātākus.

Augsts kontrasts ne vienmēr ir slikts - jums tikai jāspēj strādāt ar to. Uzziniet, kā izmantot aprīkojuma trūkumus, kā arī tās priekšrocības, un jūs būsiet pārsteigti, cik daudz jūsu radošās iespējas paplašināsies.

Paldies par uzmanību!

Vasilijs A.

Pēcraksts

Ja raksts ir bijis noderīgs un informatīvs, jūs varat laipni atbalstīt projektu, dodot ieguldījumu tās attīstībā. Ja jums nepatika raksts, bet jums ir domas par to, kā padarīt to labāku, jūsu kritika tiks pieņemta bez mazāk pateicības.

Neaizmirstiet, ka šis raksts ir autortiesību objekts. Atkārtota izdrukāšana un citēšana ir atļauta, ja pastāvošā atsauce uz sākotnējo avotu, un izmantoto tekstu nedrīkst izvēlēties vai mainīt.

Cilvēki, kuri ir entuziasma ar pašdarināts skaņu, demonstrē interesantu paradoksu. Viņi ir gatavi bāzt klausīšanās telpu, veidot kolonnas ar eksotiskiem emitentiem, bet tie ir neērti priekšā mūzikas konservi, kā tad, ja vilks priekšā sarkano karogu. Un patiesībā, kāpēc nav iespējams izvēlēties izvēles rūtiņu izkļūt, un no konserviem mēģina pagatavot kaut ko ēdamāku?

Periodiski ir sūdzības par forumu: "konsultējiet labi ierakstītos albumus." Tas ir saprotams. Īpašas audiofila izdevumi, lai gan viņi iepriecinās pirmo minūti, bet neviens klausās galu, tas sāp repertuāru. Attiecībā uz pārējo fonoteku problēma šķiet acīmredzama. Jūs varat ietaupīt, bet jūs nevarat saglabāt un iztukšot naudas buzz par sastāvdaļām. Man joprojām nepatīk klausīties savu iecienītāko mūziku lielā apjomā un iespēju pastiprinātāju šeit.

Šodien, pat hi-res albumos, fonogrammas virsotnes un tilpums, kas brauc uz izgriezumu. Tiek uzskatīts, ka vairākums klausās mūziku katrā junk, un tāpēc ir nepieciešams "lūgt GAT", lai padarītu sava veida centību.

Protams, tas nav darīts īpaši, lai izjauktu audiofilus. Par viņiem parasti ir daži cilvēki atcerēties. Nu, izņemot to, ka viņi uzminējuši, lai ļautu kapteinim failus, ar kuriem galvenā asinsrite ir kopēta - CD, MP3, un tā tālāk. Protams, vednis jau sen ir saplacināts kompresors, neviens apzināti sagatavos īpašas versijas HD dziesmām. Ir tā, ka noteikta procedūra vinila pārvadātājam, kas šī iemesla dēļ un izklausās vairāk cilvēcīgi. Un digitālajam ceļam viss beidzas pats - liels biezs kompresors.

Tātad, šobrīd visi 100% no publicētajām fonogrammām, mīnus klasiskā mūzika, tiek pakļautas saspiešanai, kad meatsering. Kāds veic šo procedūru vairāk vai mazāk prasmīgi, un kāds ir pilnīgi stulba. Tā rezultātā, mums ir svētceļnieki uz forumiem ar līniju Dr spraudnis sinus, sāpīgi salīdzinājumi publikāciju, aizbēgt uz vinilu, kur jums ir nepieciešama arī galvenā Popper.

Visvairāk apsaldēts, redzot visu šīs neskaidrības, burtiski ieslēdza audio kurpes. Nav joks, viņi lasa skaņas avota Svēto Rakstu atpakaļ! Mūsdienu skaņas rediģēšanas programmām ir daži atjaunošanas rīks skaņu vilnisApcirpta.

Sākotnēji šī funkcionalitāte bija paredzēta studijām. Kad sajaucot, ir situācijas, kad clipping ir ieradusies rakstīt, un tas vairs nav iespējams pārtaisīt sesiju vairāku iemeslu dēļ, un šeit nāk uz atbalstu Arsenal Audio Editor - Decalipper, decompresors utt.

Un jau šādai programmatūrai visi drosmīgāki velk parasto klausītāju rokturus, kuriem pēc nākamās jaunuma ir asinis no ausīm. Kāds dod priekšroku izotopam, kāds Adobe klausīšanās, kāds operāciju akcijas starp vairākām programmām. Bijušās dinamikas atjaunošanas nozīme ir pareizi izlabot klipu pārklājuma signālu virsotnes, kas, balstoties 0 dB, atgādina pārnesumu.

Jā, aptuveni 100% Reech avota atdzimšana nenotiek, jo notiek interpolācijas procesi par diezgan spekulatīviem algoritmiem. Bet vēl, daži no pārstrādes rezultātiem šķita man interesanti un vērts mācīties.

Piemēram, Lana Del Rey albums "Lust for Life", konsekventi frowning, PAH, braukšana! Sākotnējā dziesmā "Kad pasaule bija karā, mēs turējām dejas" bija kā šis.

Un pēc vairākiem decalifipers un dekompresoriem tas kļuva par to. DR koeficients ir mainījies no 5 līdz 9. Lejupielādēt un klausīties paraugu pirms un pēc apstrādes.

Es nevaru teikt, ka metode ir universāla un ir piemērota visiem izvietotajiem albumiem, bet šajā gadījumā es dodu priekšroku savākšanai tieši šī opcija, kas tika ārstēta ar Rutraker aktīvistu, nevis oficiālu publikāciju 24 bitos.

Pat tad, ja mākslīgā pīķu izvilkšana no skaņas maltas nav atgriežas patieso dinamiku mūzikas sniegumu, jūsu DAC joprojām teikt paldies jums jebkurā gadījumā. Viņam bija tik grūti strādāt bez kļūdām pie robežvērtības līmeņos, kur tā saukto starpsmonisko virsnieku (ISP) varbūtība ir lieliska. Un tagad līdz 0 dB dope tikai retos signālraņus. Turklāt, izraisīja fonogrammu, kad saspiests FLAC vai citā bezzudumu kodekā tagad būs mazāks. Vairāk "gaisa" signālā ietaupa cietā diska vietu.

Mēģiniet atdzīvināt savus ienīdīgos albumus, kas nogalināti par "apjoma karu". Rezervētāja rezervei vispirms ir jānovērš sliežu ceļa līmenis -6 dB un pēc tam sākt atteikumu. Tie, kas neuzskata, ka datori var vienkārši stick starp CD atskaņotāju un pastiprinātāju Studio Expander. Šī ierīce Būtībā tas tiek darīts tādā pašā veidā - kā tas var atjaunot un izvelk virsotnes, kas saspiests pār audio signāla dinamiku. No 80-90 gadiem ir līdzīgas ierīces, kas nav ļoti dārgas, un kā eksperiments, izmēģiniet tos ļoti interesanti.

Dinamiskā diapazona kontrolieris DBX 3BX apstrādā signālu atsevišķi trīs svītras - LF, SC un RF

Kad izlīdzinātāji bija par pašsaprotamu audio sistēmas sastāvdaļu, un neviens no tiem nebaidījās. Šodien nav nepieciešams izlīdzināt magnētiskās lentes augstās frekvences, bet ar neglīto dinamiku ir nepieciešams atrisināt kaut ko, brāļus.

Dinamiskā kompresija (Dinamiskā diapazona kompresija, KDR) ir fonogrammas dinamiskā klāsta dinamiskā klāsta sašaurināšanās (vai paplašināšanās). Dinamiskais diapazonsTā ir atšķirība starp klusāko un skaļāko skaņu. Dažreiz visvairāk klusā fonogrammā būs skaņa maz skaļi līmeņa troksni, un dažreiz mazliet klusāka no skaļāk skaļāk. Aparatūras ierīces un programmas, kas veic dinamisku saspiešanu sauc kompresori, izceļot četras galvenās grupas: kompresori, ierobežotājs, paplašinātāji un vārti.

Lampas analogais kompresors DBX 566

Samazināts un veicinot saspiešanu

Saspiešana (Lejupejošais saspiešana) samazina skaņas skaļumu, kad tas sāk pārsniegt noteiktu sliekšņa vērtību, klusāka atstāšana nemainās. Extreme iespēja zemākas saspiešanas ir ierobežotājs. Uzlabošanas kompresija (Augšupejoša saspiešana), gluži pretēji, palielina skaņas skaļumu, ja tas ir zem sliekšņa, neietekmējot vairāk skaļas skaņas. Tajā pašā laikā abu veidu kompresijas sašaurinātu audio signāla dinamisko diapazonu.

Saspiešana

Uzlabošanas kompresija

Expander un Gate

Ja kompresors samazina dinamisko diapazonu, tas palielina to. Kad signāla līmenis kļūst virs sliekšņa līmeņa, paplašinājums palielina to vēl vairāk, tādējādi palielinot atšķirību starp skaļām un klusām skaņām. Šādas ierīces bieži izmanto, ierakstot cilindra uzstādīšanu, lai atdalītu dažu bungu skaņas no citiem.

APVIENOTĀ APRAKSTS, kas netiek izmantots nevis, lai uzlabotu skaļi, un izžāvēt klusās skaņas, kas nepārsniedz sliekšņa vērtības līmeni (piemēram, fona troksni), tiek saukta Trokšņa vārti.. Šādā ierīcē, tiklīdz skaņas līmenis kļūst mazāks par slieksni, signāla caurlaide tiek pārtraukta. Parasti vārti tiek izmantoti, lai apspiestu troksni pauzes. Dažos modeļos to var izdarīt, lai skaņa, kad sliekšņa līmenis neapstājas strauji, bet pakāpeniski viesabonēts. Šādā gadījumā vājināšanās ātrumu nosaka samazinājuma regulators (lejupslīde).

Vārtiem, tāpat kā citu veidu kompresori, varbūt atkarīgs no biežuma atkarīgs (I.E., dažādos veidos, lai apstrādātu noteiktas frekvenču joslas) un var darboties režīmā sānu ķēde. (Skatīt zemāk).

Kompresora darbības princips

Signāls, kas nonāk kompresorā, ir sadalīts divās kopijās. Viens eksemplārs tiek nosūtīts uz pastiprinātāju, kurā pastiprinājuma pakāpe tiek kontrolēta ar ārēju signālu, otrā kopija veido šo signālu. Tas ievada ierīci, ko sauc par sānu ķēdi, kur mēra signālu, un aploksne ir izveidota, pamatojoties uz šiem datiem, kas apraksta tās apjoma izmaiņas.
Tātad vismodernākie kompresori ir sakārtoti, tas ir tā sauktais barošanas veids. Vecākajās ierīcēs (atgriezeniskās saites) signāla līmenis tiek mērīts pēc pastiprinātāja.

Ir dažādas analogās kontroles tehnoloģijas (mainīgā guvumu pastiprināšana), katrs ar tās priekšrocībām un trūkumiem: lampas, optiskie, izmantojot fotorezistāru un transistum. Strādājot ar digitālo audio (skaņas redaktoru vai DAW), var izmantot savus matemātiskos algoritmus vai var ievadīt analogo tehnoloģiju darbību.

Kompresoru galvenie parametri

Slieksnis.

Kompresors samazina audio signālu, ja tās amplitūda primaries ir īpaša sliekšņa vērtība (slieksnis). To parasti norāda decibelos, ar zemāku slieksni (piemēram, -60 dB) nozīmē, ka skaņa tiks apstrādāta nekā ar augstāku slieksni (piemēram, -5 dB).

Attiecība.

Līmeņa samazinājuma pakāpi nosaka attiecība parametrs: attiecība 4: 1 nozīmē, ka, ja ieejas līmenis ir 4 dB pārsniedz slieksni, izejas līmenis būs augstāks par slieksni līdz 1 dB.
Piemēram:
Slieksnis \u003d -10 dB
Ievades signāls \u003d -6 dB (uz 4 dB virs sliekšņa)
Izejas signāls \u003d -9 dB (uz 1 dB virs sliekšņa)

Ir svarīgi paturēt prātā, ka signāla līmeņa nomākšana turpinās un kādu laiku pēc tam, kad tas samazinās zem sliekšņa līmeņa, un šo laiku nosaka parametru vērtība atbrīvot.

Saspiešana ar maksimālo vērtību attiecību ∞: 1 sauc par ierobežošanu. Tas nozīmē, ka jebkurš signāls virs sliekšņa līmeņa tiek nomākts pirms sliekšņa līmeņa (izņemot īsu laiku pēc straujas ieejas apjoma pieauguma). Sīkāku informāciju skatiet zemāk "Limiter".

Dažādu attiecību vērtības piemēri

Uzbrukums un atbrīvošana

Kompresors nodrošina noteiktu kontroli pār to, cik ātri tas reaģē uz mainot signālu dinamiku. Uzbrukuma parametrs nosaka laiku, par kuru kompresors samazina peļņas koeficientu līdz līmenim, ko nosaka attiecība parametru. Atlaidiet laiku, par kuru kompresors, gluži pretēji, palielina peļņas koeficientu vai atgriežas normālā stāvoklī, ja ieejas signāla līmenis pazeminās zem sliekšņa vērtības.

Uzbrukuma un atbrīvošanas fāzes

Šie parametri norāda laiku (parasti milisekundēs), kas būs nepieciešams, lai mainītu stiprināšanu uz noteiktu daudzuma decibelu, parasti ir 10 dB. Piemēram, šajā gadījumā, ja uzbrukums ir iestatīts uz 1 ms, lai samazinātu pieaugumu par 10 dB, būs nepieciešama 1 dalībvalstis, un 20 dB - 2 ms.

Daudzos kompresoros var konfigurēt uzbrukumu un atbrīvošanas parametrus, bet dažos tos sākotnēji tiek noteikti un nav regulēti. Dažreiz tie ir apzīmēti kā "automātiska" vai "programma" ,.e. atšķiras atkarībā no ievades signāla.

Ceļgals.

Vēl viens kompresoru parametrs: ciets / mīkstais ceļgals. Tas nosaka, vai kompresijas piemērošanas sākums ir asa (cieta) vai pakāpeniska (mīksta). Mīkstais ceļš samazina pārejas slūžu no neapstrādāta signāla uz signālu, kas pakļauts saspiešanai, jo īpaši augstu attiecību vērtības un strauju apjomu palielinās.

Ciets ceļgala un mīksta ceļa saspiešana

Peak un RMS.

Kompresors var reaģēt uz maksimālo (īstermiņa maksimālo) vērtībām vai vidējā ieejas līmenī. Maksimālo vērtību izmantošana var izraisīt asas svārstības pakāpē kompresijas, un pat izkropļojumiem. Tāpēc kompresori izmanto vidējo funkciju (parasti tas ir RMS) ievades signāls, salīdzinot to ar sliekšņa vērtību. Tas dod ērtāku saspiešanu, tuvu cilvēka uztverei.

RMS ir parametrs, kas atspoguļo fonogrammas vidējo apjomu. No matemātiskā viedokļa RMS (saknes vidējais kvadrātveida) ir noteikta skaita paraugu amplitūdas RMS vērtība:

Stereo savienošana.

Kompresors stereo savienojošā režīmā piemēro to pašu ieguvumu gan stereo kanāliem. Tas novērš stereopanoramas pārvietošanu, kas var būt kreiso un pareizo kanālu individuālās apstrādes rezultāts. Šāda pārvietošana notiek, ja, piemēram, jebkurš skaļu elements nav centrā.

Aplauzums pieaugums.

Tā kā kompresors samazina kopējo signāla līmeni, parasti ir pievienota fiksētā peļņa pie izejas, kas ļauj iegūt optimālu līmeni.

SKATIES UZ PRIEKŠU.

Paskatīšanās funkcija ir paredzēta, lai atrisinātu problēmas, kas raksturīgas gan pārāk lielām, gan pārāk mazām vērtībām, kas uzbrūk un atbrīvo. Pārāk daudz uzbrukumu neļauj jums efektīvi pārtvert pārejas, bet pārāk mazs var nebūt ērti klausītājam. Lietojot izskatu funkciju, galvenais signāls ir aizkavēts salīdzinājumā ar kontrolieri, tas ļauj sākt saspiešanu iepriekš, pat pirms signāla sasniedz sliekšņa vērtību.
Šīs metodes vienīgais trūkums ir signāla aizture, kas dažos gadījumos nevēlams.

Dinamiskas kompresijas izmantošana

Kompresija tiek izmantota visur, ne tikai mūzikas fonogrammās, bet arī visur, kur jums ir nepieciešams palielināt kopējo apjomu, nepalielinot maksimālo līmeni, kur tiek izmantota lēta skaņas reproducēšanas iekārta vai ierobežota pārraides kanāls (brīdinājuma sistēma, amatieru radio, utt.).

Kompresija tiek izmantota, spēlējot fona mūzika (veikalos, restorānos utt.), Ja kādas pamanāmas apjoma izmaiņas ir nevēlamas.

Bet svarīgākais dinamiskās saspiešanas piemērošanas apjoms ir mūzikas ražošana un apraide. Kompresija tiek izmantota, lai sniegtu "blīvuma" un "disku" skaņu labākai instrumentu kombinācijai viens ar otru, un jo īpaši, apstrādājot vokālu.

Vokālās partijas rock un popmūzikā parasti ir pakļautas kompresijai, lai tos izceltu uz pavadījuma fona un pievienotu skaidrību. Īpaša kompresora veids, kas konfigurēts tikai noteiktās frekvencēs - Groice, tiek izmantota, lai nomāktu hissing fonu.

Inestālās partijās kompresija tiek izmantota arī iedarbībai, kas nav tieši saistīta ar tilpumu, piemēram, strauji izbalējis bungu skaņas var kļūt ilgstošākas.

Elektroniskā deju mūzikā (EDM), sānu chaning bieži izmanto (skatīt zemāk) - piemēram, basu līniju var kontrolēt ar barelu vai kaut kas līdzīgs, lai novērstu konfliktu bass un bungas un radīt dinamisku pulsāciju.

Kompresija tiek plaši izmantota apraides pārraides (radio, televīzijas, interneta apraides), lai palielinātu uztveramo apjomu, vienlaikus samazinot dinamisko avota audio klāstu (parasti CD). Lielākajai daļai valstīs ir juridiski ierobežojumi uz tūlītējo maksimālo tilpumu, ko var pārraidīt. Parasti šos ierobežojumus īsteno pastāvīgi aparatūras kompresori ēteriskajā ķēdē. Turklāt pieaugums uztveramā apjoma uzlabo "kvalitāti" skaņas no viedokļa lielākā daļa klausītāju.

Skatīt arī Skaļuma karš.

Tās pašas dziesmas tilpuma konsekvents pieaugums no 1983. līdz 2000. gadam.

Side-chanings

Vēl viens bieži atrasts kompresoru slēdzis ir "sānu ķēde". Šajā režīmā audio saspiešana nenotiek atkarībā no tā paša līmeņa, bet atkarībā no signāla līmeņa ievadīšanas savienotāju, kas tik parasti sauc - sānu ķēdi.

To var atrast vairākus pieteikumus. Piemēram, vokālists Shepelvit un visi burti "C" izceļas no kopējā attēla. Jūs izlaidāt savu balsi caur kompresoru, un sānu ķēdes savienotājs kalpo tai pašai skaņai, bet izlaista caur ekvalaizeri. No ekvalaizera jūs noņemat visas frekvences, izņemot tos, ko vokālists izmanto, izrunājot burtu "C". Parasti aptuveni 5 kHz, bet var būt no 3 kHz līdz 8 kHz. Ja pēc tam ievietojiet kompresoru sānu ķēdes režīmā, tad balss saspiešana notiks šajos momentos, kad vēstule "C" tiek izrunāts. Tādējādi izrādījās, ka ierīce pazīstama kā "Groeer" (de-Esser). Šo darba metodi sauc par "frekvenci atkarīgu" (frekvence atkarīga).

Vēl viena šīs funkcijas izmantošana tiek saukta par "ducker". Piemēram, radio stacijā mūzika iet caur kompresoru un DJ vārdiem - caur sānu ķēdi. Kad DJ sāk čatā, mūzikas apjoms tiek automātiski samazināts. Šo efektu var veiksmīgi izmantot ierakstos, piemēram, samazināt tastatūras partiju apjomu dziedāšanas laikā.

Ķieģeļu sienas ierobežošana

Kompresors un ierobežotājs ir aptuveni tāds pats, var teikt, ka ierobežotājs ir augsts attiecība kompresors (no 10: 1) un, parasti, zems uzbrukuma laiks.

Ir ķieģeļu sienas ierobežojošā koncepcija - ļoti augsta attiecība ierobežošana (no 20: 1 un vairāk) un ļoti ātrs uzbrukums. Ideālā gadījumā tas neļauj signālu pārsniegt sliekšņa līmeni. Rezultāts būs nepatīkams baumas, bet tas novērsīs bojājumus skaņas reproducēšanas tehnoloģiju vai lieko kanālu joslas platumu. Daudzi ražotāji šim nolūkam integrē ierobežotāja ierīces.

Clipper vs. Ierobežotājs, mīksts un ciets griezums

Šī metožu grupa ir balstīta uz faktu, ka nosūtītie signāli ir pakļauti nelineārām amplitūdas transformācijām, un pārraidot un saņemot nelinearitātes daļas. Piemēram, ja raidītājs izmanto nelineāru funkciju ÖU, uztvērējā - U 2. Konversentu funkciju konsekventa piemērošana novedīs pie tā, ka kopumā transformācija joprojām ir lineāra.

Nelineāro datu saspiešanas metožu ideja tiek samazināta līdz faktu, ka raidītājs var dot lielāku izmaiņu klāstu pārraidītajā parametrā ar tādu pašu izejas signālu amplitūdu (tas ir, lielāks dinamiskais diapazons). Dinamiskais diapazons - Tas ir izteikts relatīvās vienībās vai decibellah attieksmē no vislielākā pieļaujamā signāla amplitūda uz mazāko:

;	(2.17)
.	(2.18)

Dabas vēlme palielināt dinamisko diapazonu, samazinot U min, ierobežo iekārtu jutīgums un traucējumu ietekme un savs troksnis.

Visbiežāk dinamiskā diapazona saspiešana tiek veikta, izmantojot pāris konverģentu logaritmīgas un potenciālās funkcijas. Tiek saukta pirmā amplitūdas mainīšanas darbība kompresija(saspiešana), otrais - paplašināšana (stiepšanās). Šo funkciju izvēle ir saistīta ar vislielāko kompresijas spēju.

Tajā pašā laikā šīm metodēm ir trūkumi. Pirmais no tiem ir tas, ka neliela skaita logaritms ir negatīvs un robežās:

tas ir, jutība ir ļoti nelineāra.

Lai samazinātu šos trūkumus, abas funkcijas tiek modificētas ar kompensāciju un tuvināšanu. Piemēram, telefona kanāliem tuvinātā funkcija ir saistīta (A tips):

un a \u003d 87.6. Ieguvums no saspiešanas ir 24db.

Datu saspiešana ar nelineārām procedūrām īsteno analogās iekārtas ar lielām kļūdām. Digitālo instrumentu izmantošana var ievērojami uzlabot transformācijas precizitāti vai ātrumu. Tajā pašā laikā, tieša līdzekļu izmantošana datortehnika (Tas ir, tiešs aprēķins logaritmi un eksponenciāli) nesniegs labāku rezultātu dēļ ar zemu ātrumu un uzkrājot aprēķinu kļūdu.

Datu saspiešana ar kompresijas sakarā ar precizitātes ierobežojumiem tiek izmantots neatbildēšanas gadījumos, piemēram, lai pārraidītu runu pa telefonu un radio kanāliem.

Efektīva kodēšana

Efektīvie kodi tika piedāvāti Sundon, Fano un Hafman. Par kodu būtība ir tāda, ka tie ir nevienmērīgi, tas ir, ar citu kategoriju izlādes, un koda garums ir apgriezti proporcionāls varbūtībai tās izskatu. Vēl viena ievērojama efektīva kodu iezīme - viņiem nav nepieciešami separatori, tas ir, īpašas rakstzīmes, kas atdala kaimiņu kodu kombinācijas. Tas tiek panākts, ievērojot vienkāršs noteikums: Īsāki kodi nav ilgāk. Šajā gadījumā stabila plūsma bināro izplūdes ir unikāli dekodēts, jo dekodētājs atklāj īsāko kodu kombinācijas vispirms. Efektīvie kodi ilgu laiku bija tīri akadēmiski, bet nesen izmantoti datu bāzu veidošanā, kā arī saspiežot informāciju mūsdienu modemos un programmatūras arhitektos.

Nevienmērības dēļ tiek ieviests vidējais koda garums. Vidējs garums - koda garuma matemātiskā cerība:

turklāt, L CP mēdz H (x) no augšas (tas ir, l -\u003e h (x)).

Nosacījuma (2.23.) Īstenošana tiek uzlabota, palielinot N.

Ir divas efektīvu kodu šķirnes: Shannon Fano un Hafman. Apsveriet to kvīti par piemēru. Pieņemsim, ka secības rakstzīmju varbūtības ir 2.1. Tabulā norādītās nozīmes.

2.1. Tabula.

Simbolu varbūtības

N.
P I.	0.1	0.2	0.1	0.3	0.05	0.15	0.03	0.02	0.05

Simboli ir ierindoti, tas ir, viņi meklē pēc kārtas uz dilstošā varbūtību. Pēc tam, saskaņā ar Shennon Fano metodi, šāda procedūra tiek periodiski atkārtota: visa grupa pasākumu ir sadalīta divās apakšgrupās ar tādu pašu (vai aptuveni vienādas) kopējās varbūtības. Procedūra turpinās līdz vienam elementam paliek nākamajā apakšgrupā, pēc tam šis elements tiek likvidēts, un ar atlikušajām šīm darbībām turpināsies. Tas notiek līdz pēdējās divas apakšgrupas paliek viens elements. Turpiniet apsvērt mūsu piemēru, kas ir samazināts 2.2. Tabulā.

2.2. Tabula.

Chennon Fano metode

N.	P I.
4	0.3		I.
	0.2	I.	II.
6	0.15		I.	I.
	0.1			II.
1	0.1			I.	I.
9	0.05	II.			II.
5	0.05		II.		I.
7	0.03			II.	II.	I.
8	0.02					II.

Kā redzams no 2.2 tabulas, pirmais simbols ar varbūtību P 4 \u003d 0,3 piedalījās divās nodalīšanas procedūrās, un abas reizes sasniedza grupu ar numuru i. Saskaņā ar to tas tiek kodēts ar divu bitu kodu II. Otrais elements nodalījuma pirmajā posmā piederēja I grupai, otrajā - II grupā. Tāpēc tā kodekss 10. Pārējo rakstzīmju kodiem papildu komentāros nav nepieciešams.

Parasti nevienmērīgi kodi ir attēloti kodu koku veidā. Kodu koks ir grafiks, kas norāda atļauto kodu kombinācijas. Iepriekš norādiet šīs diagrammas ribu virzienus, kā parādīts 2.11. Attēlā (virzienu izvēle ir patvaļīga).

Grafiks tiek vadīts šādi: veido maršrutu veltīta simbols; No izplūdes par to ir vienāda ar malu skaitu maršrutā, un katra izlādes vērtība ir vienāda ar virzienu atbilstošo ribu. Maršruts tiek veidots avota punkts (zīmējumā tas ir atzīmēts ar burtu a). Piemēram, maršruts uz virsotni 5 sastāv no piecām ribām, no kurām viss, papildus pēdējai, ir virziens 0; Mēs saņemam kodu 00001.

Aprēķiniet par šo piemēru entropiju un vārda vidējo garumu.

H (x) \u003d - (0,3 Žurnāls 0,3 + 0,2 log 0.2 + 2 0.1 Log 0.1+ 2 0.05 Log 0.05+

0,03 log 0,03 + 0.02 log 0.02) \u003d 2,23 biti

l CP \u003d 0,3 2 + 0,2 2 + 0,15 3 + 0,1 3 + 0,1 4 + 0,1 3 + 0,14 + 0.05 5 +0.05 4+

0.03 6 + 0.02 6 = 2.9 .

Kā redzams, vidējā garums vārds ir tuvu entropijai.

Hafman kodi ir veidoti uz citu algoritmu. Kodēšanas procedūra sastāv no diviem posmiem. Pirmajā posmā ir konsekventi vienreizējs alfabēta saspiešana. Vienreizējs saspiešana ir aizvietošana pēdējās divas rakstzīmes (ar zemākām varbūtībām), ar kopējo varbūtību. Kompresija tiek veikta, līdz paliek divas rakstzīmes. Tajā pašā laikā aizpildiet kodēšanas tabulu, kurā iegūtās varbūtības tiek piestiprinātas, kā arī attēlo maršrutus, kuriem nākamajā posmā pārvietojas jaunas rakstzīmes.

Otrajā posmā, kodēšana pati rodas, kas sākas no pēdējā posma: pirmā no diviem rakstzīmēm piešķir kodu 1, otrais - 0. Pēc tam, dodieties uz iepriekšējo posmu. Līdz simboliem, kas nepiedalījās kompresijā šajā posmā, atribūta kodi no nākamā posma, un divām jaunākajām rakstzīmēm divreiz atribūtu simbola kodu, kas iegūts pēc līmēšanas, un pievienojiet augšējo simbolu kodu 1, zemāks - 0. Ja Simbols ir tālāk līmēšanas piedalās, tā kodekss paliek nemainīgs. Procedūra turpina beigties (tas ir, līdz pirmajam posmam).

2.3. Tabula parāda kodēšanu pa Hafman algoritmu. Kā redzams no galda, kodēšana tika veikta 7 posmos. Kreisajā pusē ir rakstzīmju, labo - starpposma kodu varbūtības. Bultiņas rāda pārvietojas jaunizveidotās rakstzīmes. Katrā posmā pēdējās divas rakstzīmes atšķiras tikai ar jaunāko izlādi, kas atbilst kodēšanas metodei. Mēs aprēķinām vidējo vārdu:

l CF \u003d 0,3 2 + 0,2 2 + 0,15 3 ++ 2 0.1 3 + +0,05 4 + 0,05 5 + 0,03 6 + 0.02 6 \u003d 2.7

Tas ir vēl tuvāk entropijai: kods ir vēl efektīvāks. Att. 2.12 rāda Hafman kodu koku.

2.3. Tabula.

Kodēšana uz Hafman algoritma

N.	P I.	kods	I.	II.	III	Iv.	V.	Vi	Vii
	0.3		0.3 11	0.3 11	0.3 11	0.3 11	0.3 11	0.4 0	0.6 1
	0.2		0.2 01	0.2 01	0.2 01	0.2 01	0.3 10	0.3 11	0.4 0
	0.15		0.15 101	0.15 101	0.15 101	0.2 00	0.2 01	0.3 10
	0.1		0.1 001	0.1 001	0.15 100	0.15 101	0.2 00
	0.1		0.1 000	0.1 000	0.1 001	0.15 100
	0.05		0.05 1000	0.1 1001	0.1 000
	0.05		0.05 10011	0.05 1000
	0.03		0.05 10010
	0.02

Abi kodi atbilst dekodēšanas unikalitātes prasībām: kā redzams no tabulām, īsākas kombinācijas nav ilgāku kodu sākums.

Ar pieaugošu simbolu skaitu, kodu efektivitāte palielinās, tāpēc dažos gadījumos kodētu lielākus blokus (piemēram, ja mēs runājam par tekstiem, jūs varat kodēt dažas no visbiežāk sastopamajām zilbēm, vārdiem un pat frāzēm).

Šādu kodu ieviešanas efekts tiek noteikts, salīdzinot ar vienotu kodu: \\ t

(2.24)

kur n ir vienotu kodu izplūdes skaits, ko aizstāj ar efektīvu.

Khafman kodu modifikācijas

Klasiskais Hafman algoritms attiecas uz diviem caurlaidīgiem, ti. Nepieciešams sākotnējais statistikas kopums par simboliem un ziņojumiem, un pēc tam iepriekš aprakstītās procedūras. Tas ir neērti praksē, jo tas palielina apstrādes laiku ziņu un uzkrāšanās vārdnīcu. Viena caurlaides metodes, kurās ir apvienotas uzkrāšanas un kodēšanas procedūras. Šādas metodes sauc arī adaptīvā kompresija pa Hafmanu [46].

Adaptīvā kompresijas būtība visā HAFMānā ir samazināta līdz sākotnējā koda koka būvniecībai un tā konsekventai modifikācijai pēc katra nākamā simbola saņemšanas. Tāpat kā iepriekš, koki šeit ir bināri, t.i. No katra virsotnes grafika - koksne, ne vairāk kā divas loki. Tas ir ierasts, lai izsauktu sākotnējo virsotni, un abi saistītie nākamie virsotnes - bērni. Mēs iepazīstinām ar Vertex svara jēdzienu - tas ir rakstzīmju skaits (vārdi), kas atbilst šim virsotnei, kas iegūts, kad tiek piemērota sākotnējā secība. Acīmredzot bērnu skalu summa ir vienāda ar vecāku svaru.

Pēc ievadot nākamo simbolu ievades secību, kodu koks ir pārskatīts: virsotņu svari tiek pārrēķināti un, ja nepieciešams, virsotnes ir pārkārtoti. Vērtējumu pārkārtošanas noteikums šādi: apakšējo virsņu svari ir mazākākie, un virsraksti, kas palikuši uz kolonnas, ir mazākākie svari.

Tajā pašā laikā virsotnes ir numurētas. Numerācija sākas ar zemāku (piekārtiem, t.i., kam nav bērnu) virsotnes no kreisās uz labo pusi, tad pārnests uz augstākais līmenis utt uz pēdējo, avota virsotni. Tajā pašā laikā tiek sasniegts šāds rezultāts: mazāk svara virsotne, jo mazāk tās numuru.

Permutācija tiek veikta galvenokārt karājas virsotnēm. Kad permutācija tiek uzskatīts par formulēto noteikumu: topi ar augstu svaru ir lielāks skaitlis.

Pēc kārtas nokārtošanas (to sauc arī par kontroli vai testu), kodu kombinācijas tiek piešķirtas visiem piekārtiem virsotnēm. Noteikumu uzdevuma noteikums ir līdzīgs iepriekš minētajam: Kodu izlādes skaits ir vienāds ar virsotņu skaitu, caur kuru maršruts iet no avota līdz šim piekārtiem virsotnei, un konkrētas izlādes vērtība atbilst vecāka virzienam "Bērns" (teiksim, pāreja uz kreiso pusi no mātes atbilst vērtībai 1, pa labi - 0).

Iegūtās koda kombinācijas tiek ievadītas kompresijas ierīces atmiņā kopā ar to analogiem un veido vārdnīcu. Algoritma izmantošana ir šāda. Rakstzīmju saspiežamā secība ir sadalīta fragmentos saskaņā ar esošo vārdnīcu, pēc kura katrs fragments tiek aizstāts ar tās kodu no vārdnīcas. Fragmenti, kas nav konstatēti vārdnīcā, veido jaunas piekaramās virsotnes, iegūst svaru un tiek ievadīti arī vārdnīcā. To veido adaptīvs algoritms vārdnīcas papildināšanai.

Lai palielinātu metodes efektivitāti, ir vēlams palielināt vārdnīcas lielumu; Šajā gadījumā saspiešanas koeficients pieaug. Praktiski vārdnīcas izmērs ir 4 - 16 kB atmiņas.

Mēs ilustrējam piemēru algoritmu. Att. 2.13 Parāda avota diagrammu (to sauc arī ar Hafman koku). Katru virsotni koka rāda taisnstūrī, kurā divi cipari ir ierakstīti caur frakciju: pirmais nozīmē virsotņu skaitu, otrais ir tās svars. Kā jūs varat pārliecināties, ka ir izpildīti VERSIC svari un to skaitļi.

Pieņemsim, ka simbols, kas atbilst Vertex 1, testa secībā tikās ar sekundāro. No virsotņu svars mainījās, kā parādīts 1. attēlā. 2.14, kā rezultātā, skaits numerācijas virsotne tiek pārkāptas. Nākamajā posmā mēs mainām izkārtojumu piekārtiem virsotnēm, par kurām mēs mainām 1. un 4. virsotni un renerbers visas koka virsotnes. Iegūtais grafiks ir parādīts 1. attēlā. 2.15. Pēc tam procedūra turpinās līdzīgi.

Jāatceras, ka katrs piekaramais maksimums Hafmana kokā atbilst konkrētam simbolam vai viņu grupai. Vecāks ir atšķirīgs no bērniem ar to, ka rakstzīmju grupa, tas ir piemērots viņam, par vienu simbolu īsā laikā, nekā viņa bērni, un šie bērni atšķiras pēdējā simbolā. Piemēram, vecāki atbilst simboliem "auto"; Tad bērni var būt "kara" un "karpas" sekvences.

Iepriekšminētais algoritms nav akadēmiski un tiek aktīvi izmantots programmās - arhīzijās, tostarp saspiežot grafiskos datus (tie tiks apspriesti zemāk).

Lempel - Ziva algoritmi

Tie ir visbiežāk izmantotie kompresijas algoritmi. Tos izmanto lielākajā daļā programmu - arhitikas (piemēram, Pkzip. Arj, LHA). Algoritmu būtība ir tāda, ka daži rakstzīmju komplekti tiek aizstāti ar arhivējot to speciāli radītā vārdnīcā. Piemēram, bieži atrodams frāzes "uz jūsu vēstules izejošā numura lietās ..." var ieņemt vārdnīcu stāvoklī 121; Tad, tā vietā, lai pārsūtītu vai uzglabātu minēto frāzi (30 baiti), jūs varat uzglabāt frāzes numuru (1,5 baiti binārā decimālā formā vai 1 baitā - binārā).

Algoritmi tiek nosaukti pēc autoriem, kuri pirmo reizi piedāvāja tos 1977. gadā. No tiem, pirmais - LZ77. Arhivēšanai tā sauktais bīdāmās logs, kas sastāv no divām daļām. Pirmā daļa, lielāks formāts, kas kalpo, lai veidotu vārdnīcu un ir vairāku kilobītu secība. Otrajā daļā (parasti līdz 100 baitu) tiek pieņemti ar skatāmā teksta pašreizējās rakstzīmes. Algoritms mēģina atrast vārdnīcā rakstzīmju komplektā sakrīt ar skatīto logu. Ja ir iespējams, tiek ģenerēts kods, kas sastāv no trim daļām: pārvietojums vārdnīcā par tās sākotnējo substring, šīs substrācijas garums blakus šī substrāta raksturs. Piemēram, īpaša substrāts sastāv no simboliem "pieteikuma" (tikai 6 rakstzīmes), šāds simbols ir "E". Tad, ja substring ir adrese (vieta vārdnīcā) 45, tad ierakstu vārdnīcā ir forma "45, 6. E". Pēc tam loga saturs pāriet uz stāvokli, un meklēšana turpinās. Tādējādi veidojas vārdnīca.

Algoritma priekšrocība ir viegli formalizēts algoritms vārdnīcas apkopošanai. Turklāt ir iespējams unzip un bez sākotnējās vārdnīcas (tas ir vēlams, lai būtu testa secība) - vārdnīcu veidojas procesā unimber.

Algoritma trūkumi parādās, palielinot vārdnīcas lielumu - laiks, lai meklēšanas pieaug. Turklāt, ja pašreizējā logā trūkst rakstzīmju virkne, katrs simbols ir rakstīts uz trīs elementu kodu, t.i. Izrādās, ka nav kompresijas, bet stiepjas.

Labākās iezīmes Tai ir 1978. gadā ierosinātais LZSS algoritms. Tai ir atšķirības, saglabājot bīdāmo logu un kompresora izejas kodus. Papildus logam algoritms veido bināro koku, līdzīgi HAFMan kokam, lai paātrinātu kolektoru meklēšanu: katrs substring atstājot pašreizējo logu, ko kokam pievieno kā vienu no bērniem. Šāds algoritms ļauj jums vēl vairāk palielināt pašreizējā loga lielumu (vēlams, ka tās vērtība ir vienāda ar divu: 128, 256 uc baitu). Sekvences kodi tiek veidoti arī atšķirīgi: 1-bit prefikss papildus tiek ieviests, lai atšķirtu nenovirzītās rakstzīmes no pāriem "nobīde, garums".

Vēl lielāka saspiešana tiek iegūta, izmantojot LZW tipa algoritmus. Iepriekš aprakstītajiem algoritmiem ir fiksēts loga izmērs, kas noved pie neiespējamības ievadīt frāžu vārdnīcā ir garāks par loga izmēru. LZW algoritmos (un to priekštecei LZ78) skata logam ir neierobežots izmērs, un vārdnīca uzkrājas frāzi (nevis kopumu rakstzīmes kā iepriekš). Vārdnīcā ir neierobežots garums, un kodētājs (dekodētājs) darbojas gaidīšanas režīmā. Kad frāze, kas sakrīt ar vārdnīcu veidojas, tiek izdots sakritības kods (I.E. kodu šīs frāzes vārdnīcā) un kodu nākamā simbola aiz tā. Ja kā simboli uzkrāj jaunu frāzi veidojas, tas tiek ievadīts arī vārdnīcā, kā īsāko vienu. Tā rezultātā veidojas rekursīva procedūra, nodrošinot ātru kodējumu un dekodēšanu.

Papildu iespēja Kompresija nodrošina saspiestu atkārtotu rakstzīmju kodējumu. Ja secībā dažas rakstzīmes seko pēc kārtas (piemēram, tekstā tas var būt "Space" rakstzīmes, skaitliskā secībā - plūstošās nulles uc), ir lietderīgi aizstāt savu pāru "simbolu; garums "vai" zīme, garums ". Pirmajā gadījumā kods norāda uz iezīmi, ka secība ir kodēta (parasti 1 bit), tad atkārtošanas simbola kodu un secības garumu. Otrajā gadījumā (paredzēts visizplatītākajiem atkārtotajiem simboliem) prefiksā norāda tikai atkārtojumu pazīmi.