Kompresi suara: Prinsip dan konfigurasi. Sintesis dan pengenalan ucapan

Selama saat para peneliti juga melanjutkan untuk memecahkan masalah menciptakan antarmuka ucapan untuk komputer, sering kali diperlukan untuk memproduksi peralatan secara mandiri, memungkinkan Anda untuk memasukkan informasi audio ke dalam komputer, serta menampilkannya dari komputer. Saat ini, perangkat tersebut mungkin memiliki minat historis yang unik, karena komputer modern dapat dengan mudah melengkapi perangkat input dan output, seperti adaptor suara, mikrofon, headphone, dan kolom suara.

Kami tidak akan memperdalam detail perangkat internal Perangkat ini, tetapi kami akan menceritakan tentang bagaimana mereka bekerja, dan memberikan beberapa rekomendasi untuk memilih perangkat komputer yang sehat untuk bekerja dengan sistem pengakuan dan sintesis ucapan.

Seperti yang telah kita ucapkan pada bab sebelumnya, suara itu tidak lebih dari osilasi udara, frekuensi yang terletak pada rentang frekuensi yang dirasakan oleh orang tersebut. Pada orang yang berbeda, batas yang tepat dari kisaran frekuensi yang dapat didengar dapat bervariasi, bagaimanapun, diyakini bahwa osilasi suara terletak pada kisaran 16-20.000 Hz.

Tugas mikrofon adalah untuk mengubah fluktuasi audio menjadi osilasi listrik, yang dapat terus diperkuat, disaring untuk menghilangkan gangguan dan didigitalisasi untuk memasukkan informasi suara ke dalam komputer.

Menurut prinsip operasi, mikrofon yang paling umum dibagi menjadi batubara, elektrodinamik, kondensor dan electret. Beberapa mikrofon mereka membutuhkan pekerjaan mereka sumber luar Arus (misalnya, batubara dan kondensor), yang lain di bawah pengaruh osilasi suara dapat secara independen menghasilkan tegangan listrik bolak-balik (ini adalah mikrofon elektrodinamik dan electret).

Anda juga dapat membagi mikrofon untuk tujuan tersebut. Ada mikrofon studio yang dapat disimpan di tangan atau aman di dudukan, ada mikrofon radio yang dapat diperbaiki pada pakaian, dan sebagainya.

Ada juga mikrofon yang dirancang khusus untuk komputer. Mikrofon seperti itu biasanya dilampirkan pada dudukan di permukaan meja. Mikrofon komputer dapat dikombinasikan dengan headphone, seperti yang ditunjukkan pada Gambar. 2-1.

Ara. 2-1. Headphone dengan mikrofon

Bagaimana cara memilih dari semua variasi mikrofon yang paling cocok untuk sistem pengenalan ucapan?

Pada prinsipnya, Anda dapat bereksperimen dengan mikrofon apa pun yang Anda miliki, kecuali dapat dihubungkan ke adaptor audio komputer. Namun, pengembang sistem pengenalan ucapan direkomendasikan untuk memperoleh mikrofon seperti itu, yang bekerja pada jarak permanen dari mulut pembicara.

Jika jarak antara mikrofon dan mulut tidak berubah, sinyal listrik rata-rata yang berasal dari mikrofon juga akan berubah terlalu banyak. Ini akan memiliki efek positif pada kualitas karya sistem pengenalan ucapan modern.

Apa masalah yang terjadi di sini?

Seseorang dapat berhasil mengenali pidato, volume yang berubah dalam batas yang sangat luas. Otak manusia mampu memfilter pidato yang tenang dari gangguan, seperti suara mobil yang melewati jalan, percakapan dan musik asing.

Adapun sistem pengenalan ucapan modern, kemampuan mereka di daerah ini membuat banyak yang diinginkan. Jika mikrofon berada di atas meja, maka ketika kepala diputar atau mengubah posisi tubuh, jarak antara mulut dan mikrofon akan berubah. Ini akan mengarah pada perubahan pada tingkat sinyal output mikrofon, yang pada gilirannya akan memperburuk keandalan pengenalan ucapan.

Oleh karena itu, ketika bekerja dengan sistem pengenalan ucapan, hasil terbaik akan dicapai jika Anda menggunakan mikrofon yang terpasang pada setahun, seperti yang ditunjukkan pada Gambar. 2-1. Saat menggunakan mikrofon seperti itu, jarak antara mulut dan mikrofon akan permanen.

Kami juga memberikan perhatian Anda bahwa semua eksperimen dengan sistem pengenalan ucapan paling baik dilakukan, mempertahankan di ruangan yang tenang. Dalam hal ini, efek interferensi akan minimal. Tentu saja, jika Anda perlu memilih sistem pengenalan ucapan yang mampu bekerja dalam kondisi gangguan kuat, tes perlu dilakukan secara berbeda. Namun, sejauh ini diketahui oleh penulis buku, sementara ketaatan sistem pengenalan suara masih sangat, sangat rendah.

Mikrofon tampil untuk konversi osilasi suara dalam flukasi arus listrik. Osilasi ini dapat dilihat di layar osiloskop, tetapi jangan terburu-buru ke toko untuk membeli perangkat mahal ini. Semua penelitian osilografis yang dapat kami habiskan menggunakan komputer biasa yang dilengkapi dengan adaptor suara, seperti adaptor blaster suara. Nanti kita akan memberitahumu bagaimana melakukannya.

Pada Gambar. 2-2 Kami menunjukkan osilogram sinyal suara, Diperoleh ketika mengucapkan bunyi panjang a. Oscillogram ini diperoleh dengan menggunakan program Goldwave, yang masih kita katakan dalam bab buku ini, serta menggunakan adaptor audio mikrofon suara dan mirip dengan yang ditunjukkan pada Gambar. 2-1.

Ara. 2-2. Osilogram sinyal suara

Program Goldwave memungkinkan Anda meregangkan osilogram sepanjang sumbu waktu, yang memungkinkan Anda melihat detail terkecil. Pada Gambar. 2-3 Kami menunjukkan fragmen yang membentang dari osilogram suara yang disebutkan di atas.

Ara. 2-3. Fragmen osilogram suara suara

Harap dicatat bahwa besarnya sinyal input yang berasal dari mikrofon bervariasi secara berkala dan mengambil nilai positif dan negatif.

Jika hanya satu frekuensi yang ada dalam sinyal input (yaitu, jika suaranya "murni"), bentuk sinyal yang diperoleh dari mikrofon akan sinusoidal. Namun, seperti yang telah kita katakan, spektrum suara pidato manusia terdiri dari serangkaian frekuensi, sebagai akibat dari mana bentuk osilrogram sinyal ucapan jauh dari sinusoidal.

Sinyal yang nilainya berubah dengan waktu terus menerus, kami akan menelepon sinyal analog. Sinyal ini berasal dari mikrofon. Tidak seperti analog, sinyal digital adalah seperangkat nilai numerik yang bervariasi dengan waktu diskrit.

Ke komputer dapat memproses bip, itu harus diterjemahkan dari formulir analog ke digital, yaitu, untuk mewakili dalam bentuk serangkaian nilai numerik. Proses ini disebut digitalisasi sinyal analog.

Digitalisasi sinyal suara (dan analog apa pun) dilakukan dengan menggunakan perangkat khusus yang disebut konverter analog ke digital ADC (Analog to Digital Converter, ADC). Perangkat ini ada di papan adaptor audio dan merupakan mikro umum.

Bagaimana cara kerja konverter analog-ke-digital?

Ini secara berkala mengukur tingkat sinyal input, dan memberikan nilai numerik output dari hasil pengukuran. Proses ini diilustrasikan pada Gambar. 2-4. Di sini, persegi panjang abu-abu menandai nilai input yang diukur pada interval waktu konstan tertentu. Satu set nilai-nilai tersebut dan merupakan representasi digital dari sinyal analog input.

Ara. 2-4. Pengukuran ketergantungan amplitudo sinyal dari waktu

Pada Gambar. 2-5 Kami menunjukkan koneksi konverter analog ke digital ke mikrofon. Dalam hal ini, input x 1 berfungsi sinyal analog, dan sinyal digital dihapus dari output U 1 -U n.

Ara. 2-5. Konverter Analog-Digital

Konverter analog-ke-digital ditandai dengan dua parameter penting - frekuensi transformasi dan jumlah tingkat kuantisasi sinyal input. Pemilihan parameter ini yang benar sangat penting untuk mencapai representasi yang memadai dalam bentuk digital sinyal analog.

Seberapa sering Anda sering perlu mengukur nilai amplitudo sinyal analog input sehingga karena digitalisasi tidak kehilangan informasi tentang perubahan sinyal analog input?

Tampaknya jawabannya sederhana - sinyal input harus diukur sesering mungkin. Memang, semakin sering konverter analog-ke-digital melakukan pengukuran seperti itu, semakin baik perubahan sedikit pun dalam amplitudo sinyal analog input akan dilacak.

Namun, pengukuran yang tidak perlu sering mengarah pada pertumbuhan aliran data digital yang tidak dapat dibenarkan dan sumber daya komputer pengeluaran yang tidak berguna saat memproses sinyal.

Untung, pilihan tepat Konversi frekuensi (frekuensi pengambilan sampel) cukup sederhana. Untuk melakukan ini, ia cukup menghubungi Teorema Kotelnikov, yang diketahui mereka yang terampil di bidang pemrosesan sinyal digital. Teorema menyatakan bahwa frekuensi konversi harus dua kali lebih tinggi dari frekuensi maksimum spektrum sinyal yang diubah. Oleh karena itu, untuk digitalisasi tanpa kehilangan kualitas sinyal suara, frekuensi yang terletak pada kisaran 16-20.000 Hz, Anda perlu memilih frekuensi konversi, tidak kurang dari 40.000 Hz.

Catatan, bagaimanapun, bahwa dalam peralatan suara profesional frekuensi konversi dipilih beberapa kali dari nilai yang ditentukan. Ini dilakukan untuk mencapai kualitas suara digital yang sangat tinggi. Untuk sistem pengenalan ucapan, kualitas ini tidak relevan, jadi kami tidak akan mempertajam perhatian Anda pada pilihan seperti itu.

Dan frekuensi transformasi apa yang diperlukan untuk mendigitalkan suara pidato manusia?

Karena suara pidato manusia terletak pada rentang frekuensi 300-4000 Hz, frekuensi minimum yang diperlukan konversi adalah 8000 Hz. Namun, banyak sekali program komputer Pengenalan ucapan menggunakan standar untuk adaptor audio konvensional. Frekuensi transformasi adalah 44.000 Hz. Di satu sisi, frekuensi transformasi ini tidak mengarah pada peningkatan yang berlebihan dalam aliran data digital, dan yang lainnya - memberikan digitalisasi bicara dengan kualitas yang cukup.

Bahkan di sekolah, kami diajarkan bahwa dengan pengukuran apa pun, kesalahan muncul, dari mana tidak mungkin untuk menyingkirkan sepenuhnya. Kesalahan semacam itu terjadi karena resolusi terbatas dari instrumen pengukuran, serta karena fakta bahwa proses pengukuran itu sendiri dapat membuat beberapa perubahan pada nilai yang diukur.

Konverter analog ke digital mewakili sinyal input analog dalam bentuk aliran jumlah bit yang terbatas. Adaptor audio konvensional mengandung blok ADC 16-bit yang dapat mewakili amplitudo sinyal input dalam bentuk 216 \u003d 65536 nilai yang berbeda. Perangkat ADC dalam peralatan suara high-end dapat menjadi 20-bit, memberikan keakuratan amplitudo yang lebih besar dari sinyal audio.

Sistem modern dan program pengenalan ucapan diciptakan untuk komputer biasa yang dilengkapi dengan adapter suara yang biasa. Oleh karena itu, untuk melakukan eksperimen dengan pengenalan ucapan, Anda tidak perlu memperoleh adaptor audio profesional. Adaptor seperti suara blaster cukup cocok untuk digitalisasi pidato untuk lebih mengenalinya.

Seiring dengan sinyal yang berguna ke mikrofon, berbagai suara biasanya jatuh - kebisingan dari jalan, suara angin, percakapan asing, dll. Kebisingan memiliki dampak negatif pada kualitas pekerjaan sistem pengenalan ucapan, sehingga harus menghadapinya. Salah satu cara kami telah menyebutkan - sistem pengenalan ucapan hari ini menggunakan kamar yang tenang, tinggal dengan komputer satu lawan satu.

Namun, kondisi ideal dapat dibuat tidak selalu, jadi Anda harus menggunakannya metode Khususmemungkinkan Anda untuk menghilangkan kebisingan. Untuk mengurangi tingkat kebisingan, trik khusus digunakan saat membangun mikrofon dan filter khusus yang menghapus dari spektrum sinyal frekuensi analog yang tidak membawa informasi yang bermanfaat. Selain itu, teknik ini digunakan sebagai kompresi. rentang dinamis Level input.

Ceritakan tentang semua ini secara berurutan.

Filter frekuensi Perangkat yang mengubah spektrum frekuensi dari sinyal analog disebut. Dalam hal ini, selama proses transformasi (atau penyerapan) osilasi frekuensi tertentu terjadi.

Anda dapat membayangkan perangkat ini dalam bentuk serangkaian kotak hitam dengan satu input dan satu output. Berkenaan dengan situasi kami, mikrofon akan terhubung ke input filter frekuensi, dan konverter analog-ke-digital akan terhubung ke output.

Filter frekuensi berbeda:

· Filter frekuensi yang lebih rendah;

· Filter frekuensi atas;

· Menyaring filter strip;

· Filter strip bashed.

Filter frekuensi yang lebih rendah (Filter low-pass) dihapus dari spektrum input semua frekuensi yang nilainya di bawah beberapa frekuensi ambang tergantung pada pengaturan filter.

Karena sinyal suara terletak pada kisaran 16-20.000 Hz, semua frekuensi kurang dari 16 Hz dapat terputus tanpa merusak kualitas suara. Untuk pengenalan ucapan, rentang frekuensi 300-4000 Hz penting, sehingga Anda dapat memotong frekuensi di bawah 300 Hz. Dalam hal ini, semua gangguan akan dipotong dari sinyal input, spektrum frekuensi yang terletak di bawah 300 Hz, dan mereka tidak akan mengganggu proses pengenalan ucapan.

Demikian pula, filter frekuensi atas. (Filter -pass tinggi) dipotong dari spektrum input semua frekuensi di atas beberapa frekuensi ambang batas.

Seseorang tidak mendengar suara dengan frekuensi 20.000 Hz ke atas, sehingga mereka dapat dipotong dari spektrum tanpa kemunduran kualitas suara yang terlihat. Seperti halnya pengenalan ucapan, di sini Anda dapat memotong semua frekuensi di atas 4000 Hz, yang akan menyebabkan penurunan signifikan dalam tingkat gangguan frekuensi tinggi.

Mentransmisikan strip filter (Band -pass Filter) dapat dibayangkan sebagai kombinasi dari filter frekuensi bawah dan atas. Filter seperti itu menunda semua frekuensi di bawah yang disebut frekuensi bawahserta di atas bandwidth frekuensi atas.

Dengan demikian, untuk sistem pengenalan suara, filter bandwidth nyaman, yang menunda semua frekuensi kecuali frekuensi kisaran 300-4000 Hz.

Adapun filter strip pengapian (filter band -stop), mereka memungkinkan Anda untuk memotong dari spektrum input semua frekuensi berbaring dalam rentang yang ditentukan. Filter seperti itu nyaman, misalnya, untuk menekan suara yang menempati bagian yang solid dari spektrum sinyal.

Pada Gambar. 2-6 Kami menunjukkan koneksi filter bandwidth.

Ara. 2-6. Penyaringan sinyal suara sebelum digitalisasi

Harus dikatakan bahwa adaptor suara yang biasa diinstal di komputer ada dalam komposisi filter strip di mana sinyal analog melewati sebelum digitalisasi. Bandwidth filter seperti itu biasanya sesuai dengan rentang sinyal suara, yaitu, 16-20.000 Hz (dalam adaptor audio yang berbeda, nilai frekuensi atas dan bawah dapat bervariasi dalam batas kecil).

Dan bagaimana mencapai bandwidth yang lebih sempit 300-4000 Hz, sesuai dengan bagian paling informatif dari spektrum spektrum manusia?

Tentu saja, jika Anda memiliki kecenderungan untuk merancang peralatan radio-elektronik, Anda dapat membuat filter Anda dari mikro amplifier operasional, resistor, dan kapasitor. Kira-kira pencipta pertama sistem pengenalan suara.

tapi sistem industri Pengenalan ucapan harus dapat diterapkan pada perangkat keras komputer standar, sehingga jalur pembuatan filter pita khusus tidak cocok di sini.

Sebaliknya, yang disebut digunakan dalam sistem pemrosesan pidato modern filter frekuensi digitaldiimplementasikan secara terprogram. Menjadi mungkin setelah cPU. Komputer telah menjadi cukup kuat.

Filter frekuensi digital yang diimplementasikan perangkat lunak mengkonversi sinyal digital input ke sinyal digital output. Dalam proses konversi, program memproses aliran khusus sinyal luminescence amplitudo sinyal yang berasal dari konverter analog-ke-digital. Hasil konversi juga akan jumlah angka, namun, utas ini akan sesuai dengan sinyal yang sudah difilter.

Berbicara tentang konverter analog ke digital, kami mencatat seperti itu karakteristik pentingsebagai jumlah level kuantisasi. Jika konverter analog-ke-digital 16-bit diinstal pada adaptor audio, maka setelah mendigitalkan tingkat sinyal suara dapat diwakili sebagai 216 \u003d 65536 nilai yang berbeda.

Jika ada beberapa level kuantisasi, maka disebut curang kebisingan. Untuk mengurangi kebisingan ini, dalam sistem digitalisasi suara berkualitas tinggi, konverter analog-digital harus diterapkan dengan jumlah tingkat kuantisasi maksimum yang tersedia.

Namun, ada penerimaan lain yang memungkinkan Anda mengurangi efek noise kuantisasi pada kualitas sinyal audio, yang digunakan dalam sistem perekaman suara digital. Saat menggunakan penerimaan ini sebelum didigitalisasi, sinyal melewati amplifier nonlinear, garis bawah sinyal dengan amplitudo kecil dari sinyal. Perangkat semacam itu meningkatkan sinyal lemah lebih kuat daripada kuat.

Ini diilustrasikan oleh grafik ketergantungan amplitudo sinyal output dari amplitudo sinyal input yang ditunjukkan pada Gambar. 2-7.

Ara. 2-7. Amplifikasi nonlinear sebelum digitalisasi

Pada tahap konversi terbalik dari audio digital ke analog (kami mempertimbangkan langkah ini di bawah ini di bab ini) sebelum menampilkan kolom audio, sinyal analog kembali melewati amplifier nonlinear. Kali ini amplifier lain digunakan, yang menekankan sinyal dengan amplitudo besar dan memiliki karakteristik transfer (ketergantungan amplitudo dari sinyal output dari amplitudo sinyal input), yang terbalik yang digunakan selama digitalisasi.

Bagaimana semua ini membantu pencipta sistem pengenalan suara?

Orang itu, seperti yang diketahui, cukup dikenal dengan pidato yang diucapkan dengan bisikan yang tenang atau suara yang agak keras. Dapat dikatakan bahwa rentang dinamis tingkat volume pidato yang berhasil diakui untuk seseorang cukup luas.

Hari ini sistem komputer Pengenalan ucapan, sayangnya, sampai membanggakannya. Namun, dengan tujuan ekspansi tertentu dari rentang dinamis yang ditentukan sebelum didigitalisasi, Anda dapat melewati sinyal dari mikrofon melalui amplifier nonlinear, karakteristik transfer yang ditunjukkan pada Gambar. 2-7. Ini akan mengurangi tingkat kebisingan kuantisasi selama digitalisasi sinyal lemah.

Pengembang sistem pengenalan ucapan, sekali lagi, dipaksa untuk fokus terutama pada adaptor suara yang diproduksi secara seri. Mereka tidak memberikan konversi sinyal nonlinier yang dijelaskan di atas.

Namun, Anda dapat membuat setara perangkat lunak dari amplifier nonlinear yang mengubah sinyal digital sebelum mengirimkannya ke modul pengenalan ucapan. Dan meskipun penguat program seperti itu tidak akan dapat mengurangi kebisingan kuantisasi, adalah mungkin untuk menekankan tingkat sinyal yang membawa informasi pidato terbesar. Misalnya, Anda dapat mengurangi amplitudo sinyal lemah, setelah menghilangkan sinyal dari noise.

© 2014 Site.

Atau fotografi lintang Bahan foto adalah hubungan antara nilai eksposur maksimum dan minimum yang dapat ditangkap dengan benar dalam gambar. Dengan mengacu pada fotografi digital, rentang dinamis sebenarnya setara dengan rasio nilai maksimum dan minimum yang mungkin dari sinyal listrik yang bermanfaat yang dihasilkan oleh acpose.

Rentang dinamis diukur dalam langkah-langkah eksposur (). Setiap langkah sesuai dengan menggandakan jumlah cahaya. Misalnya, jika kamera tertentu memiliki rentang dinamis 8 EV, ini berarti bahwa nilai maksimum yang mungkin dari sinyal berguna dari matriksnya mengacu pada minimum 2: 1, yang berarti bahwa kamera mampu menangkap dalam satu Bingkai objek berbeda dalam kecerahan tidak lebih dari 256 kali. Lebih tepatnya, itu dapat menangkap benda-benda itu dengan kecerahan, tetapi benda yang kecerahannya akan melebihi maksimum nilai yang diizinkan Mari kita keluar pada gambar putih yang mempesona, dan benda yang kecerahannya akan berada di bawah nilai minimum - batubara hitam. Detail dan tekstur hanya akan dapat dibedakan pada objek-objek yang kecerahannya ditumpuk di rentang dinamis ruang.

Untuk menggambarkan hubungan antara kecerahan yang paling cerdas dan paling gelap dari benda-benda yang dapat dilepas, bukan istilah yang benar "rentang adegan dinamis" sering digunakan. Akan lebih benar untuk berbicara tentang kisaran kecerahan atau pada tingkat kontras, karena rentang dinamis biasanya merupakan karakteristik dari alat pengukur (dalam kasus ini, Matriks kamera digital).

Sayangnya, kisaran kecerahan dari banyak adegan indah yang dihadapkannya kehidupan nyatamungkin terasa melebihi rentang dinamis kamera digital. Dalam kasus seperti itu, fotografer dipaksa untuk memutuskan objek mana yang harus dikerjakan di semua bagian, dan mana yang dapat ditinggalkan di luar rentang dinamis tanpa prasangka untuk desain kreatif. Untuk membuat yang paling efektif menggunakan rentang dinamis kamera Anda, kadang-kadang mungkin tidak memiliki pemahaman menyeluruh tentang prinsip kerja Photosensor, seberapa besar yang dikembangkan artistik.

Faktor Rentang Dinamis

Batas bawah rentang dinamis diatur oleh tingkat kebisingannya sendiri dari Seensor Foto. Bahkan matriks yang tidak menyala menghasilkan sinyal listrik latar belakang, yang disebut noise gelap. Juga, gangguan terjadi ketika tuduhan ditransfer ke konverter analog ke digital, dan ADC sendiri memperkenalkan kesalahan tertentu dalam sinyal digital - disebut. Noise Sampling.

Jika Anda mengambil gambar dalam kegelapan yang lengkap atau dengan tutup pada lensa, maka kamera hanya akan merekam kebisingan yang tidak berarti ini. Jika Anda mengizinkan jumlah cahaya minimum untuk sampai ke sensor, fotodioda akan mulai mengakumulasi muatan listrik. Nilai tuduhan, yang berarti intensitas sinyal yang menguntungkan, akan sebanding dengan jumlah foton yang ditangkap. Agar snapshot, setidaknya beberapa detail yang bermakna, perlu bahwa tingkat sinyal yang berguna melebihi tingkat kebisingan latar belakang.

Dengan demikian, batas bawah rentang dinamis atau, dengan kata lain, ambang sensitivitas sensor secara resmi dapat didefinisikan sebagai tingkat sinyal output di mana rasio sinyal-ke-noise lebih besar dari unit.

Batas atas rentang dinamis ditentukan oleh wadah fotodioda terpisah. Jika, selama eksposisi, fotodioda apa pun akan menumpuk muatan listrik untuk membatasi nilai untuk dirinya sendiri, maka piksel gambar yang sesuai dengan fotodida yang kelebihan beban benar-benar putih, dan iradiasi lebih lanjut tidak akan mempengaruhi kecerahannya. Fenomena ini disebut kliping. Semakin tinggi kemampuan frenetik dari fotodioda, semakin besar sinyalnya mampu memberikan pada output sebelum kejenuhan mencapai.

Untuk kejelasan yang lebih besar, kita beralih ke kurva karakteristik, yang merupakan grafik dari ketergantungan sinyal keluaran dari paparan. Pada sumbu horizontal, logaritma biner iradiasi yang diperoleh sensor ditunda, dan pada logaritma vertikal - biner dari besarnya sinyal listrik yang dihasilkan oleh sensor ini sebagai respons terhadap iradiasi ini. Gambar saya sebagian besar bersyarat dan mengejar tujuan yang sangat ilustrasi. Kurva karakteristik Seensor foto saat ini memiliki bentuk yang sedikit lebih kompleks, dan tingkat kebisingan jarang sangat tinggi.

Grafik terlihat jelas dua titik kaku kritis: Dalam yang pertama dari ini, tingkat sinyal yang berguna melintasi ambang noise, dan di fotodioda kedua mencapai saturasi. Nilai eksposur yang terletak di antara dua titik ini adalah rentang dinamis. Dalam contoh abstrak ini, sama dengan betapa mudahnya untuk memperhatikan, 5 EV, I.E. Kamera ini mampu mencerna lima paparan dua kali lipat, yang setara dengan 32x (2 5 \u003d 32) dalam perbedaan kecerahan.

Zona paparan yang membentuk rentang dinamis tidak sama. Zona atas ditandai dengan rasio sinyal-ke-noise yang lebih tinggi, dan karenanya terlihat lebih jelas dan lebih rinci daripada yang lebih rendah. Akibatnya, batas atas rentang dinamis sangat nyata dan nyata - kliping yang dibungkus lampu pada eksposisi sekecil apa pun, sedangkan batas bawah semakin tenggelam dalam kebisingan, dan transisi ke warna hitam jauh dari begitu saja.

Ketergantungan linier dari sinyal dari paparan, serta hasil tajam ke dataran tinggi, adalah fitur unik dari proses fotografi digital. Sebagai perbandingan, lihat kurva karakteristik persyaratan photoplinka tradisional.

Bentuk kurva dan terutama sudut kecenderungan sangat tergantung pada jenis film dan dari prosedur manifestasinya, tetapi hal utama yang tetap ada perbedaan antara jadwal film dari digital - sifat nonlinier dari ketergantungannya dari ketergantungan Kepadatan optik film dari nilai paparan tetap tidak berubah.

Batas bawah garis lintang fotografi dari film negatif ditentukan oleh kepadatan kerudung, dan bagian atas - kepadatan optik maksimum yang dapat dicapai dari fotokulata; Putar film - sebaliknya. Baik dalam bayangan maupun di lampu ada tikungan lancar dari kurva karakteristik, menunjukkan penurunan kontras ketika mendekati batas-batas rentang dinamis, karena sudut kemiringan kurva sebanding dengan kontras gambar. Dengan demikian, zona eksposur berbaring di bagian tengah jadwal memiliki kontras maksimum, sedangkan dalam lampu dan bayangan, kontras berkurang. Dalam praktiknya, perbedaan antara film dan matriks digital sangat terlihat pada lampu: di mana dalam gambar digital cahaya dibakar dengan kliping, bagian-bagian pada film masih dapat dibedakan, meskipun kontras rendah, dan Transisi ke warna putih murni terlihat halus dan alami.

Dalam sensitometri, bahkan dua istilah independen digunakan: sebenarnya fotografi lintangdibatasi oleh bagian yang relatif liniar dari kurva karakteristik, dan latitude fotografi yang bermanfaat, Selain bagian linier, juga grafis dasar dan bahu.

Perlu dicatat bahwa ketika memproses foto digital, itu, sebagai aturan, menerapkan kurva berbentuk S yang lebih atau kurang, yang meningkatkan kontras pada halftone dengan biaya penurunan bayangan dan lampu, yang memberikan gambar digital Tampilan mata yang lebih alami dan menyenangkan.

BIGNESS.

Berbeda dengan matriks kamera digital, penglihatan manusia aneh, katakanlah, pandangan logaritmik dunia. Penggandaan berurutan dari jumlah cahaya dirasakan oleh kita sebagai perubahan kecerahan yang sama. Nomor cahaya bahkan dapat dibandingkan dengan oktaf musik, karena perubahan dua kali frekuensi suara dirasakan oleh rumor sebagai interval musik tunggal. Prinsip ini mempekerjakan indera lain. Nonlinearitas persepsi sangat memperluas jangkauan sensitivitas manusia ke stimulus berbagai intensitas.

Saat mengkonversi file RAW (itu tidak masalah, alat kamera atau di konverter RAW) yang berisi data linear, yang disebut secara otomatis berlaku untuk itu. Gamma Curve, yang dirancang untuk meningkatkan kecerahan citra digital, memimpin sesuai dengan kekhasan penglihatan manusia.

Dengan konversi linier, gambar diperoleh terlalu gelap.

Setelah koreksi gamma, kecerahannya normal.

Kurva gamma karena akan meregangkan nada gelap dan meremas cahaya, membuat distribusi gradasi lebih seragam. Akibatnya, gambar memperoleh tampilan alami, tetapi kebisingan dan artefak pengambilan sampel dalam bayangan pasti menjadi lebih terlihat, yang hanya diperburuk oleh sejumlah kecil level kecerahan di zona bawah.

Distribusi linear gradasi kecerahan.
Distribusi seragam setelah menerapkan kurva gamma.

ISO dan rentang dinamis

Terlepas dari kenyataan bahwa dalam fotografi digital, konsep fotosensitifitas yang sama dari bahan fotografi digunakan seperti pada foto film, harus dipahami bahwa ini semata-mata disebabkan oleh tradisi tradisi, karena pendekatan mengubah fotosensitivitas dalam digital dan fotografi film berbeda pada prinsipnya.

Meningkatkan sensitivitas ISO dalam fotografi tradisional berarti mengganti satu film ke film lain dengan biji-bijian yang lebih besar, I.E. Ada perubahan objektif pada sifat-sifat materi foto. Dalam kamera digital, sensitivitas sensor sangat ditetapkan oleh karakteristik fisiknya dan tidak dapat diubah secara harfiah. Dengan peningkatan ISO, kamera berubah bukan sensitivitas nyata sensor, tetapi hanya meningkatkan sinyal listrik yang dihasilkan oleh sensor sebagai respons terhadap iradiasi dan menyesuaikan algoritma digitalisasi dengan benar untuk sinyal ini.

Konsekuensi penting dari ini adalah untuk mengurangi rentang dinamis yang efektif secara proporsional dengan peningkatan ISO, karena dengan sinyal yang berguna, kebisingan ditingkatkan. Jika ISO 100 mendigitasikan seluruh rentang nilai sinyal - dari nol ke titik saturasi, kemudian dengan ISO 200, hanya setengah kapasitas fotodiodi yang diterima maksimal. Dengan setiap dua kali lipat sensitivitas ISO, tahap atas rentang dinamis terputus, dan langkah-langkah yang tersisa diperketat ke tempatnya. Itulah sebabnya penggunaan nilai ISO ultra-tinggi dirampas makna praktis. Dengan keberhasilan yang sama, Anda dapat meringankan foto di konverter RAW dan mendapatkan tingkat kebisingan yang sebanding. Perbedaan antara peningkatan ISO dan iluminasi buatan dari gambar adalah bahwa dengan meningkatnya ISO, penguatan sinyal terjadi sebelum diterima di ADC, dan oleh karena itu kebisingan kuantisasi tidak ditingkatkan, tidak seperti kebisingan sensornya sendiri, Sedangkan dalam konverter RAW, amplifikasi dapat dimasukkan ke dalam kesalahan ADC. Selain itu, penurunan rentang digitalisasi berarti pengambilan sampel yang lebih akurat dari nilai input yang tersisa.

By the way, ISO tersedia pada beberapa perangkat di bawah nilai dasar (misalnya, ke ISO 50), itu tidak memperluas rentang dinamis, dan cukup melonggarkan sinyal dua kali, yang sama dengan snapshot dalam konverter RAW. Fungsi ini dapat diperlakukan sebagai berbahaya, karena penggunaan nilai submimik ISO, memprovokasi ruang untuk meningkatkan paparan, dengan sisa ambang sensor yang tidak berubah, ia meningkatkan risiko dikeluarkan dalam lampu.

Rentang dinamis sejati

Ada sejumlah program seperti (DXO Analyzer, Imates, Rawdigger, dll.) Memungkinkan Anda mengukur rentang dinamis kamera digital di rumah. Pada prinsipnya, ini bukan kebutuhan yang sangat baik, karena data untuk sebagian besar kamera dapat secara bebas ditemukan di Internet, misalnya, di situs web DXOMARK.COM.

Haruskah saya percaya hasil tes tersebut? Cukup. Dengan satu-satunya reservasi bahwa semua tes ini didefinisikan efisien atau, jika Anda dapat mengekspresikannya, rentang dinamis teknis, I.E. Hubungan antara tingkat saturasi dan tingkat kebisingan dari matriks. Untuk fotografer, rentang dinamis yang bermanfaat terutama penting, I.E. Jumlah zona eksposur yang benar-benar memungkinkan Anda untuk menangkap beberapa informasi yang bermanfaat.

Seperti yang Anda ingat, ambang rentang dinamis ditentukan oleh tingkat kebisingan Seensor Foto. Masalahnya adalah dalam praktiknya zona bawah secara resmi masuk dalam rentang dinamis, berisi semuanya terlalu banyak suara sehingga dapat digunakan untuk digunakan. Di sini, sangat tergantung pada meremas individu - tingkat kebisingan yang dapat diterima masing-masing menentukan untuk dirinya sendiri.

Pendapat subyektif saya adalah bahwa detail dalam bayangan mulai terlihat lebih atau kurang layak dengan rasio sinyal / noise setidaknya delapan. Atas dasar ini, saya menentukan sendiri rentang dinamis yang berguna, sebagai kisaran dinamis teknis minus sekitar tiga langkah.

Misalnya, jika ruang cermin sesuai dengan hasil tes yang andal memiliki rentang dinamis 13 EV, yang sangat baik untuk standar saat ini, maka rentang dinamis yang berguna akan sekitar 10 EV, yang secara umum, juga sangat teliti . Tentu saja, kita berbicara tentang memotret dalam mentah, dengan minimal ISO dan bit maksimum. Saat memotret di JPEG, rentang dinamis sangat tergantung pada pengaturan kontras, tetapi rata-rata dua atau tiga langkah harus dibuang.

Sebagai perbandingan: Foto-foto foto yang diperdagangkan dengan warna memiliki garis lintang fotografi yang berguna dari 5-6 langkah; Film-film negatif hitam dan putih memberikan 9-10 langkah dengan manifestasi standar dan prosedur pencetakan, dan dengan manipulasi tertentu - hingga 16-18 langkah.

Ringkas di atas, kami akan mencoba merumuskan beberapa aturan sederhana, yang akan membantu Anda memeras dari sensor kinerja maksimum kamera Anda:

  • Rentang dinamis dari kamera digital hanya dapat diakses hanya saat memotret dalam RAW.
  • Rentang dinamis berkurang dengan meningkatnya sensitivitas cahaya, dan karenanya menghindari nilai ISO yang tinggi jika tidak ada kebutuhan yang tajam.
  • Menggunakan debit yang lebih tinggi untuk file RAW tidak menambah rentang dinamis yang sebenarnya, tetapi meningkatkan pemisahan nada dalam bayangan karena lebih Tingkat kecerahan.
  • Paparan ke kanan. Zona paparan atas selalu mengandung maksimum informasi berguna Dengan suara minimum dan harus digunakan paling efektif. Pada saat yang sama, Anda tidak boleh melupakan bahaya kliping - piksel yang telah mencapai saturasi sama sekali tidak berguna.

Dan hal utama: tidak perlu khawatir tentang rentang dinamis kamera Anda. Dengan rentang dinamis, itu baik-baik saja. Kemampuan Anda untuk melihat cahaya dan kompeten mengelola eksposur jauh lebih penting. Sebuah fotografer yang baik tidak akan mengeluh tentang kurangnya fotografi lintang, tetapi akan mencoba menunggu pencahayaan yang lebih nyaman, atau akan mengubah sudut, atau akan menggunakan flash, dalam sebuah kata, akan bertindak sesuai dengan keadaan. Saya akan memberi tahu Anda lebih banyak: beberapa adegan hanya menang karena fakta bahwa mereka tidak cocok dengan rentang dinamis kamera. Seringkali kelimpahan bagian yang tidak perlu hanya perlu bersembunyi ke dalam siluet hitam semi-parut yang membuat foto pada saat yang sama secara ringkas dan lebih kaya.

Kontras tinggi tidak selalu buruk - Anda hanya perlu dapat bekerja dengannya. Belajarlah untuk mengeksploitasi kelemahan peralatan serta keuntungannya, dan Anda akan terkejut betapa banyak peluang kreatif Anda akan berkembang.

Terima kasih atas perhatiannya!

Vasily A.

Post Scriptum.

Jika artikel ini bermanfaat dan informatif untuk Anda, Anda dapat dengan ramah mendukung proyek, memberikan kontribusi pada perkembangannya. Jika Anda tidak menyukai artikel itu, tetapi Anda memiliki pemikiran tentang cara membuatnya lebih baik, kritik Anda akan diterima dengan rasa terima kasih.

Jangan lupa bahwa artikel ini adalah objek hak cipta. Cetak ulang dan kutipan diizinkan jika ada referensi yang ada ke sumber asli, dan teks yang digunakan tidak boleh dipilih atau dimodifikasi.

Orang-orang yang antusias dengan suara buatan sendiri menunjukkan paradoks yang menarik. Mereka siap untuk mendorong ruang mendengarkan, untuk membangun kolom dengan emitor eksotis, tetapi mereka malu di depan kalengan musik, seolah-olah serigala di depan bendera merah. Dan pada kenyataannya, mengapa mustahil untuk kotak centang untuk keluar, dan dari kalengan mencoba memasak sesuatu yang lebih dapat dimakan?

Secara berkala, ada keluhan pada forum: "Anjurkan album yang direkam dengan baik." Ini dapat dimengerti. Edisi audiophile khusus, meskipun mereka akan senang mendengar menit pertama, tetapi tidak ada yang mendengarkan akhirnya, itu menyakiti repertoar. Adapun sisa Phonothek, masalahnya tampak jelas. Anda dapat menghemat, tetapi Anda tidak dapat menyimpan dan mengosongkan buzz uang ke komponen. Saya masih tidak suka mendengarkan musik favorit Anda pada volume tinggi dan kemungkinan amplifier di sini.

Hari ini, bahkan di album Hi-Res, puncak fonogram dan volume yang didorong ke kliping dipotong. Diyakini bahwa mayoritas mendengarkan musik pada setiap sampah, dan oleh karena itu perlu untuk "meminta GAT", untuk membuat semacam dedikasi.


Tentu saja, ini tidak dilakukan secara khusus untuk mengganggu audiophiles. Tentang mereka umumnya sedikit orang ingat. Nah, kecuali bahwa mereka menebak untuk membiarkan file master dengan sirkulasi utama disalin - CD, MP3, dan sebagainya. Tentu saja, wizard telah lama diratakan oleh kompresor, tidak ada yang secara sadar menyiapkan versi khusus untuk trek HD. Apakah itu prosedur tertentu untuk vinyl carrier, yang untuk alasan ini dan terdengar lebih manusiawi. Dan untuk jalur digital, semuanya berakhir sama - kompresor tebal besar.

Jadi, saat ini semua 100% dari fonogram diterbitkan, dikurangi musik klasik, dikenakan kompresi ketika menakjubkan. Seseorang melakukan prosedur ini lebih atau kurang terampil, dan seseorang sepenuhnya bodoh. Akibatnya, kami memiliki peziarah di forum dengan garis plugin Dr untuk sinus, perbandingan publikasi yang menyakitkan, melarikan diri ke vinil, di mana Anda juga membutuhkan popper utama.

Yang paling beku saat melihat semua perabotan ini berbalik secara harfiah dalam sepatu audio. Tidak bercanda, mereka membaca Sumber Sungai Suci Kitab Suci mundur! Program pengeditan suara modern memiliki beberapa alat restorasi gelombang suaraTerpotong terpotong.

Awalnya, fungsi ini ditujukan untuk studio. Ketika dicampur, ada situasi ketika kliping telah datang untuk menulis, dan tidak lagi mungkin untuk membuat kembali sesi karena sejumlah alasan, dan di sini datang ke bantuan audio editor Arsenal - Decalpers, dll.

Dan sudah untuk perangkat lunak seperti itu, semua yang lebih berani menarik gagang pendengar biasa yang memiliki darah dari telinga setelah kebaruan berikutnya. Seseorang lebih suka Izotope, seseorang Adobe Audition, seseorang beroperasi berbagi antara beberapa program. Arti pemulihan dinamika sebelumnya adalah dengan benar mengoreksi puncak sinyal berlapis klip, yang, beristirahat dalam 0 dB, menyerupai gigi.

Ya, sekitar 100% kebangkitan sumber pidato tidak pergi, karena proses interpolasi pada algoritma yang cukup spekulatif terjadi. Namun tetap saja, beberapa hasil pemrosesan tampaknya menarik dan layak untuk dipelajari.

Misalnya, album Lana del Rey "Lust for Life", secara konsisten mengerutkan kening, PAH, mengemudi! Dalam lagu asli "ketika dunia sedang berperang, kami terus menari" seperti ini.


Dan setelah serangkaian desalippers dan dekompresor, itu menjadi seperti ini. Koefisien Dr telah berubah dari 5 hingga 9. Unduh dan dengarkan sampel sebelum dan sesudah pemrosesan.


Saya tidak dapat mengatakan bahwa metode ini universal dan cocok untuk semua album yang digunakan, tetapi dalam hal ini saya lebih suka melestarikan dalam koleksi dengan tepat opsi ini diobati dengan aktivis Rakum, alih-alih publikasi resmi dalam 24 bit.

Bahkan jika tarikan puncak buatan dari suara cincang tidak mengembalikan dinamika kinerja musik yang sebenarnya, DAC Anda masih akan mengucapkan terima kasih. Sangat sulit baginya untuk bekerja tanpa kesalahan pada tingkat batas, di mana kemungkinan apa yang disebut puncak intersmonic (ISP) sangat bagus. Dan sekarang hingga 0 dB akan menghilangkan hanya spoor langka dari sinyal. Selain itu, fonogram yang dipicu ketika dikompresi dalam FLAC atau codec lossless lainnya sekarang akan berukuran lebih kecil. Lebih banyak "udara" dalam sinyal menghemat ruang hard drive.

Cobalah untuk menghidupkan kembali album Anda yang paling dibenci yang terbunuh pada "Perang Volume". Untuk cadangan speaker, pertama-tama Anda perlu menurunkan level trek pada -6 dB, dan kemudian mulai deklip. Mereka yang tidak percaya komputer dapat menempel di antara pemutar CD dan Expander Studio Amplifier. Alat ini Intinya, itu dilakukan dengan cara yang sama - karena dapat memulihkan dan menarik puncak yang dikompresi di atas dinamika sinyal audio. Ada perangkat serupa dari 80-90-an untuk tidak mengatakannya sangat mahal, dan sebagai percobaan, cobalah mereka sangat menarik.


Pengontrol rentang dinamis DBX 3BX memproses sinyal secara terpisah dalam tiga garis - LF, SC dan RF

Setelah equalizers diberikan komponen sistem audio, dan tidak ada yang takut pada mereka. Hari ini tidak perlu untuk menaikkan frekuensi tinggi dari pita magnetik, tetapi dengan dinamika jelek perlu untuk menyelesaikan sesuatu, saudara.

Kompresi dinamis (Kompresi rentang dinamis, DRC) adalah penyempitan (atau ekspansi dalam kasus expander) dari rentang dinamitik fonogram. Rentang dinamisIni adalah perbedaan antara suara paling tenang dan paling keras. Kadang-kadang yang paling tenang di fonogram akan menjadi suara dari sedikit suara suara keras, dan kadang-kadang sedikit lebih tenang dari yang paling keras. Perangkat perangkat keras dan program yang melaksanakan kompresi dinamis disebut kompresor, menyoroti empat grup utama: kompresor, limiter, ekspander dan gerbang.

Kompresor Analog Lampu DBX 566

Mengurangi dan mempromosikan kompresi

Kompresi rendah (Kompresi ke bawah) Mengurangi volume suara ketika mulai melebihi nilai ambang tertentu, meninggalkan suara yang lebih tenang tidak berubah. Opsi ekstrem dari kompresi yang lebih rendah adalah pembatas. Peningkatan kompresi (Kompresi ke atas), sebaliknya, meningkatkan volume suara, jika di bawah ambang batas, tanpa mempengaruhi lebih banyak suara keras. Pada saat yang sama, kedua jenis kompresi mempersempit rentang dinamis sinyal audio.

Kompresi rendah

Peningkatan kompresi

Expander and Gate.

Jika kompresor mengurangi rentang dinamis, expander meningkatkannya. Ketika tingkat sinyal berada di atas level ambang batas, expander semakin meningkat, sehingga meningkatkan perbedaan antara suara keras dan tenang. Perangkat semacam itu sering digunakan ketika merekam instalasi drum untuk memisahkan suara beberapa drum dari orang lain.

Jenis expander, yang tidak digunakan untuk tidak meningkatkan keras, dan mengeringkan suara yang tenang yang tidak melebihi tingkat nilai ambang (misalnya, kebisingan latar belakang) disebut Gerbang kebisingan.. Dalam perangkat seperti itu, segera setelah level suara menjadi kurang dari ambang batas, pass sinyal dihentikan. Biasanya, gerbang ini digunakan untuk menekan noise dalam jeda. Pada beberapa model itu dapat dilakukan sehingga suara ketika tingkat ambang tidak berhenti tajam, tetapi secara bertahap berkeliaran. Dalam hal ini, kecepatan atenuasi diatur oleh Regulator Decay (resesi).

Gerbang, seperti jenis kompresor lainnya, mungkin demender frekuensi (I.E., dengan cara yang berbeda untuk memproses pita frekuensi tertentu) dan dapat beroperasi dalam mode rantai samping. (Lihat di bawah).

Prinsip pengoperasian kompresor

Sinyal jatuh ke dalam kompresor dibagi menjadi dua salinan. Satu salinan dikirim ke amplifier, di mana tingkat amplifikasi dikendalikan oleh sinyal eksternal, salinan kedua - membentuk sinyal ini. Ini memasuki perangkat yang disebut rantai samping, di mana sinyal diukur, dan amplop dibuat berdasarkan data ini yang menggambarkan perubahan volumenya.
Jadi kompresor paling modern diatur, ini adalah tipe feed-forward. Pada perangkat yang lebih lama (tipe umpan balik), level sinyal diukur setelah amplifier.

Ada berbagai teknologi kontrol analog (amplifikasi gain variabel), masing-masing dengan kelebihan dan kekurangannya: lampu, optik menggunakan fotorestra dan transistum. Saat bekerja dengan audio digital (dalam editor suara atau DAW), algoritma matematika mereka sendiri dapat digunakan atau pengoperasian teknologi analog dapat dimasukkan.

Parameter utama kompresor

Ambang.

Kompresor mengurangi sinyal audio jika primer amplitudo adalah nilai ambang batas tertentu (ambang). Biasanya ditunjukkan dalam desibel, dengan ambang batas bawah (misalnya, -60 dB) berarti bahwa suara akan diproses daripada dengan ambang batas yang lebih tinggi (misalnya, -5 dB).

Perbandingan.

Tingkat penurunan level ditentukan oleh parameter rasio: Rasio 4: 1 berarti bahwa jika level input adalah 4 dB melebihi ambang batas, level output akan lebih tinggi dari ambang batas 1 dB.
Sebagai contoh:
Ambang batas \u003d -10 db
Sinyal input \u003d -6 dB (pada 4 dB di atas ambang batas)
Sinyal output \u003d -9 DB (pada 1 dB di atas ambang batas)

Penting untuk diingat bahwa menekan tingkat sinyal berlanjut dan beberapa waktu setelah jatuh di bawah level ambang batas, dan kali ini ditentukan oleh nilai parameter melepaskan.

Kompresi dengan nilai rasio maksimum ∞: 1 disebut pembatasan. Ini berarti bahwa sinyal apa pun di atas level ambang ditekan sebelum level ambang (dengan pengecualian periode singkat setelah peningkatan tajam dalam volume input). Untuk detailnya, lihat di bawah "Limiter".

Contoh berbagai nilai rasio

Serang dan lepaskan

Kompresor memberikan kontrol tertentu atas seberapa cepat ia merespons mengubah dinamika sinyal. Parameter serangan mendefinisikan waktu di mana kompresor mengurangi koefisien gain ke level, yang ditentukan oleh parameter rasio. Rilis mendefinisikan waktu untuk kompresor, sebaliknya, meningkatkan koefisien gain, atau kembali normal jika tingkat sinyal input turun di bawah nilai ambang batas.

Serangan dan rilis fase

Parameter ini menunjukkan waktu (biasanya dalam milidetik), yang akan diperlukan untuk mengubah penguatan dengan sejumlah desibel, biasanya 10 dB. Misalnya, dalam hal ini, jika serangan diatur ke 1 ms, untuk mengurangi gain sebesar 10 dB, 1 MS akan diperlukan, dan 20 dB - 2 ms.

Dalam banyak kompresor, parameter serangan dan rilis dapat dikonfigurasi, tetapi dalam beberapa yang awalnya diatur dan tidak diatur. Kadang-kadang mereka ditetapkan sebagai "ketergantungan" otomatis "atau" program ", mis. bervariasi tergantung pada sinyal input.

Lutut.

Parameter kompresor lain: hard / Lembut Lutut. Ini menentukan apakah awal penerapan kompresi adalah tajam (keras) atau bertahap (lunak). Lutut lembut mengurangi keterlambatan transisi dari sinyal mentah ke sinyal yang mengalami kompresi, terutama pada nilai rasio tinggi dan volume tajam meningkat.

Kompresi lutut keras dan lutut lembut

Puncak dan RMS.

Kompresor dapat bereaksi terhadap nilai puncak (maksimum jangka pendek) atau pada level input rata-rata. Penggunaan nilai puncak dapat menyebabkan fluktuasi tajam dalam tingkat kompresi, dan bahkan untuk distorsi. Oleh karena itu, kompresor menerapkan fungsi rata-rata (biasanya ini adalah sinyal input RMS) saat membandingkannya dengan nilai ambang batas. Ini memberikan kompresi yang lebih nyaman, dekat dengan persepsi manusia dari volume.

RMS adalah parameter yang mencerminkan volume rata-rata fonogram. Dari sudut pandang matematika RMS (Root Mean Square) adalah nilai RMS amplitudo dari sejumlah sampel tertentu:

Menghubungkan stereo.

Kompresor dalam mode penghubung stereo menerapkan gain yang sama dengan saluran stereo. Ini menghindari perpindahan stereopanorama, yang dapat menjadi hasil dari pemrosesan individu saluran kiri dan kanan. Perpindahan semacam itu terjadi jika, misalnya, elemen keras yang terengah-engah tidak terengah-engah.

Rias makeup.

Karena kompresor mengurangi tingkat sinyal keseluruhan, kemungkinan gain tetap pada output biasanya ditambahkan, yang memungkinkan Anda untuk mendapatkan level optimal.

LIHAT KE DEPAN.

Fungsi tampilan-ke depan dirancang untuk menyelesaikan masalah khususnya serangan dan rilis nilai terlalu besar dan terlalu kecil. Terlalu banyak serangan tidak memungkinkan Anda untuk secara efektif mencegat transien, tetapi terlalu kecil mungkin tidak nyaman untuk pendengar. Saat menggunakan fungsi tampilan-depan, sinyal utama tertunda relatif terhadap pengontrol, memungkinkan Anda untuk memulai kompresi terlebih dahulu, bahkan sebelum sinyal mencapai nilai ambang batas.
Satu-satunya kerugian dari metode ini adalah waktu penundaan sinyal, yang dalam beberapa kasus tidak diinginkan.

Penggunaan kompresi dinamis

Kompresi digunakan di mana-mana, tidak hanya dalam fonogram musik, tetapi juga di mana-mana, di mana Anda perlu meningkatkan volume keseluruhan, tanpa meningkatkan tingkat puncak di mana peralatan reproduksi suara yang murah digunakan atau saluran transmisi terbatas (sistem peringatan, radio amatir, dll).

Kompresi diterapkan saat bermain latarbelakang musik (di toko, restoran, dll.), Di mana setiap perubahan volume yang nyata tidak diinginkan.

Tetapi ruang lingkup paling penting dari penerapan kompresi dinamis adalah produksi musik dan penyiaran. Kompresi digunakan untuk memberikan suara "densitas" dan "drive" untuk kombinasi alat yang lebih baik satu sama lain, dan terutama saat memproses vokal.

Pesta vokal dalam musik rock dan pop biasanya dikenakan kompresi untuk menyoroti mereka di latar belakang iringan dan menambah kejelasan. Jenis kompresor khusus, hanya dikonfigurasi pada frekuensi tertentu - Deesser, digunakan untuk menekan latar belakang mendesis.

Pada pihak instrumental, kompresi juga digunakan untuk efek yang tidak secara langsung terkait dengan volume, misalnya, suara drum yang memudar dengan cepat dapat menjadi lebih berkepanjangan.

Dalam musik dansa elektronik (EDM), side-chaning sering digunakan (lihat di bawah) - misalnya, garis bass dapat dikendalikan oleh tong atau sesuatu yang mirip dengan mencegah konflik bass dan drum dan menciptakan denyut nadi dinamis.

Kompresi banyak digunakan dalam transmisi penyiaran (radio, televisi, penyiaran internet) untuk meningkatkan volume yang dirasakan sambil mengurangi rentang dinamis audio sumber (biasanya CD). Sebagian besar negara memiliki pembatasan hukum pada volume maksimum instan, yang dapat disiarkan. Biasanya, keterbatasan ini diimplementasikan oleh kompresor perangkat keras konstan dalam rantai Ethereal. Selain itu, peningkatan volume yang dirasakan meningkatkan "kualitas" suara dari sudut pandang sebagian besar pendengar.

Lihat juga Perang kenyaringan.

Peningkatan konsisten dalam volume lagu yang sama ditempa untuk CD dari 1983 hingga 2000.

Side-Chaning.

Sakelar kompresor lain yang sering ditemukan adalah "rantai samping". Dalam mode ini, kompresi audio tidak terjadi tergantung pada levelnya sendiri, tetapi tergantung pada level sinyal yang memasuki konektor, yang biasanya disebut - rantai samping.

Ini dapat ditemukan beberapa aplikasi. Misalnya, vokalis shepelvit dan semua huruf "C" menonjol dari gambaran keseluruhan. Anda melewatkan suaranya melalui kompresor, dan konektor rantai samping menyajikan suara yang sama, tetapi melewatkan equalizer. Pada equalizer Anda menghapus semua frekuensi, kecuali untuk yang digunakan oleh vokalis saat melafalkan huruf "C". Biasanya sekitar 5 kHz, tetapi bisa dari 3 kHz hingga 8 kHz. Jika kemudian masukkan kompresor ke dalam mode rantai samping, maka kompresi suara akan terjadi pada saat-saat ketika huruf "C" diucapkan. Dengan demikian, ternyata perangkat yang dikenal sebagai "Deesser" (de-Esser). Metode kerja ini disebut "dependen frekuensi" (tergantung frekuensi).

Penggunaan lain dari fitur ini disebut "Ducker". Misalnya, di stasiun radio, musik melewati kompresor, dan kata-kata DJ - melalui rantai samping. Ketika DJ mulai mengobrol, volume musik secara otomatis berkurang. Efek ini dapat berhasil digunakan dalam catatan, misalnya, mengurangi volume batch keyboard selama bernyanyi.

Membatasi dinding bata

Kompresor dan limiter kira-kira sama, dapat dikatakan bahwa limiter adalah kompresor rasio tinggi (dari 10: 1) dan, biasanya, waktu serangan rendah.

Ada konsep pembatas dinding bata - pembatasan rasio yang sangat tinggi (dari 20: 1 ke atas) dan serangan yang sangat cepat. Idealnya, itu tidak memungkinkan sinyal melebihi level ambang batas. Hasilnya akan menjadi tidak menyenangkan untuk rumor, tetapi ini akan mencegah kerusakan pada teknologi reproduksi suara atau bandwidth saluran berlebih. Banyak produsen mengintegrasikan perangkat limiter untuk tujuan ini.

Clipper vs. Limiter, soft dan keras kliping

Kelompok metode ini didasarkan pada fakta bahwa sinyal yang ditransmisikan dikenakan transformasi amplitudo non-linear, dan dalam mentransmisikan dan menerima bagian nonlinearitas dikonversi. Misalnya, jika pemancar menggunakan fungsi nonlinear ÖU, di penerima - U 2. Penerapan fungsi konvergen yang konsisten akan mengarah pada fakta bahwa, secara umum, transformasi tetap linier.

Gagasan metode kompresi data nonlinear dikurangi menjadi fakta bahwa pemancar dapat memberikan rentang perubahan yang lebih besar pada parameter yang ditransmisikan dengan amplitudo sinyal output yang sama (yaitu, rentang dinamis yang lebih besar). Rentang dinamis - Ini dinyatakan dalam unit relatif atau sikap decibelah dari amplitudo sinyal terbesar yang dapat diterima dengan terkecil:

; (2.17)
. (2.18)

Keinginan alami untuk meningkatkan rentang dinamis dengan mengurangi U min dibatasi oleh sensitivitas peralatan dan peningkatan efek interferensi dan kebisingannya sendiri.

Paling sering, kompresi rentang dinamis dilakukan dengan menggunakan sepasang fungsi konvergen logaritming dan potensiasi. Operasi pertama dari perubahan amplitudo disebut kompresi(kompresi), kedua - expandment. (peregangan). Pilihan fungsi-fungsi ini terkait dengan kemampuan kompresi terbesar mereka.

Pada saat yang sama, metode ini memiliki kerugian. Yang pertama dari mereka adalah bahwa logaritma dari angka kecil negatif dan dalam batas:

artinya, sensitivitasnya sangat nonlinier.

Untuk mengurangi kekurangan ini, kedua fungsi dimodifikasi dengan offset dan aproksimasi. Misalnya, untuk saluran telepon, fungsi yang diperkirakan terkait (Tipe A,):

dan A \u003d 87.6. Keuntungan dari kompresi adalah 24dB.

Kompresi data dengan prosedur nonlinier diimplementasikan oleh fasilitas analog dengan kesalahan besar. Penggunaan alat digital dapat secara signifikan meningkatkan akurasi atau kecepatan transformasi. Pada saat yang sama, penggunaan dana langsung perangkat komputer (Yaitu, perhitungan langsung logaritma dan eksponensial) tidak akan memberikan hasil yang lebih baik karena kesalahan perhitungan kecepatan rendah dan akumulasi.

Kompresi data dengan kompresi karena pembatasan akurasi digunakan dalam kasus-kasus non-respons, misalnya, untuk mengirimkan pidato pada saluran telepon dan radio.

Pengodean yang efektif

Kode Efektif ditawarkan kepada Sundon, Fano dan Hafman. Inti dari kode adalah bahwa mereka tidak merata, yaitu, dengan kategori pelepasan yang berbeda, dan panjang kode berbanding terbalik dengan probabilitas penampilannya. Fitur lain yang luar biasa dari kode efektif - mereka tidak memerlukan pemisah, yaitu, karakter khusus yang memisahkan kombinasi kode tetangga. Ini dicapai dengan mengamati aturan sederhana.: Kode pendek bukan awal yang lebih lama. Dalam hal ini, aliran pembuangan biner yang solid diterjemahkan secara unik, karena decoder mengungkapkan kombinasi kode terpendek terlebih dahulu. Kode efektif untuk waktu yang lama adalah murni akademis, tetapi baru-baru ini digunakan dalam pembentukan basis data, serta dalam mengompres informasi dalam modem modern dan dalam arusar perangkat lunak.

Karena ketidakmampuan, panjang kode rata-rata diperkenalkan. Panjang Medium - Ekspektasi Matematika Panjang Kode:

selain itu, L CP cenderung H (x) dari atas (yaitu, aku, h (x)).

Implementasi kondisi (2.23) ditingkatkan dengan meningkatnya N.

Ada dua varietas kode efektif: Shannon Fano dan Hafman. Pertimbangkan tanda terima mereka pada contoh. Misalkan probabilitas karakter dalam urutan adalah makna yang ditunjukkan pada Tabel 2.1.

Tabel 2.1.

Probabilitas simbol

N.
P I. 0.1 0.2 0.1 0.3 0.05 0.15 0.03 0.02 0.05

Simbol diperingkatkan, yaitu, mereka mencari berturut-turut pada probabilitas turun. Setelah itu, menurut metode Shennon Fano, prosedur berikut ini diulang secara berkala: seluruh kelompok peristiwa dibagi menjadi dua subkelompok dengan total probabilitas yang sama (atau kira-kira sama). Prosedur berlanjut hingga satu elemen tetap dalam subkelompok berikutnya, setelah itu elemen ini dihilangkan, dan dengan sisa tindakan ini berlanjut. Ini terjadi sampai dua subkelompok terakhir tetap menjadi satu elemen. Lanjutkan pertimbangan dari contoh kami, yang berkurang pada Tabel 2.2.

Tabel 2.2.

Chennon Fano Metode.

N. P I.
4 0.3 SAYA.
0.2 SAYA. Ii.
6 0.15 SAYA. SAYA.
0.1 Ii.
1 0.1 SAYA. SAYA.
9 0.05 Ii. Ii.
5 0.05 Ii. SAYA.
7 0.03 Ii. Ii. SAYA.
8 0.02 Ii.

Seperti yang dapat dilihat dari Tabel 2.2, simbol pertama dengan probabilitas p 4 \u003d 0.3 berpartisipasi dalam dua prosedur partisi dan kedua kali menabrak grup i. Sesuai dengan ini, dikodekan oleh kode dua-bit II. Elemen kedua pada tahap pertama partisi milik Grup I, pada kelompok kedua II. Oleh karena itu, kode-kode 10. Kode sisa karakter dalam komentar tambahan tidak perlu.

Biasanya kode yang tidak merata digambarkan dalam bentuk pohon kode. Pohon kode adalah grafik yang menunjukkan kombinasi kode yang diizinkan. Pra-tentukan petunjuk arah tulang rusuk grafik ini, seperti yang ditunjukkan pada Gambar.2.11 (Pilihan arah arbitrer).

Grafik dipandu sebagai berikut: membuat rute untuk simbol khusus; Jumlah pelepasan untuk jumlah tepi dalam rute, dan nilai masing-masing debit sama dengan arah tulang rusuk yang sesuai. Rute dibuat titik sumber. (pada gambar itu ditandai dengan huruf a). Misalnya, rute ke vertex 5 terdiri dari lima tulang rusuk, yang semuanya, selain yang terakhir, memiliki arah 0; Kami mendapatkan kode 00001.

Hitung untuk contoh ini entropi dan panjang tengah kata.

H (x) \u003d - (0.3 log 0,3 + 0.2 log 0,2 + 2 0.1 log 0.1+ 2 0.05 log 0.05+

0.03 Log 0,03 + 0.02 Log 0.02) \u003d 2,23 bit

l CP \u003d 0,3 2 + 0,2 2 + 0,15 3 + 0,1 3 + 0,1 4 + 0,05 5 +0.05 4+

0.03 6 + 0.02 6 = 2.9 .

Seperti yang dapat dilihat, panjang kata sedang dekat dengan entropi.

Kode Hafman dibangun pada algoritma yang berbeda. Prosedur pengkodean terdiri dari dua tahap. Pada tahap pertama, kompresi satu kali dari alfabet secara konsisten. Kompresi satu kali adalah penggantian dua karakter terakhir (dengan probabilitas yang lebih rendah) satu, dengan total probabilitas. Kompresi dilakukan sampai dua karakter tetap ada. Pada saat yang sama mengisi tabel pengkodean di mana probabilitas yang dihasilkan ditempelkan, dan juga menggambarkan rute-rute yang bergerak pada tahap berikutnya.

Pada tahap kedua, pengkodean itu sendiri terjadi, yang dimulai dari tahap terakhir: yang pertama dari dua karakter menetapkan kode 1, yang kedua - 0. Setelah itu, buka tahap sebelumnya. Untuk simbol yang tidak berpartisipasi dalam kompresi pada tahap ini, atribut kode dari tahap selanjutnya, dan ke dua karakter terbaru dua kali atribut kode simbol yang diperoleh setelah menempel, dan menambah ke atas kode 1, 0. Jika Simbol lebih jauh dalam perekatan berpartisipasi, kodenya tetap tidak berubah. Prosedur ini berlanjut hingga akhir (yaitu, hingga tahap pertama).

Tabel 2.3 menunjukkan pengkodean sepanjang algoritma Hafman. Seperti yang dapat dilihat dari tabel, pengkodean dilakukan dalam 7 tahap. Di sebelah kiri adalah probabilitas karakter, kode menengah kanan. Panah menunjukkan memindahkan karakter yang baru dibentuk. Pada setiap tahap, dua karakter terakhir hanya berbeda dengan debit yang lebih muda, yang sesuai dengan teknik pengkodean. Kami menghitung panjang rata-rata kata:

l CF \u003d 0,3 2 + 0.2 2 + 0,15 3 + + 2 0.1 3 + +0.05 4 + 0,05 5 + 0,03 6 + 0,02 6 \u003d 2.7

Bahkan lebih dekat dengan entropi: Kode ini bahkan lebih efektif. Pada Gambar. 2.12 menunjukkan pohon kode Hafman.

Tabel 2.3.

Coding pada algoritma Hafman

N. P I. Kode SAYA. Ii. AKU AKU AKU Iv. V. Vi. Vii.
0.3 0.3 11 0.3 11 0.3 11 0.3 11 0.3 11 0.4 0 0.6 1
0.2 0.2 01 0.2 01 0.2 01 0.2 01 0.3 10 0.3 11 0.4 0
0.15 0.15 101 0.15 101 0.15 101 0.2 00 0.2 01 0.3 10
0.1 0.1 001 0.1 001 0.15 100 0.15 101 0.2 00
0.1 0.1 000 0.1 000 0.1 001 0.15 100
0.05 0.05 1000 0.1 1001 0.1 000
0.05 0.05 10011 0.05 1000
0.03 0.05 10010
0.02

Kedua kode memenuhi persyaratan keunikan decoding: seperti yang dapat dilihat dari tabel, kombinasi yang lebih pendek bukanlah awal kode yang lebih panjang.

Dengan meningkatnya jumlah simbol, efektivitas kode meningkat, sehingga dalam beberapa kasus menyandikan blok yang lebih besar (misalnya, jika kita berbicara tentang teks, Anda dapat menyandikan beberapa suku kata, kata-kata, dan frasa yang paling umum).

Efek dari implementasi kode tersebut ditentukan dibandingkan dengan kode seragam:

(2.24)

di mana n adalah jumlah pelepasan kode seragam, yang diganti dengan efektif.

Modifikasi Kode Khafman

Algoritma Hafman klasik mengacu pada dua lumayan, I.E. Membutuhkan serangkaian statistik awal pada simbol dan pesan, dan kemudian prosedur yang dijelaskan di atas. Itu tidak nyaman dalam praktiknya, karena meningkatkan waktu pemrosesan pesan dan akumulasi kamus. Metode single-pass di mana akumulasi dan prosedur pengkodean digabungkan. Metode seperti itu juga disebut kompresi adaptif sepanjang Hafman [46].

Inti dari kompresi adaptif di seluruh Hafman berkurang menjadi pembangunan pohon kode awal dan modifikasinya yang konsisten setelah penerimaan setiap simbol berikutnya. Seperti sebelumnya, pohon-pohon di sini adalah biner, mis. Dari setiap titik grafik - kayu, maksimum dua busur terjadi. Adalah adat untuk memanggil puncak asli oleh orang tua, dan dua simpul berikutnya yang terkait - anak-anak. Kami memperkenalkan konsep bobot vertex - ini adalah jumlah karakter (kata) yang sesuai dengan titik ini yang diperoleh ketika urutan awal diterapkan. Jelas, jumlah timbangan anak sama dengan berat induk.

Setelah memasukkan simbol urutan input berikutnya, pohon kode direvisi: bobot simpul dihitung ulang dan, jika perlu, simpul disusun ulang. Aturan penataan ulang simpul sebagai berikut: bobot simpul bawah adalah yang terkecil, dan simpul yang tersisa pada kolom memiliki bobot terkecil.

Pada saat yang sama, simpul diberi nomor. Penomoran dimulai dengan yang lebih rendah (gantung, aku. yang tidak memiliki anak) simpul dari kiri ke kanan, kemudian ditransfer ke tingkat atas dll. untuk penomoran yang terakhir, sumber vertex. Pada saat yang sama, hasil berikut tercapai: semakin sedikit bobot vertex, semakin sedikit jumlahnya.

Permutasi dilakukan terutama untuk menggantung simpul. Ketika permutasi, aturan yang dirumuskan dipertimbangkan: bagian atas dengan berat tinggi memiliki jumlah yang lebih besar.

Setelah melewati urutan (itu juga disebut kontrol atau tes), kombinasi kode ditugaskan untuk semua simpul gantung. Aturan penugasan aturan mirip dengan di atas: jumlah pelepasan kode sama dengan jumlah simpul yang melaluinya rute berjalan dari sumber ke titik gantung ini, dan nilai debit tertentu sesuai dengan arah dari orang tua ke arah. "Anak" (katakanlah, transisi ke kiri dari induk sesuai dengan nilai 1, kanan - 0).

Kombinasi kode yang diperoleh dimasukkan ke dalam memori perangkat kompresi bersama dengan analog mereka dan membentuk kamus. Penggunaan algoritma adalah sebagai berikut. Urutan karakter yang dapat dikompres dibagi menjadi beberapa fragmen sesuai dengan kamus yang ada, setelah itu masing-masing fragmen diganti dengan kode dari kamus. Fragmen yang tidak terdeteksi dalam kamus membentuk simpul gantung baru, menambah berat badan dan juga dimasukkan ke dalam kamus. Ini dibentuk oleh algoritma adaptif untuk pengisian kamus.

Untuk meningkatkan efisiensi metode, diinginkan untuk meningkatkan ukuran kamus; Dalam hal ini, koefisien kompresi meningkat. Hampir ukuran kamus adalah 4 - 16 kb memori.


Kami menggambarkan algoritma yang diberikan oleh sebuah contoh. Pada Gambar. 2.13 menunjukkan diagram sumber (juga disebut dengan pohon Hafman). Setiap simpul kayu ditunjukkan oleh persegi panjang, di mana dua digit dituliskan melalui fraksi: yang pertama berarti jumlah simpul, yang kedua adalah beratnya. Bagaimana Anda bisa memastikan bahwa bobot vensif dan jumlahnya puas.

Misalkan sekarang simbol yang sesuai dengan vertex 1, dalam urutan pengujian bertemu sekunder. Berat simpul berubah, seperti yang ditunjukkan pada Gambar. 2.14, sebagai hasilnya, jumlah penomoran titik dilanggar. Pada tahap selanjutnya, kami mengubah tata letak simpul gantung, yang kami ubah simpul 1 dan 4 dan merenovasi semua simpul pohon. Grafik yang dihasilkan ditunjukkan pada Gambar. 2.15. Selanjutnya, prosedurnya berlanjut.

Harus diingat bahwa setiap puncak gantung di Pohon Hafman sesuai dengan simbol tertentu atau grup mereka. Orang tua berbeda dari anak-anak dengan fakta bahwa sekelompok karakter, itu sesuai untuknya, untuk satu simbol singkatnya, daripada anak-anaknya, dan anak-anak ini berbeda dalam simbol terakhir. Misalnya, orang tua sesuai dengan simbol "mobil"; Kemudian anak-anak mungkin memiliki urutan "kara" dan "ikan mas".

Algoritma di atas bukanlah akademis dan secara aktif digunakan dalam program - ARTRIVER, termasuk saat mengompres data grafik (mereka akan dibahas di bawah).

Lempel - Algoritma Ziva

Ini adalah algoritma kompresi yang paling umum digunakan. Mereka digunakan dalam sebagian besar program - ARTRIVER (misalnya, pkzip. Arj, LHA). Esensi algoritma adalah bahwa beberapa set karakter diganti saat mengarsipkannya dalam kamus yang dihasilkan khusus. Misalnya, sering ditemukan dalam urusan frasa "pada nomor keluar surat Anda ..." dapat menempati di posisi kamus 121; Kemudian, alih-alih mentransfer atau menyimpan frasa yang disebutkan (30 byte), Anda dapat menyimpan nomor frasa (1,5 byte dalam bentuk biner - desimal atau 1 byte - dalam biner).

Algoritma dinamai setelah penulis yang pertama kali menawarkannya pada tahun 1977. Ini, yang pertama - LZ77. Untuk pengarsipan, jendela geser yang disebut terdiri dari dua bagian dibuat. Bagian pertama, format yang lebih besar, berfungsi untuk membentuk kamus dan memiliki ukuran urutan beberapa kilobyte. Pada bagian kedua, lebih kecil (biasanya hingga 100 bytes) diterima oleh karakter teks saat ini yang dilihat. Algoritma ini berusaha menemukan dalam set karakter kamus yang bertepatan dengan jendela yang dilihat. Jika memungkinkan, kode yang terdiri dari tiga bagian dihasilkan: perpindahan dalam kamus mengenai substring awalnya, panjang substring ini di sebelah karakter substrat ini. Misalnya, substrat khusus terdiri dari simbol "aplikasi" (hanya 6 karakter), simbol berikut adalah "E". Kemudian, jika substring memiliki alamat (tempat di kamus) 45, maka catatan dalam kamus memiliki bentuk "45, 6. E". Setelah itu, isi jendela bergeser ke posisi, dan pencarian berlanjut. Dengan demikian, kamus terbentuk.

Keuntungan dari algoritma adalah algoritma yang mudah diformalkan untuk menyusun kamus. Selain itu, dimungkinkan untuk unzip dan tanpa kamus awal (diinginkan untuk memiliki urutan tes) - kamus terbentuk dalam proses UNIMBER.

Kerugian algoritma muncul dengan peningkatan ukuran kamus - waktu untuk mencari meningkat. Selain itu, jika serangkaian karakter hilang di jendela saat ini, setiap simbol ditulis ke kode tiga elemen, I.E. Ternyata tidak kompresi, tetapi peregangan.

Fitur terbaik Ini memiliki algoritma LZSS yang diusulkan pada tahun 1978. Ini memiliki perbedaan dalam memelihara jendela geser dan kode output dari kompresor. Selain jendela, algoritma membentuk pohon biner, mirip dengan pohon Hafman untuk mempercepat pencarian kebetulan: setiap substring meninggalkan jendela saat ini ditambahkan ke pohon sebagai salah satu anak. Algoritma semacam itu memungkinkan Anda untuk lebih meningkatkan ukuran jendela saat ini (diinginkan bahwa nilainya sama dengan derajat dua: 128, 256, dll. Kode urutan juga terbentuk berbeda: awalan 1-bit juga diperkenalkan untuk membedakan karakter yang tidak diproyeksikan dari pasangan "offset, panjang".

Kompresi yang bahkan lebih besar diperoleh dengan menggunakan algoritma tipe LZW. Algoritma yang dijelaskan sebelumnya memiliki ukuran jendela tetap, yang mengarah pada ketidakmungkinan masuk ke dalam kamus frasa lebih panjang dari ukuran jendela. Dalam algoritma LZW (dan pendahulunya LZ78) Jendela View memiliki ukuran yang tidak terbatas, dan kamus mengakumulasi frasa (dan bukan totalitas karakter seperti sebelumnya). Kamus ini memiliki panjang yang tidak terbatas, dan encoder (decoder) beroperasi dalam mode mode siaga. Ketika frasa yang bertepatan dengan kamus terbentuk, kode kebetulan dikeluarkan (I.E. Kode frasa ini dalam kamus) dan kode simbol berikut di belakangnya. Jika sebagai simbol menumpuk frasa baru terbentuk, itu juga dimasukkan ke dalam kamus, sebagai yang terpendek. Akibatnya, prosedur rekursif terbentuk, memberikan pengkodean cepat dan decoding.

Kesempatan tambahan Kompresi menyediakan pengkodean kompresi karakter berulang. Jika dalam urutan, beberapa karakter mengikuti dalam baris (misalnya, dalam teks itu mungkin karakter "spasi", dalam urutan numerik - nol yang mengalir, dll.), Masuk akal untuk mengganti pasangan mereka "simbol; panjangnya; "atau" tanda, panjang ". Dalam kasus pertama, kode menunjukkan fitur yang secara urutnya dikodekan (biasanya 1 bit), maka kode simbol berulang dan panjang urutan. Dalam kasus kedua (disediakan untuk simbol berulang yang paling umum) dalam awalan menunjukkan hanya tanda pengulangan.