Ses sıkıştırma: prensip ve yapılandırma. Sentez ve konuşma tanıma

Araştırmacıların bilgisayarlar için bir konuşma arayüzü oluşturma problemini çözmek için zaman boyunca, genellikle bağımsız olarak ekipman üretmek için sık sık, bilgisayardan sesli bilgi girmenizi ve bilgisayardan görüntülemenizi sağlar. Günümüzde, bu tür cihazlar benzersiz tarihsel ilgiye sahip olabilir, çünkü modern bilgisayarlar ses adaptörleri, mikrofonlar, kulaklıklar ve ses kolonları gibi giriş ve çıkış cihazlarını kolayca donatabilirler.

Ayrıntıları derinlemeyeceğiz dahili cihaz Bu cihazlar, ancak nasıl çalıştıklarını söyleyeceğiz ve tanıma sistemleri ve konuşma sentezi ile çalışmak için sesli bilgisayar aygıtlarını seçmek için bazı önerilerde bulunacağız.

Önceki bölümde zaten konuştuğumuz gibi, ses, frekans aralığında kişi tarafından algılanan frekans aralığında yatan hava salınımlarından daha fazla bir şey değil. Farklı kişilerde, sesli frekansların çeşitliliğinin kesin sınırları değişebilir, ancak ses salınımlarının 16-20.000 Hz aralığında yattığına inanılmaktadır.

Mikrofonun görevi, ses dalgalanmalarını elektrik salınımlarına dönüştürmektir, bu da takviyeli olmaya devam edebilecek, paraziti gidermek için süzülür ve bilgisayara ses bilgisine girmek için dijitalleştirilir.

Operasyon prensibine göre, en yaygın mikrofonlar kömür, elektrodinamik, kondansatör ve elektrete ayrılır. Bu mikrofonların bazıları işlerini gerektirir dış kaynak Akım (örneğin, kömür ve kondansatör), ses salınımları etkisiyle diğerleri bağımsız olarak alternatif bir elektrik voltajı üretebilir (bunlar elektrodinamik ve elektreter mikrofonlardır).

Mikrofonları amaçla bölebilirsin. Elinde tutulabilen veya standda sabitlenebilecek stüdyo mikrofonları vardır, kıyafetlere sabitlenebilecek radyo mikrofonları vardır.

Özellikle bilgisayarlar için tasarlanmış mikrofonlar da vardır. Bu tür mikrofonlar genellikle tablonun yüzeyinde standa tutturulur. Bilgisayar mikrofonları, Şekil 2'de gösterildiği gibi kulaklıklarla birleştirilebilir. 2-1.

İncir. 2-1. Mikrofonlu kulaklıklar

Konuşma tanıma sistemleri için en uygun olan tüm mikrofonların tüm çeşitlerinden seçim yapılır?

Prensip olarak, bir bilgisayar ses adaptörüne bağlı olmadığı sürece, sahip olduğunuz herhangi bir mikrofonla deneyebilirsiniz. Bununla birlikte, konuşma tanıma sistemlerinin geliştiricileri, işte hoparlörün ağzının kalıcı bir mesafesinde olacak şekilde böyle bir mikrofon elde edilmesi önerilir.

Mikrofon ve ağız arasındaki mesafe değişmezse, mikrofondan gelen ortalama elektriksel sinyal de çok fazla değişecektir. Bu, modern konuşma tanıma sistemlerinin çalışmalarının kalitesi üzerinde olumlu bir etkiye sahip olacaktır.

Buradaki sorun nedir?

Bir kişi, hacmini çok geniş sınırlarda değişen konuşmayı başarıyla tanıyabilir. İnsan beyni, sokaktan geçen arabaların gürültüsü, dış konuşmalar ve müzik gibi sessiz konuşmayı parazitten filtreleyebilir.

Modern konuşma tanıma sistemlerine gelince, bu alandaki yetenekleri arzu edilecek çok şey bırakıyor. Mikrofon masanın üzerinde durursa, kafa döndürüldüğünde veya vücudun konumunu değiştirdiğinde, ağız ve mikrofon arasındaki mesafe değişecektir. Bu, mikrofon çıkış sinyali seviyesinde bir değişikliğe yol açacaktır, bu da konuşma tanımanın güvenilirliğini kötüleştirecek.

Bu nedenle, konuşma tanıma sistemleriyle çalışırken, Şekil l'de gösterildiği gibi başlıklara bağlı mikrofonu kullanırsanız, en iyi sonuçlar elde edilecektir. 2-1. Böyle bir mikrofon kullanılırken, ağız ve mikrofon arasındaki mesafe kalıcı olacaktır.

Ayrıca, konuşma tanıma sistemleriyle olan tüm deneylerin en iyi yapıldığı, sessiz bir odada tutulduğu dikkatinizi de öderiz. Bu durumda, girişimin etkisi minimum olacaktır. Tabii ki, güçlü müdahale koşullarında çalışabilecek bir konuşma tanıma sistemi seçmeniz gerekiyorsa, testlerin farklı şekilde gerçekleştirilmesi gerekir. Ancak, kitabın yazarları tarafından bilindiği kadarıyla, konuşma tanıma sistemlerinin gözlemi hala çok, çok düşük.

Mikrofon ABD, dalgalanmalarda ses salınımlarının dönüşümünü yerine getirir. elektrik akımı. Bu salınımlar osiloskopun ekranında görülebilir, ancak bu pahalı cihazı satın almak için mağazaya acele etmeyin. Tüm osilografik araştırmalar Ses Blaster Adaptörü gibi bir ses adaptörü ile donatılmış normal bir bilgisayar kullanarak harcayabiliriz. Daha sonra size nasıl yapacağınızı söyleyeceğiz.

İncirde. 2-2 Bir osilogram gösterdik ses sinyali, Uzun bir sesin söylendiğinde elde edilir. Bu osilogram, GoldWave programı kullanılarak, kitabın bu bölümünde, ayrıca, Şek. 2-1.

İncir. 2-2. Ses sinyalinin osilogramı

GoldWave programı, osilogramı zaman ekseni boyunca gerilmesine izin verir, bu da en küçük detayları görmenizi sağlar. İncirde. 2-3 Yukarıda belirtilen ses osilogramının gerilmiş bir fragmanını gösterdik.

İncir. 2-3. Ses ses osilogram parçası

Mikrofondan gelen giriş sinyalinin büyüklüğünün periyodik olarak değiştiğini ve hem pozitif hem de negatif değerleri aldığını lütfen unutmayın.

Giriş sinyalinde sadece bir frekans mevcutsa (yani ses "saf" ise), mikrofondan elde edilen sinyalin formu sinüzoidal olacaktır. Bununla birlikte, söylediğimiz gibi, insan konuşma seslerinin spektrumu, bir dizi frekansdan oluşur. Sonuç olarak, konuşma sinyali osilogramının formunun sinüzoidal uzaktır.

Değeri sürekli zamanla değişen sinyal, arayacağız analog sinyal. Bu sinyal mikrofondan geliyor. Analog'un aksine, dijital sinyal, zaman ayrımına göre değişen bir dizi sayısal değerdir.

Bilgisayara bip sesi çıkarabilir, analog formdan dijital olarak çevrilmelidir, yani bir dizi sayısal değer biçiminde temsil etmek içindir. Bu işlem bir analog sinyalin dijitalleştirilmesi denir.

Sesin dijitalleştirilmesi (ve herhangi bir analog) sinyal, denilen özel bir cihaz kullanılarak gerçekleştirilir. analogtan dijitale dönüştürücü ADC (Analog Dijital Dönüştürücü, ADC). Bu cihaz, ses adaptörünün kartındadır ve ortak bir mikro-kiriştir.

Analog-dijital dönüştürücü nasıl çalışır?

Periyodik olarak giriş sinyalinin seviyesini ölçer ve ölçüm sonucunun çıkış sayısal değerini verir. Bu işlem, Şekil 2'de gösterilmektedir. 2-4. Burada, gri dikdörtgenler, belirli bir sabit zaman aralığında ölçülen giriş değerlerini işaretledi. Bu tür değerler kümesi ve giriş analog sinyalinin sayısallaştırılmış bir gösterimidir.

İncir. 2-4. Sinyalin genliğinin zamandan bağımlılığının ölçülmesi

İncirde. 2-5 Analog-dijital dönüştürücünün mikrofona bağlanmasını gösterdik. Bu durumda, X 1 girişi hizmet eder analog sinyalve dijital sinyal U 1 -U N çıkışlarından çıkarılır.

İncir. 2-5. Analog-Dijital Dönüştürücü

Analog-to-dijital dönüştürücüler, iki önemli parametre ile karakterize edilir - dönüşüm frekansı ve giriş sinyalinin nicelleştirme seviyelerinin sayısıdır. Bu parametrelerin doğru seçimi, analog sinyalin dijital formunda yeterli bir gösterim elde etmek için kritik öneme sahiptir.

Sıklıkla, girdi analog sinyalinin genliğinin değerini ne sıklıkla ölçmeniz gerekir, böylece sayısallaştırma nedeniyle giriş analog sinyalindeki değişiklikler hakkında bilgi kaybolmaz mı?

Cevabın basit olduğu görülüyor - giriş sinyali mümkün olduğu kadar sık \u200b\u200bölçülmelidir. Nitekim, analog-dijital dönüştürücü, bu tür ölçümleri gerçekleştirirse, giriş analog sinyalinin genliğindeki en ufak değişiklikler izlenecektir.

Bununla birlikte, gereksiz yere sık ölçümler, bir sinyal işlenirken, dijital veri akışının ve işe yaramaz harcama bilgisayarı kaynaklarının haksız bir büyümesine yol açabilir.

Neyse ki, doğru seçim Frekans dönüşümü (örnekleme frekansı) yeterince basittir. Bunu yapmak için, dijital sinyal işleme alanında uzman kişilerce bilinen Kotelnikov teoremiyle iletişim kurmak yeterlidir. Teorem, dönüşüm sıklığının, dönüştürülmüş sinyalin spektrumunun maksimum frekansından iki kat daha yüksek olması gerektiğini belirtir. Bu nedenle, ses sinyalinin kalitesini kaybetmeden, 16-20.000 Hz aralığında yatan frekans, 40.000 Hz'den az olmayan dönüşüm sıklığını seçmeniz gerekir.

Bununla birlikte, profesyonel ses ekipmanında, dönüşüm sıklığı, belirtilen değerin birkaç kez seçilir. Bu, çok yüksek kaliteli bir ses elde etmek için yapılır. Konuşma tanıma sistemleri için bu kalite alakalı değildir, bu yüzden böyle bir seçeneğe dikkatinizi keskinleştirmeyeceğiz.

İnsan konuşmasının sesini dijitalleştirmek için hangi dönüşümün sıklığına ihtiyaç vardır?

İnsan konuşmasının sesleri 300-4000 Hz frekans aralığında yattığından, dönüşümün minimum gerekli sıklığı 8000 Hz'dir. Ancak birçok bilgisayar programları Konuşma tanıma konvansiyonel ses adaptörleri için standart kullanın. Dönüşüm frekansı 44.000 Hz'dir. Bir yandan, dönüşümün bu frekansı, dijital verilerin akışında aşırı bir artışa yol açmaz ve diğeri - yeterince kaliteye sahip konuşma sayısallaştırması sağlar.

Okulda bile, herhangi bir ölçümle, hataların tamamen kurtulması imkansız olduğu öğretildik. Bu tür hatalar, ölçüm cihazlarının sınırlı çözünürlüğü nedeniyle yanı sıra, ölçüm işleminin kendisinin ölçülen değerde bazı değişiklikler yapması nedeniyle oluşur.

Bir analog-dijital dönüştürücü, sınırlı bitlerin bir akışının formundaki giriş analog sinyalini temsil eder. Geleneksel ses adaptörleri, giriş sinyalinin genliğini 216 \u003d 65536 farklı değerlerde temsil edebilen 16 bit ADC bloklarını içerir. High-end ses ekipmanındaki ADC cihazları 20 bit olabilir, ses sinyalinin genliğinin daha fazla doğruluğu sağlar.

Olağan ses adaptörleriyle donatılmış sıradan bilgisayarlar için modern sistemler ve konuşma tanıma programları oluşturulmuştur. Bu nedenle, konuşma tanıma ile deneyler yapmak için, profesyonel bir ses adaptörü edinmeniz gerekmez. Sesli Blaster olarak böyle bir adaptör, daha da tanımak için konuşma sayısallaştırıcı için oldukça uygundur.

Mikrofona yararlı sinyalin yanı sıra, çeşitli sesler genellikle düşüyor - sokaktan gürültü, rüzgar gürültüsü, yabancı konuşmalar vb. Gürültü, konuşma tanıma sistemlerinin çalışmalarının kalitesi üzerinde olumsuz bir etkisi vardır, bu yüzden onunla başa çıkması gerekir. Zaten bahsettiğimiz bir yol - bugünün konuşma tanıma sistemleri sessiz bir odada en iyi şekilde kullanıyor, bir bilgisayarla bir bilgisayarla kalıyor.

Ancak, ideal koşullar her zaman değil, kullanmanız gerekir. Özel yöntemlergürültüden kurtulmanıza izin vermek. Gürültü seviyelerini azaltmak için, mikrofonlar ve faydalı bilgiler taşımayan bir analog frekans sinyalinin spektrumundan çıkarılan özel filtreler yapılırken özel püf noktaları kullanılır. Ek olarak, bu teknik sıkıştırma olarak kullanılır. dinamik aralık Giriş seviyeleri.

Tüm bunları sırayla söyleyin.

Frekans filtresi Bir analog sinyalin frekans spektrumunu dönüştüren bir cihaz denir. Bu durumda, belirli frekansların salınımlarının dönüşüm işlemi (veya emilimi) meydana gelir.

Bu cihazı bir giriş ve bir çıkış içeren bir dizi kara kutu şeklinde hayal edebilirsiniz. Durumumuzla ilgili olarak, frekans filtresi girişine bir mikrofon bağlanacaktır ve çıkışa analog-dijital dönüştürücü bağlanacaktır.

Frekans filtreleri farklıdır:

· Düşük frekans filtreleri;

· Üst frekans filtreleri;

· Şerit filtreleri geçen;

· Basılmış şerit filtreleri.

Düşük frekans filtreleri (Düşük geçişli filtre), giriş spektrumundan çıkarılır. Değerleri, filtre ayarına bağlı olarak bazı eşik frekansının altında olan tüm frekanslardır.

Ses sinyalleri 16-20.000 Hz aralığında yattığından, ses kalitesini bozmadan 16 Hz'den daha az olan tüm frekanslar kesilebilir. Konuşma tanıma için, 300-4000 Hz frekans aralığı önemlidir, böylece 300 Hz'nin altındaki frekansları kesebilirsiniz. Bu durumda, tüm girişim, 300 Hz'in altında yatan ve konuşma tanıma sürecine müdahale etmeyecek olan frekans spektrumunun giriş sinyalinden kesilecektir.

Benzer şekilde, Üst frekans filtreleri (Yüksek geçişli filtre), tüm frekansların üzerindeki tüm frekansların giriş spektrumundan kesilir.

Bir kişi, 20.000 Hz ve yukarıdaki bir frekanslı sesleri duymaz, böylece gözle görülür bir ses kalitesi bozulma olmadan spektrumdan kesilebilirler. Konuşma tanıma gelince, burada tüm frekansları 4000 Hz'in üzerindeki, yüksek frekanslı girişim düzeyinde önemli bir azalmaya neden olacaktır.

Şerit filtresi iletme (Band -pass filtresi), alt ve üst frekans filtresinin bir kombinasyonu olarak hayal edilebilir. Böyle bir filtre, sözde tüm frekansları geciktirir. alt frekansYukarıdaki gibi Üst Frekans Bant Genişliği.

Böylece, konuşma tanıma sistemi için, 300-4000 Hz aralığının frekansları dışındaki tüm frekansları geciktiren bir bant genişliği filtresi kullanışlıdır.

Ateşleme şeridi filtreleri (bant -stop filtresi) için olduğu gibi, belirtilen aralıkta yatan tüm frekansların giriş spektrumunu kesmenize izin verir. Böyle bir filtre, örneğin, sinyalin spektrumunun katı bir kısmını işgal eden gürültüyü bastırmak için uygundur.

İncirde. 2-6 Bant genişliği filtresinin bağlantısını gösterdik.

İncir. 2-6. Sayısallaştırmadan önce ses sinyali filtreleme

Bilgisayarda kurulu olağan ses adaptörlerinin, bileşimlerinde bir analog sinyalin sayısallaştırmadan önce geçtiği bir şerit filtresinde bulunduğu söylenmelidir. Böyle bir filtrenin bant genişliği genellikle ses sinyallerinin aralığına, yani 16-20.000 Hz (farklı ses adaptörlerinde, üst ve alt frekansın değerleri küçük limitlerde değişebilir).

Ve insan spektral spektrumunun en bilgilendirici bir kısmına karşılık gelen 300-4000 Hz'in daha dar bir bant genişliği nasıl elde edilir?

Tabii ki, radyo elektronik ekipmanı tasarlama eğiliminiz varsa, filtrenizi operasyonel amplifikatörün, dirençlerin ve kapasitörlerin mikro küvetinden yapabilirsiniz. Konuşma tanıma sistemlerinin yaklaşık ilk yaratıcıları.

fakat endüstriyel Sistemler Konuşma tanıma standart bilgisayar donanımında uygulanabilir olmalıdır, bu nedenle özel bir bant filtresi üretimi yolu burada uygun değildir.

Bunun yerine, sözde modern konuşma işleme sistemlerinde kullanılır. dijital Frekans Filtreleriprogramsal olarak uygulandı. Sonra mümkün oldu İşlemci Bilgisayar yeterince güçlü hale geldi.

Dijital frekans filtresi uygulanan yazılım, giriş dijital sinyalini çıkış dijital sinyaline dönüştürür. Dönüşüm sürecinde, program analog-dijital bir dönüştürücüden gelen sinyal genliğinin lüminesansının bir sinyalinin özel bir akışını işler. Dönüşümün sonucu aynı zamanda sayıların sayısı olacaktır, ancak bu iş parçacığının zaten filtrelenmiş bir sinyale karşılık gelecektir.

Analog-dijital dönüştürücü hakkında konuşmak, böyle not ettik Önemli bir özelliknicelleme seviyelerinin sayısı olarak. Ses adaptörüne 16 bit analog-dijital dönüştürücü takılıysa, ses sinyal seviyelerini dijitalleştirdikten sonra 216 \u003d 65536 farklı değerler olarak gösterilebilir.

Birkaç niceleme seviyesi varsa, sözde sözde hile sesi. Bu gürültüyü azaltmak için, yüksek kaliteli ses sayısallaştırma sistemlerinde, analog-dijital dönüştürücüler mevcut maksimum sayı seviyesi sayısıyla uygulanmalıdır.

Bununla birlikte,, dijital ses kayıt sistemlerinde kullanılan ses sinyalinin kalitesi üzerindeki nicelleme gürültüsünün etkisini azaltmanıza olanak sağlayan başka bir alım var. Bu alımı sayısallaştırmadan önce kullanırken, sinyal, sinyalin küçük bir genliğine sahip sinyallerin altını çizen bir doğrusal olmayan bir amplifikatörden geçirilir. Böyle bir cihaz, zayıf sinyalleri güçlü olandan daha güçlü arttırır.

Bu, çıkış sinyalinin genliğinin genliğinin, Şekil 2'de gösterilen giriş sinyalinin genliğinden bağımlılığının bir grafiği ile gösterilmiştir. 2-7.

İncir. 2-7. Dijitalleştirmeden önce doğrusal olmayan amplifikasyon

Sayısallaştırılmış sesin analoguna ters dönüşüm aşamasında (bu bölümde bu bölümde aşağıdaki adımı düşünüyoruz) Ses sütununu görüntülemeden önce, analog sinyal tekrar doğrusal olmayan bir amplifikatörden geçirilir. Bu sefer bir başka amplifikatör, büyük bir genlikli sinyalleri vurgulayan ve bir transfer özelliği (çıkış sinyalinin genliğine bağlı olarak, giriş sinyalinin genliğine bağlı olarak), sayısallaştırma sırasında kullanılan ters birini vardır.

Bütün bunlar konuşma tanıma sistemlerinin yaratıcıları nasıl yardımcı olabilir?

Bilindiği gibi kişi, sessiz bir fısıltı veya oldukça yüksek sesle söylenen konuşma tarafından oldukça iyi tanınır. Bir kişi için başarılı bir şekilde tanınan konuşmanın dinamik hacim seviyelerinin oldukça geniş olduğu söylenebilir.

Bugünkü bilgisayar sistemleri Konuşma tanıma, ne yazık ki, ona sahip olana kadar. Bununla birlikte, dijitalleştirmeden önce belirtilen dinamik aralığın belirli bir genişlemesinin amacı ile, mikrofondan bir sinyali, bir doğrusal olmayan bir amplifikatörden geçerek, transfer özelliği, Şekil 2'de gösterilmiştir. 2-7. Bu, zayıf sinyallerin sayısallaştırılması sırasında niceleyin gürültü seviyesini azaltacaktır.

Konuşma tanıma sistemlerinin geliştiricileri, öncelikle seri olarak üretilen ses adaptörlerine odaklanmak zorunda kalır. Yukarıda tarif edilen doğrusal olmayan sinyal dönüşümünü sağlamazlar.

Ancak, konuşma tanıma modülüne iletmeden önce sayısallaştırılmış bir sinyali dönüştüren doğrusal olmayan bir amplifikatöre eşdeğer bir yazılım oluşturabilirsiniz. Ve böyle bir program amplifikatörü, niceleyin gürültüsünü azaltamamasına rağmen, en büyük konuşma bilgilerini taşıyan sinyal seviyelerini vurgulamak mümkündür. Örneğin, sinyalin gürültüsünden ortadan kaldırdığı, zayıf sinyallerin genliğini azaltabilirsiniz.

© 2014 Site

Veya fotografik enlem Fotoğraf materyali, resimde doğru şekilde yakalanabilen maksimum ve minimum maruz kalma değerleri arasındaki ilişkidir. Dijital fotoğrafçılığa referansla, dinamik aralık aslında maruz kalma sırasında Fotoğraf Seensor tarafından üretilen faydalı elektriksel sinyalin maksimum ve minimum değerlerinin oranı eşdeğerdir.

Dinamik aralık, maruz kalma adımlarında () ölçülür. Her adım, ışık miktarını iki katına çıkarır. Örneğin, belirli bir kamera 8 EV'nin dinamik bir aralığına sahipse, bu, matrisinin faydalı sinyalinin maksimum değerinin en az 2 8: 1 olduğu anlamına geldiği anlamına gelir; bu, kameranın bir içeride yakalanabileceği anlamına gelir. Parlaklıkta farklılık göstermeyen çerçeve nesneleri en fazla 256 kez. Daha kesin olarak, bu nesneleri herhangi bir parlaklıkta yakalayabilir, ancak parlaklığı maksimum değeri aşacak nesneler İzin verilen değer Göz kamaştırıcı beyazın bir resmine çıkalım ve parlaklığı minimum değer - kömür siyahının altında olacak nesneler. Ayrıntılar ve dokular, sadece haznenin dinamik aralığında parlaklığı istiflenen nesnelerde ayırt edilecektir.

Çıkarılabilir nesnelerden en parlak ve en karanlıkların parlaklığı arasındaki ilişkiyi tanımlamak için, "dinamik sahne aralığı" sıklıkla kullanılmaz. Parlaklık aralığı hakkında veya kontrast düzeyinde konuşmak daha doğru olacaktır, çünkü dinamik aralık genellikle ölçüm cihazının karakteristiğidir (içinde bu durum, Dijital kamera matrisleri).

Ne yazık ki, karşılaştığımız birçok güzel sahnenin parlaklığı aralığı gerçek hayatDijital kameranın dinamik aralığını gözle görülür şekilde aşabilir. Bu gibi durumlarda, fotoğrafçı, hangi nesnelerin tüm parçalarda yapılması gerektiğine karar vermeye zorlanır ve hangisinin yaratıcı tasarıma önyargı olmadan dinamik aralığın dışında bırakılabilir. Kameranızın dinamik aralığını en etkili şekilde kullanabilmek için, bazen resimlerin iş prensibini, sanatsal olanı ne kadar gelişmiş bir şekilde anlayabilir.

Dinamik aralık faktörleri

Dinamik aralığın alt sınırı, fotoğraf seensor'un kendi gürültüsü seviyesine göre belirlenir. Unlit Matrix bile, karanlık gürültü olarak adlandırılan bir arka plan elektrik sinyali oluşturur. Ayrıca, şarjın bir analog-dijital dönüştürücüye aktarıldığında parazite meydana gelir ve ADC'nin kendisi, sayısallaştırılmış sinyalde belirli bir hata ortaya koyuyor. Gürültü örneklemesi.

Bir fotoğrafı tam bir karanlıkta veya lens üzerindeki bir kapakla çekerseniz, kamera sadece bu anlamsız gürültüyü kaydeder. Sensöre ulaşmak için minimum ışık sayısının, fotodiodlar bir elektrik yükü biriktirmeye başlayacaktır. Şarjın değeri, faydalı sinyalin yoğunluğu anlamına gelir, yakalanan foton sayısı ile orantılı olacaktır. Bir anlık görüntü için, en azından anlamlı ayrıntılar, faydalı sinyalin seviyesinin arka plan gürültüsü seviyesini aşması gerekir.

Böylece, dinamik aralığın alt sınırı veya başka bir deyişle, sensörün duyarlılık eşiği resmi olarak, sinyal-gürültü oranının üniteden daha büyük olduğu çıkış sinyali seviyesi olarak tanımlanabilir.

Dinamik aralığın üst sınırı, ayrı bir fotodiyodun kabı ile belirlenir. Hafifleme sırasında, herhangi bir fotodiyot, kendisi için sınırlayıcı değerlerin elektrik yükü biriktirecektir, daha sonra aşırı yüklenmiş fotodüre karşılık gelen görüntünün pikselini kesinlikle beyazdır ve daha fazla ışınlama parlaklığını etkilemez. Bu fenomen kırpma denir. Fotodiyotun çılgınlığı ne kadar yüksek olursa, sinyal daha büyük olur, doygunluk ulaşmadan önce çıkışta çıkış yapabileceğidir.

Daha fazla netlik için, çıkış sinyalinin maruziyetten bir grafik olan karakteristik eğriye dönüyoruz. Yatay eksende, sensör tarafından elde edilen ışınlama ikili logaritması ertelenir ve bu ışınlamaya cevap olarak sensör tarafından üretilen elektriksel sinyalin büyüklüğünün dikey ikili logaritmasında. Çizim büyük ölçüde şartlıdır ve son derece açıklama amaçlıdır. Mevcut Fotoğraf Seensor'un karakteristik eğrisi biraz daha karmaşık bir forma sahiptir ve gürültü seviyesi nadiren çok yüksektir.

Grafik açıkça görülebilir iki kritik sert nokta: Bunlardan ilkide, faydalı sinyalin seviyesi gürültü eşiğini geçer ve ikinci - fotodiyotlar doygunluğa ulaşır. Bu iki nokta arasında yatan maruz kalma değerleri dinamik aralıktır. Bu özette, fark etmenin ne kadar kolay olduğu, 5 EV, yani Kamera, parlaklık farkında 32x (2 5 \u003d 32) eşdeğer (25 \u003d 32) eşdeğer beş iki katına çıkma pozunu sindirebilir.

Dinamik aralığı oluşturan maruz kalma bölgeleri eşit değildir. Üst bölgeler daha yüksek bir sinyal-gürültü oranı ile karakterize edilir ve bu nedenle alttan daha net ve daha ayrıntılı görünüyor. Sonuç olarak, dinamik aralığın üst sınırı çok gerçek ve farkedilir - kırpma ışıkları en ufak denemede sarılır, alt sınır, gürültüden giderek daha fazla batırılır ve siyah renge geçişi çok kesimden uzaktır.

Sinyalin maruziyetten kaynaklanan doğrusal bağımlılığı ve platoya keskin bir verim, dijital fotografik işlemin benzersiz özellikleridir. Karşılaştırma için, geleneksel fotoplinka'nın şartlı karakteristik eğrisine bir göz atın.

Eğrinin şekli ve özellikle eğim açısı, filmin türüne ve tezahürünün prosedürüne bağlı olarak, ancak dijitalden film takvimi arasındaki farkı olan ana şey - Dijital'in bağımlılığının doğrusal olmayan doğası Filmin pozlama değerinden optik yoğunluğu değişmeden kalır.

Negatif filmin fotografik latitusunun alt sınırı, peçe yoğunluğu ile belirlenir ve üst olanı - fotokoğanın elde edilebilir maksimum optik yoğunluğu; Filmleri döndürün - aksine. Hem gölgelerde hem de ışıklarda, dinamik aralığın sınırlarına yaklaşırken, kontrasttaki düşüşün pürüzsüz bükülmeleri vardır, çünkü eğrinin eğilimi açısı görüntünün kontrastı ile orantılıdır. Böylece, programın orta kısmında yatan maruz kalma bölgeleri maksimum kontrast vardır, ışıklar ve gölgelerde, kontrast azalır. Uygulamada, film ile dijital matris arasındaki fark, ışıklarda özellikle dikkatlidir: ışığın dijital görüntüsünde kırpma ile yandığında, filmdeki parçalar düşük kontrast olmasına rağmen hala ayırt edilebilir ve Saf beyaz bir renge geçiş düzgün ve doğal görünüyor.

Sensitometry'de, iki bağımsız terim bile kullanılıyor: aslında fotografik enlemkarakteristik eğrinin nispeten doğrusal bir bölümüyle sınırlandırılmış ve faydalı Fotoğraf Latitude, Doğrusal bölüme ek olarak, ayrıca taban ve omuz grafikleri.

Dijital fotoğrafları işlerken, bir kural olarak, daha az ya da belirgin bir S şeklindeki bir eğri uygular, bu, dijital bir görüntü sağlayan gölgeler ve ışıklardaki düşüşün maliyetindeki yarı tondaki kontrastı artıran daha az ya da belirgin bir S şeklinde bir eğri uygular. daha doğal ve hoş bir göz bak.

Hoşnutsuzluk

Dijital kameranın matrisinin aksine, insan vizyonu kendine özgüdür, diyelim, dünyanın logaritmik bir görüntüsü. Işık miktarının sıralı iki katına çıkması bizim tarafımızdan parlaklıkta eşit değişiklikler olarak algılanır. Işık numaraları müzikal oktavlarla bile karşılaştırılabilir, çünkü ses frekansının iki katı değişiklikleri, tek bir müzikal aralık olarak söylenti ile algılanır. Bu ilke diğer duyuları kullanır. Algılamanın doğrusallığı, insan duyarlılığı aralığını çeşitli yoğunluğun uyarılmasına çok genişletir.

RAW dosyasını dönüştürürken (önemli değil, kamera araçları veya RAW dönüştürücüde) doğrusal veri içeren, sözde otomatik olarak uygulanır. Dijital görüntünün parlaklığını doğrusal olmayan bir şekilde arttırmak için tasarlanmış gama eğrisi, insan vizyonunun özelliklerine paraleldir.

Doğrusal dönüşüm ile görüntü çok karanlık elde edilir.

Gama düzeltmesinden sonra, parlaklık normale gelir.

Gama eğrisi koyu tonları gerecek ve ışığı sıkacağı gibi, derecelendirmelerin dağılımını daha düzgün hale getirir. Sonuç olarak, görüntü doğal bir görünüm kazanır, ancak gölgelerde örnekleme gürültüsü ve eserleri kaçınılmaz olarak daha belirgin hale gelir; bu, yalnızca alt bölgelerde az sayıda parlaklık seviyesi ile daha azdır.

Parlaklık derecelendirmelerinin doğrusal dağılımı.
Bir gama eğrisi uyguladıktan sonra tek tip dağılım.

ISO ve Dinamik Aralık

Dijital fotoğrafçılığın, fotografik malzemenin aynı şekilde ışığa duyarlılığı konsepti, filmin fotoğrafında olduğu gibi, bunun yalnızca gelenek geleneği nedeniyle, çünkü dijital olarak sayımın değiştirilmesine yaklaştığından beri bunun anlaşılması gerektiği anlaşılmalıdır. ve film fotoğrafçılığı prensip olarak farklılık gösterir.

Geleneksel fotoğrafçılıktaki ISO duyarlılığının iyileştirilmesi, bir filmi daha büyük bir tane olan bir diğerine değiştirmek anlamına gelir, yani. Fotoğraf malzemesinin özelliklerinde nesnel bir değişiklik var. Dijital kamerada, sensör duyarlılığı sert bir şekilde fiziksel özellikleri ile belirlenir ve kelimenin tam anlamıyla değiştirilemez. ISO'da bir artışla, kamera sensörün gerçek duyarlılığını değiştirmez, ancak yalnızca sensör tarafından üretilen elektriksel sinyali ışınlamaya yanıt olarak geliştirir ve bu sinyal için dijitalleştirme algoritmasını doğru şekilde ayarlar.

Bunun önemli bir sonucu, etkili dinamik aralığı ISO'daki bir artışla orantılı olarak azaltmak, çünkü yararlı bir sinyal ile gürültü arttırılır. ISO 100, tüm sinyal değerlerini dijitalleştirirse - sıfırdan doygunluk noktasına kadar, daha sonra ISO 200 ile, fotodiotların kapasitesinin yalnızca yarısı maksimum için kabul edilir. ISO duyarlılığının her iki katına çıktığında, dinamik aralığın üst aşaması kesilir ve kalan adımlar yerine sıkılır. Bu nedenle ultra yüksek ISO değerlerinin kullanımının pratik anlamdan yoksun bırakılmasından budur. Aynı başarı ile, fotoğrafı Ham Converter'da hafifletebilir ve karşılaştırılabilir bir gürültü seviyesi elde edebilirsiniz. ISO'daki bir artış ve resmin yapay bir şekilde aydınlatılması arasındaki fark, ISO'yu artırarak, Sinyal Güçlendirmesinin ADC'de alınmadan önce gerçekleşmesidir ve bu nedenle, sensörün kendi gürültüsünün aksine, niceleyin gürültüsünün arttırılmamasıdır, Rawverter'da iken, amplifikasyon ADC'nin hataları da dahil olmak üzeredir. Ek olarak, dijitalleştirme aralığında bir azalma, kalan giriş değerlerinin daha doğru örneklenmesi anlamına gelir.

Bu arada, bir ISO, baz değerinin altındaki bazı cihazlarda (örneğin, ISO 50'ye), dinamik aralığı genişletmez ve sadece iki kez sinyali gevşetir, bu da ham dönüştürücüdeki anlık görüntüye eşittir. Bu fonksiyon bile zararlı olarak kabul edilebilir, çünkü ISO'nun subimik değerinin kullanılmasından bu yana, bir hazneyi arttırmak için bir hazneyi, sensörün kalan değişmeyen eşiği ile, kırpma riskini yanma riskini arttırır.

Gerçek dinamik aralık

(DXO Analyzer, Imatest, RawDriger, vb.) Gibi bir dizi program vardır. Dijital kameranın dinamik aralığını evde ölçmenize izin verir. Prensip olarak, bu büyük bir ihtiyaç değildir, çünkü çoğu kameranın verileri örneğin DXOMark.com web sitesinde internette serbestçe bulunabilir.

Böyle testlerin sonuçlarına inanmalı mıyım? Epeyce. Tüm bu testlerin verimli olduğu tek rezervasyon ile veya onu ifade edebilirseniz, teknik dinamik aralığı, yani Doygunluk seviyesi ile matrisin gürültü seviyesi arasındaki ilişki. Fotoğrafçı için, kullanışlı dinamik aralık öncelikle önemlidir, yani. Bazı yararlı bilgileri yakalamanıza olanak tanıyan maruz kalma bölgelerinin sayısı.

Huzur yaparken, dinamik aralığın eşiği, fotoğraf seensor'un gürültü seviyesi ile belirtilir. Sorun, uygulamada, dinamik aralığındadır, resmen gelen alt bölgeleri pratikte, kullanmak için kullanılabilecekleri her şeyi çok fazla gürültü içerir. Burada, bireysel sıkmaya bağlıdır - her biri kendisini belirler.

Öznel görüşüm, gölgelerdeki detayların, sinyal / gürültü oranı ile en az sekiz ile daha fazla ya da daha az iyi görünmeye başlamasıdır. Bu temelde, kendime bir teknik dinamik aralık olarak, bir teknik dinamik aralık eksi hakkında üç adımda belirlerim.

Örneğin, güvenilir testlerin sonuçlarına göre ayna odası, bugünün standartları için çok iyi olan 13 EV'nin dinamik bir aralığına sahipse, kullanışlı dinamik aralığı, genel olarak, aynı zamanda çok kapsamlı olduğu yaklaşık 10 EV olacaktır. . Tabii ki, minimal ISO ve azami bit ile çiğ çekim yapmaktan bahsediyoruz. JPEG'de çekim yaparken, dinamik aralık güçlü bir şekilde kontrast ayarlarına bağlıdır, ancak ortalama iki veya üç adım atılmalıdır.

Karşılaştırma için: Renkli işlem görmüş fotoğraf çekimleri, 5-6 adımda faydalı bir fotoğraf enlemine sahiptir; Siyah ve beyaz negatif filmler, standart tezahür ve baskı prosedürleri ile 9-10 adım ve bazı manipülasyonlarla - 16-18 adede kadar adım.

Yukarıda belirtilenlerin özetlenmesi, kameranızın maksimum performansınızın sensöründen kurtulmanıza yardımcı olacak birkaç basit kural oluşturmaya çalışacağız:

  • Dijital kameranın dinamik aralığı, yalnızca RAW'da çekim yaparken tamamen erişilebilir.
  • Dinamik aralık, artan ışık hassasiyetiyle azalır ve bu nedenle keskin bir gereklilik yoksa, yüksek ISO değerlerinden kaçının.
  • RAW dosyaları için daha yüksek boşalma kullanmak, gerçek dinamik aralığı arttırmaz, ancak nedeniyle gölgelerdeki ton ayrılmasını iyileştirir. daha Parlaklık seviyeleri.
  • Sağa maruz kalma. Üst maruz kalma bölgeleri her zaman maksimum içerir kullanışlı bilgi Minimum gürültü ile ve en etkili şekilde kullanılmalıdır. Aynı zamanda, kırpma tehlikesini unutmamalısınız - doygunluğa ulaşmış pikseller kesinlikle işe yaramaz.

Ve ana şey: Kameranızın dinamik aralığı için endişelenmeniz gerekmez. Dinamik bir aralıkla, sorun değil. Işığı ve yetkin bir şekilde yönetme yeteneğiniz çok daha önemlidir. İyi bir fotoğrafçı, fotografik enlem eksikliği konusunda şikayet etmeyecek, ancak daha rahat bir aydınlatma için beklemeye çalışacak ya da açıyı değiştirecek veya bir kelimeyle flaşı kullanacak, koşullara uygun olarak hareket edecektir. Size daha fazlasını söyleyeceğim: bazı sahneler sadece kameranın dinamik aralığına sığmadıkları gerçeğinden dolayı kazanır. Genellikle gereksiz bir parça parça, aynı zamanda aynı anda ve daha zengin olan bir fotoğrafı çeken yarı rendelenmiş bir siyah siluet haline getirmek için gereklidir.

Yüksek kontrast her zaman kötü değildir - sadece onunla birlikte çalışabilmeniz gerekir. Ekipmanın dezavantajlarını ve avantajlarını sömürmeyi öğrenin ve yaratıcı fırsatlarınızın ne kadar genişleyeceğini şaşıracaksınız.

Dikkatiniz için teşekkürler!

Vasily A.

Scriptum sonrası

Makale sizin için faydalı ve bilgilendirici olsaydı, projeyi nazikçe destekleyebilir, gelişimine katkıda bulunabilirsiniz. Makaleyi beğenmediyseniz, ancak nasıl daha iyi hale getirileceği konusunda düşünceleriniz varsa, eleştiriniz daha az şükran olmadan kabul edilecektir.

Bu makalenin telif hakkı nesnesi olduğunu unutmayın. Orijinal kaynağa mevcut bir referans varsa, yeniden yazdırma ve alıntı yapılır ve kullanılan metin seçilmemeli veya değiştirilmemelidir.

Ev yapımı sesle hevesli olan insanlar ilginç bir paradoks göstermektedir. Dinleme odasını kıpırdamaya, egzotik yayıcı ile sütunlar oluşturmak için hazırlar, ancak kırmızı bayrağın önündeki kurt gibi, müzikal konsolonun önünde utanırlar. Ve aslında, onay kutusunun çıkması imkansızdır ve konserveden daha yenilebilir bir şey pişirmeye çalışın?

Periyodik olarak, forumda şikayetler var: "İyi kaydedilmiş albümleri tavsiye et." O anlaşılabilir. Özel Audiophile Editions, birinci dakikayı duymayı memnun edecekler, ancak kimse sonu dinlemeyecekler, repertuarda acıtıyor. Phonothek'in geri kalanına gelince, sorun açık görünüyor. Tasarruf edebilirsiniz, ancak tasarruf edemez ve parayı bir vızıltıyı boşaltamazsınız. Hala en sevdiğiniz müziği yüksek hacimli ve burada bir amplifikatör olasılığını dinlemeyi sevmem.

Bugün, Hi-Res albümlerinde bile, fonogramın zirveleri ve sürülen kırpma hacmi kesilir. Çoğunluğun her önemsizden müzik dinlediğine inanılmaktadır ve bu nedenle bir tür bağlılık yapmak için "GAT'a sormak" için gereklidir.


Tabii ki, bu özellikle odiyelofilleri üzmek için yapılmaz. Onlar hakkında genellikle birkaç kişi hatırlıyor. Eh, ana dolaşımın kopyalandığı ana dosyaların kopyalanması için tahmin ettikleri dışında - CDS, MP3, vb. Tabii ki, sihirbaz uzun zamandır kompresör tarafından düzleştirildi, hiç kimse HD parçaları için özel versiyonları bilinçli olarak hazırlayamaz. Bu nedenle, bu nedenle ve daha insanca sesler için vinil taşıyıcı için belirli bir prosedürdür. Ve dijital yol için, her şey aynı biter - büyük bir kalın kompresör.

Bu nedenle, şu anda yayınlanan fonogramların% 100'ünün tümü, eksi klasik müzik, mastürbasyon yaparken sıkıştırmaya tabi tutulur. Birisi bu prosedürü daha fazla ya da daha az usta gerçekleştirir ve biri tamamen aptalca. Sonuç olarak, forumlarda, sinüs, yayınların ağrılı karşılaştırmaları için, bir ana popper ihtiyacınız olan vinilden kaçışın, vinilden kaçmak için forumlarda hacılarımız var.

Tüm bu utançların görüşünde en don sonbaçtan tam anlamıyla ses ayakkabılarında döndü. Şaka yok, ses kaynağını kutsal yazıların geriye doğru okudukları! Modern ses düzenleme programları bazı restorasyon aracı var ses dalgasıKırpılmış kırpılmış.

Başlangıçta, bu işlevsellik stüdyolar için tasarlanmıştır. Karışık olduğunda, kırpma geldiğinde durumlar vardır ve bir dizi nedenden dolayı oturumu yeniden hızlandırmak artık mümkün değil ve burada Yardım Arsenal Audio Editor - Decalipper, Decompressor, vb.

Ve zaten böyle bir yazılım için, tüm Bolder, bir sonraki yenilikten sonra kulaklardan kan olan sıradan dinleyicilerin kollarını çeker. Birisi İzotop, Birisi Adobe Audition, Birisi'nin birisinin birkaç program arasında paylaştığı tercih ediyor. Eski dinamiklerin restorasyonunun anlamı, 0 dB'de dinlenerek, bir vitese benzeyen klibli kaplama sinyal tepelerinin doğru şekilde düzeltilmesidir.

Evet, konuşma kaynağının yaklaşık% 100 canlanması GİTMELİDİR, çünkü oldukça spekülatif algoritmalardaki enterpolasyon süreçleri meydana gelir. Ancak yine de, işlem sonuçlarından bazıları bana ilginç ve çalışmaya layık görünüyordu.

Örneğin, Lana del Rey'in "Yaşam için Şehvet" albümü, sürekli kaşlarını çatıyor, pah, sürüş! Orijinal Şarkısında "Dünya Savaş'ta olduğunda dans ettik" diye gibiydi.


Ve bir dizi dekeripper ve dekompresörden sonra, böyle oldu. Dr katsayısı 5 ila 9 arasında değişmiştir. İndirme ve işlemden önce ve sonra numuneyi dinleyin.


Yöntemin evrensel olduğunu ve tüm konuşlandırılmış albümler için uygun olduğunu söyleyemiyorum, ancak bu durumda, 24 bit'te resmi yayın yerine, bir Rutraker aktivisti ile tedavi edilen bu seçeneği tam olarak bu seçeneği korudum.

Ses kıyısından gelen zirvelerin yapay çekilmesi bile, müzikal performansın gerçek dinamiklerini iade etmiyor olsa bile, DAC'ınız yine de teşekkür ederim. Sözde sözcük zirvelerinin (ISS) olasılığının harika olduğu sınır seviyelerinde hata olmadan çalışması çok zordu. Ve şimdi 0 dB'ye kadar sinyalin sadece nadir bir bölmelerini yapacaktır. Ek olarak, flac veya diğer kayıpsız kodeklerde sıkıştırıldığında tetiklenen fonogram şimdi daha küçük olacaktır. Sinyaldeki daha fazla "hava" sabit disk alanı tasarrufu sağlar.

"Hacim Savaşı" nda öldürülen en nefret edilen albümlerinizi canlandırmaya çalışın. Hoparlörün rezervi için, önce pistin seviyesini -6 DB'deki seviyesini düşürmeniz ve ardından beyannacayı başlatmanız gerekir. Bilgisayarların CD çalar ve amplifikatör stüdyosu genişleticisi arasında yapışabildiğine inanmayanlar. Bu cihaz Özünde, aynı şekilde yapılır - ses sinyalinin dinamikleri üzerine sıkıştırılmış zirveleri geri yükleyebilir ve çeker. 80-90'dan çok pahalı olduğunu söylememek için benzer cihazlar var ve bir deney olarak, onları çok ilginç.


Dinamik aralık kontrol cihazı DBX 3BX, sinyali üç şeritte ayrı olarak işler - LF, SC ve RF

Ekolayanlar, ses sisteminin verdiği bileşen içindeydik ve kimse onlardan korkmadı. Bugün manyetik bandın yüksek frekanslarını sevmek gerekli değildir, ancak çirkin dinamikler ile bir şeyi çözmek gerekir, kardeşler.

Dinamik sıkıştırma (Dinamik aralık sıkıştırma, DRC), fonogramın dinamik aralığının dinamik aralığının bir daralması (veya genişletici durumunda). Dinamik aralıkBu, en sessiz ve en gürültülü ses arasındaki farktır. Bazen fonogramdaki en sessiz olanı, biraz yüksek ses seviyesinin sesi ve bazen en yüksek sesin biraz daha sessiz olacağıdır. Dinamik sıkıştırma işlemi yapan donanım aygıtları ve programları, dört ana grubu vurgulayan, kompresörler, sınırlayıcı, genişleticiler ve kapılar.

Lamba Analog Kompresör DBX 566

Azaltılmış ve teşvik edici sıkıştırma

Azaltma sıkıştırma (Aşağı doğru sıkıştırma), belirli bir eşik değerini aştığında ses seviyesini azaltır, daha sessiz ses çıkarılmadı. Daha düşük sıkıştırma seçeneği sınırlayıcı. Geliştirme Sıkıştırma (Yukarı doğru sıkıştırma), aksine, daha fazla etkilemeden, eşiğin altındaysa, sesin hacmini arttırır. yüksek sesler. Aynı zamanda, her iki sıkıştırma tipi, ses sinyalinin dinamik aralığını daraltıyor.

Azaltma sıkıştırma

Geliştirme Sıkıştırma

Genişletici ve Kapı

Kompresör dinamik aralığı azalırsa, genişletici onu artırır. Sinyal seviyesi eşik seviyesinin üstünde olduğunda, genişletici daha da arttırır, böylece yüksek sesle ve sessiz sesler arasındaki farkı arttırır. Bu tür cihazlar, bazı davulların seslerini diğerlerinden ayırmak için tambur kurulumunu kaydederken kullanılır.

Yüksek sesle geliştirmek için kullanılmayan genişletici türü ve eşik değerin seviyesini aşmayan sessiz sesleri kurutmak (örneğin, arka plan gürültüsü) denir Gürültü kapısı.. Böyle bir cihazda, ses seviyesi eşikten daha az olur olmaz sinyal geçişi durdurulur. Tipik olarak, kapı duraklamalarda gürültüyü bastırmak için kullanılır. Bazı modellerde, eşik seviyesinin keskin bir şekilde durmadığında, ancak kademeli olarak dolaştığında ses olacak şekilde yapılabilir. Bu durumda, zayıflama hızı çürüme regülatörü (durgunluk) tarafından belirlenir.

Kapı, diğer kompresör türleri gibi, belki frekansa bağlı (yani, belirli frekans bantlarını işleme koymanın farklı şekillerinde) ve modda çalışabilir yan zincir. (aşağıya bakınız).

Kompresörün çalışma prensibi

Kompresöre düşen sinyal iki kopyaya ayrılmıştır. Bir kopya, amplifikasyon derecesinin harici bir sinyal tarafından kontrol edildiği amplifikatöre gönderilir, ikinci kopya - bu sinyali oluşturur. Sinyalin ölçüldüğü yan zincir olarak adlandırılan cihaza girer ve zarf, hacmindeki değişikliği açıklayan bu verilere dayanarak oluşturulur.
Böylece, en modern kompresörler düzenlenir, bu da besleme ileri tipidir. Eski cihazlarda (geri bildirim türü), sinyal seviyesi amplifikatörden sonra ölçülür.

Her biri avantaj ve dezavantajları olan çeşitli analog kontrol teknolojileri (değişken-kazanç amplifikasyonu) vardır: Lambalar, fotorezistra ve transistum kullanılarak optik. Dijital sesle çalışırken (ses editöründe veya DAW'da), kendi matematiksel algoritmaları kullanılabilir veya analog teknolojinin çalışması girilebilir.

Kompresörlerin ana parametreleri

Eşik.

Kompresör, genliği belirli bir eşik değeri (eşik) primerse, ses sinyalini azaltır. Genellikle desibellerde, daha düşük bir eşik ile gösterilir (örneğin, -60 DB), sesin daha yüksek bir eşikten (örneğin, -5 dB) olduğundan daha fazla işleneceği anlamına gelir.

Oranı.

Seviye azaltma derecesi, oranı parametresi ile belirlenir: oranı 4: 1, giriş seviyesinin 4 dB değerinde ise eşiği aştığında, çıkış seviyesi eşikten 1 dB'den daha yüksek olacaktır.
Örneğin:
Eşik \u003d -10 dB
Giriş sinyali \u003d -6 dB (eşiğin üstünde 4 dB'de)
Çıkış sinyali \u003d -9 dB (eşiğin üstünde 1 db'de)

Sinyal seviyesini bastırmanın, eşik seviyesinin altına düştükten sonra bir süre devam etmenin ve bu süre parametre değeri ile belirlenmesinin akılda kalması önemlidir. serbest bırakmak.

Maksimum oran değeri ile sıkıştırma ∞: 1 sınırlama denir. Bu, eşik seviyesinin üzerindeki herhangi bir sinyalin eşik seviyesinden önce bastırıldığı anlamına gelir (giriş hacminde keskin bir artıştan sonra kısa bir süre hariç). Ayrıntılar için, aşağıya bakınız "sınırlayıcı".

Çeşitli oran değerlerinin örnekleri

Saldırı ve serbest bırakma

Kompresör, sinyal dinamiklerini değiştirmeye ne kadar hızlıca yanıt verdiği konusunda belirli bir kontrol sağlar. Saldırı parametresi, kompresörün kazanç katsayısını, oran parametresi tarafından belirlenen seviyeye düşürdüğü zamanı tanımlar. Bırakma, kompresörün, aksine, Kazanç katsayısını arttırdığı, ya da giriş sinyali seviyesi eşik değerinin altına düşerse normale geri döner.

Saldırı ve Serbest Bırakma Aşamaları

Bu parametreler, belirli miktarda desibelin güçlendirilmesini değiştirmek için gerekli olacağı süreyi (genellikle milisaniyede) gösterir, genellikle 10 dB'dir. Örneğin, bu durumda, eğer saldırı 1 ms olarak ayarlanırsa, kazancı 10 dB, 1 ms gerekli olacak ve 20 dB - 2 ms.

Birçok kompresörde, saldırı ve serbest bırakma parametreleri yapılandırılabilir, ancak bazılarında başlangıçta ayarlanır ve düzenlenmezler. Bazen "Otomatik" veya "Program Bağımlı" olarak belirlenirler, yani giriş sinyaline bağlı olarak değişir.

Diz.

Başka bir kompresör parametresi: sert / yumuşak diz. Sıkıştırma uygulamasının başlangıcının keskin (sert) veya kademeli (yumuşak) olduğunu belirler. Yumuşak diz, ham sinyalden, özellikle yüksek oranlı değerlerde, özellikle yüksek oranlı değerlerde, sıkıştırmaya maruz kalan sinyalden geçişin uykusunu azaltır.

Sert diz ve yumuşak diz sıkıştırma

Tepe ve rms.

Kompresör, zirveye (kısa vadeli maksimum) değerlere veya ortalama giriş seviyesine tepki verebilir. Tepe değerlerin kullanımı, sıkıştırma derecesinde ve hatta bozulmaya kadar keskin dalgalanmalara neden olabilir. Bu nedenle, kompresörler ortalama işlevi (genellikle bu RMS'dir) bir eşik değeri ile karşılaştırırken giriş sinyali verir. Hacimin insan algısına yakın, daha rahat bir sıkıştırma sağlar.

RMS, fonogramın ortalama hacmini yansıtan bir parametredir. Matematiksel bir bakış açısıyla RMS (kök ortalama kare), belirli sayıda numunenin genliğinin RMS değeridir:

Stereo bağlantı.

Stereo Bağlantı Modunda Kompresör, hem stereo kanallara aynı kazancı uygular. Bu, Sol ve Sağ kanalların bireysel işlenmesinin sonucu olabilecek stereopanoramanın yer değiştirmesini önler. Böyle bir yer değiştirme, örneğin merkezde olmayan herhangi bir yüksek sesle eleman varsa oluşur.

Makyaj kazancı.

Kompresör genel sinyal seviyesini azalttığından, çıkışta sabit kazanç olasılığı genellikle en uygun seviyeyi elde etmenizi sağlar.

İleriye bak.

Devam eden fonksiyon, hem çok büyük hem de çok küçük değerler saldırısı ve serbest bırakma sorunlarını çözmek için tasarlanmıştır. Çok fazla saldırı, geçici bir şekilde geçici bir şekilde durdurmanıza izin vermez, ancak çok küçük dinleyici için rahat olmayabilir. Görüntüle ilgili işlevi kullanırken, ana sinyal kontrol cihazına göre geciktirilir, sinyal eşik değere ulaşmadan önce bile, daha önce sıkışmayı önceden başlatmanıza izin verir.
Bu yöntemin tek dezavantajı, bazı durumlarda istenmeyen durumlarda, sinyalin zaman gecikmesidir.

Dinamik sıkıştırma kullanımı

Sıkıştırma, sadece müzikal fonogramlarda değil, her yerde, ancak her yerde, her yerde, genel hacmi arttırmanız gereken her yerde, ucuz ses üretme ekipmanının kullanıldığı tepe seviyesini veya sınırlı bir iletim kanalı (uyarı sistemi, amatör radyo, vb.).

Oynarken sıkıştırma uygulanır arka plan müziği (Mağazalarda, restoranlarda vb.), herhangi bir gözle görülür bir hacim değişiminin istenmeyen olduğu durumlarda.

Ancak dinamik sıkıştırmayı uygulama en önemli kapsamı müzikal üretim ve yayındır. Sıkıştırma, birbirleriyle birlikte daha iyi bir kombinasyon için "yoğunluk" ve "sürücü" sesini ve özellikle vokal işlerken ses çıkarmak için kullanılır.

Kaya ve POP müziğindeki sesli partiler genellikle eşlikin arka planında vurgulamak ve netlik eklemek için sıkıştırmaya tabi tutulur. Sadece belirli frekanslarda yapılandırılmış olan özel bir kompresör türü - DeSYER, tıslama arka planını bastırmak için kullanılır.

Enstrümantal partilerde, sıkıştırma da doğrudan hacimle ilgili olmayan etkiler için kullanılır, örneğin, hızla solmuş tambur sesleri daha uzun sürebilir.

Elektronik dans müziğinde (EDM), yandan sık sık kullanılır (aşağıya bakınız) - örneğin, bas hattı, bas ve tamburların çatışmasını önlemek ve dinamik bir nabız oluşturmak için benzer bir şey tarafından kontrol edilebilir.

Sıkıştırma, yayılma şanzımanında (radyo, televizyon, internet yayıncılığı) yaygın olarak kullanılan kaynak sesin (genellikle CD) dinamik aralığını azaltır. Çoğu ülkenin, yayınlanabilen anında maksimum hacimdeki yasal kısıtlamaları vardır. Tipik olarak, bu sınırlamalar, eterik zincirindeki sabit donanım kompresörleri ile uygulanır. Ek olarak, algılanan hacmindeki bir artış, sesin çoğu dinleyicinin bakış açısından "kalitesini" iyileştirir.

Ayrıca bakınız Yükseklik Savaşı.

Aynı şarkının hacminde tutarlı bir artış, 1983'ten 2000'e kadar CD için yeniden yapılandırıldı.

Yan changing

Başka bir sık \u200b\u200bkullanılan kompresör anahtarı "yan zincir" dir. Bu modda, sesin sıkıştırılması kendi seviyesine bağlı olarak ortaya çıkmaz, ancak genellikle bağlayıcıya giren sinyal seviyesine bağlı olarak, bu genellikle yan zincir denir.

Bu çeşitli uygulamalar bulunabilir. Örneğin, vokalist Shepelvit ve tüm harfler "C" genel resimden çıkıyor. Sesini kompresörden atlarsınız ve yan zincir konnektörü aynı sese hizmet eder, ancak ekolayzırdan kaçırılır. Ekolayzerde, "C" harfini telaffuz ederken, vokalist tarafından kullanılanlar dışında tüm frekansları kaldırırsınız. Genellikle yaklaşık 5 kHz, ancak 3 kHz ila 8 KHz arasında olabilir. Ardından bir kompresörü yan zincir moduna yerleştirinse, "C" harfi telaffuz edildiğinde, sesin sıkıştırılması bu anlarda meydana gelir. Böylece "DeSYER" (DE-Esser) olarak bilinen bir cihazı ortaya koydu. Bu çalışma yöntemi "frekansa bağlı" (frekansa bağlı) denir.

Bu özelliğin bir diğer kullanımı "ducker" denir. Örneğin, bir radyo istasyonunda, müzik kompresörün içinden geçer ve bir yan zincirden DJ kelimeleri. DJ sohbet etmeye başladığında, müzik hacmi otomatik olarak azalır. Bu etki, kayıtlarda başarıyla kullanılabilir, örneğin, şarkı sırasında klavye partilerinin hacmini azaltabilir.

Tuğla duvar sınırlama

Kompresör ve sınırlayıcı yaklaşık aynıdır, sınırlandırıcının yüksek oranlı bir kompresör olduğu söylenebilir (10: 1'den itibaren) ve genellikle düşük atak süresi.

Bir tuğla duvar sınırlama konsepti var - çok yüksek bir oran sınırlayıcı (20: 1 ve üzeri) ve çok hızlı bir saldırı. İdeal olarak, sinyalin eşik seviyesini aşmasına izin vermez. Sonuç, söylenti için nahoş olacaktır, ancak bu, ses çoğaltma teknolojisi veya fazla kanal bant genişliğinin zarar görmesini önleyecektir. Birçok üretici, bu amaç için sınırlayıcı cihazları entegre ediyor.

Clipper vs. Sınırlayıcı, yumuşak ve sert kırpma

Bu yöntem grubu, iletilen sinyallerin doğrusal olmayan genlik dönüşümlerine maruz kalması ve doğrusal olmayanların parçalarının iletilmesinde ve almasında dönüştürülmesidir. Örneğin, verici, alıcıda - U 2'de bir doğrusal olmayan bir fonksiyon öü kullanıyorsa. Yakınsak fonksiyonların tutarlı bir şekilde uygulanması, genel olarak, dönüşümün doğrusal kaldığı gerçeğine yol açacaktır.

Doğrusal olmayan veri sıkıştırma yöntemlerinin fikri, vericiin, çıkış sinyallerinin (yani daha dinamik aralık) aynı genliğine sahip iletilen parametrende daha geniş bir değişim yelpazesi verebilmesi gerçeğine düşürülür. Dinamik aralık - Bu, nispi birimlerde veya en küçük olan en büyük kabul edilebilir sinyal genliğinin desibellah tutumunda ifade edilir:

; (2.17)
. (2.18)

Dinamik aralığı azaltmak için doğal arzu, ekipmanın hassasiyeti ve parazit ve kendi gürültüsünün etkisinde bir artışla sınırlıdır.

Çoğu zaman, dinamik aralığın sıkıştırılması, logaritma ve güçlenmenin bir çift yakınsak işlevi kullanılarak gerçekleştirilir. Değişen genliğin ilk çalışması denir sıkıştırma(Sıkıştırma), ikinci - genişleme (germe). Bu fonksiyonların seçimi, en büyük sıkıştırma yetenekleriyle ilgilidir.

Aynı zamanda, bu yöntemlerin dezavantajları vardır. Bunlardan ilki, az sayıdaki logaritmunun negatif ve sınırda olmasıdır:

yani, duyarlılık çok doğrusal değildir.

Bu dezavantajları azaltmak için her iki fonksiyon da ofset ve yaklaşımla değiştirilir. Örneğin, telefon kanalları için, yaklaşım fonksiyonu ilişkilidir (A tipi,):

ve a \u003d 87.6. Sıkıştırma kazancı 24db'dir.

Doğrusal olmayan prosedürlerle veri sıkıştırması, büyük hataları olan analog tesisler tarafından uygulanır. Dijital araçların kullanımı, dönüşümün doğruluğunu veya hızını önemli ölçüde artırabilir. Aynı zamanda, fonların doğrudan kullanımı bilgisayar Ekipmanları (Yani, logaritmaların ve üstellerin doğrudan hesaplanması) düşük hız ve biriktirme hesaplama hatası nedeniyle daha iyi sonuç vermeyecektir.

Doğruluk kısıtlamaları nedeniyle sıkıştırma ile veri sıkıştırması, yanıt vermemesi durumlarda, örneğin telefon ve radyo kanallarında konuşmayı iletmek için kullanılır.

Etkili Kodlama

Etkili Kodlar Sundon, Fano ve Hafman'a sunuldu. Kodların özü, dengesiz oldukları, yani farklı bir deşarj kategorisi olan ve kodun uzunluğu görünüşünün olasılığı ile ters orantılıdır. Etkili Kodların Olağanüstü Bir Diğer Özelliği - Ayırıcı gerektirmez, yani komşu kod kombinasyonlarını ayıran özel karakterler. Bu gözlemleyerek elde edilir basit kural: Daha kısa kodlar daha uzun bir başlangıç \u200b\u200bdeğildir. Bu durumda, kod çözücü ilk önce en kısa kod kombinasyonlarını ortaya koyduğundan, benzersiz ikili deşarj akımı benzersiz bir şekilde çözülür. Uzun süre etkili kodlar tamamen akademik, ancak yakın zamanda veritabanlarının oluşumunda ve modern modemlerde ve yazılım arşivlerinde bilgi sıkıştırmasında kullanılmaktadır.

Düzensizlik nedeniyle, ortalama kod uzunluğu tanıtıldı. Orta uzunluk - Kod uzunluğunun matematiksel beklentisi:

ayrıca, L CP yukarıdan H (x) için eğilimindedir (yani, Diyeler\u003e H (x)).

Durumun uygulanması (2.23), N'yi artırarak geliştirilmiştir.

İki çeşit etkili kod var: Shannon Fano ve Hafman. Örnekte aldıklarını düşünün. Dizeleyen karakterlerin olasılıklarının Tablo 2.1'de gösterilen anlamları olduğunu varsayalım.

Tablo 2.1.

Sembollerin olasılıkları

N.
P i. 0.1 0.2 0.1 0.3 0.05 0.15 0.03 0.02 0.05

Semboller sıralanır, yani inişi azalan olasılıkla ararken. Bundan sonra, Shennon Fano yöntemine göre, aşağıdaki prosedür periyodik olarak tekrarlanır: tüm olay grubu, aynı (veya yaklaşık aynı) toplam olasılıklarla iki alt gruba ayrılır. Prosedür bir sonraki alt grupta kalana kadar devam eder, ardından bu eleman ortadan kalkar ve kalan bu işlemler devam eder. Bu, son iki alt grup bir element kalana kadar olur. Tablo 2.2'de azaltılan örneğimizi dikkate almaya devam edin.

Tablo 2.2.

Chennon Fano Yöntemi

N. P i.
4 0.3 BEN.
0.2 BEN. II.
6 0.15 BEN. BEN.
0.1 II.
1 0.1 BEN. BEN.
9 0.05 II. II.
5 0.05 II. BEN.
7 0.03 II. II. BEN.
8 0.02 II.

Tablo 2.2'den görülebileceği gibi, p 4 \u003d 0.3 olan bir olasılıkla ilk sembol iki bölümleme prosedürüne katıldı ve her iki kez de gruba numara ile çarptı. Buna göre, iki bit kodu II ile kodlanır. Bölümün ilk aşamasındaki ikinci eleman, İkinci grup II. Bu nedenle, kodu 10. Karakterlerin geri kalanının ek yorumlardaki kodları gerekmez.

Genellikle düzensiz kodlar, kod ağaçları şeklinde gösterilir. Kod ağacı, izin verilen kod kombinasyonlarını belirten bir grafiktir. Şekil 2'sinde gösterildiği gibi, bu grafiğin kaburgalarının yollarını önceden belirtin (talimatların seçimi keyfidir).

Grafik aşağıdaki gibi yönlendirilir: özel bir sembol için bir rota oluşturun; Bunun için deşarj sayısı, rotadaki kenarların sayısına eşittir ve her boşalmanın değeri karşılık gelen kaburganın yönüne eşittir. Rota yapılır kaynak noktası (Çizimde A harfi ile işaretlenmiştir). Örneğin, Vertex 5'e giden rota, ikincisine ek olarak her şeyin 0 yönüne sahip olduğu beş kaburgadan oluşur; 00001 kodunu alıyoruz.

Bu örnek için hesaplayın Entropi ve kelimenin orta uzunluğu.

H (x) \u003d - (0.3 Günlük 0.3 + 0.2 Günlük 0.2 + 2 0.1 Günlük 0.1 + 2 0.05 Günlük 0.05+

0.03 Günlük 0.03 + 0.02 Günlük 0.02) \u003d 2.23 bit

l CP \u003d 0.3 2 + 0.2 2 + 0.15 3 + 0.1 3 + 0.1 4 + 0.05 5 +0.05 4+

0.03 6 + 0.02 6 = 2.9 .

Görüldüğü gibi, kelimenin orta uzunluğu entropiye yakındır.

Hafman kodları farklı bir algoritmaya inşa edilmiştir. Kodlama prosedürü iki aşamadan oluşur. İlk aşamada, alfabenin bir defalık sıkışması tutarlıdır. Bir defalık sıkıştırma, son iki karakterin (daha düşük olasılıklarla) toplam olasılıkla değiştirilmesidir. Sıkıştırma iki karakter kalana kadar gerçekleştirilir. Aynı zamanda, sonuçta ortaya çıkan olasılıkların yapıştırıldığı kodlama tablosunu doldurun ve ayrıca yeni karakterlerin bir sonraki aşamada hareket ettiği rotaları da tasvir eder.

İkinci aşamada, kodlamanın kendisi son aşamadan başlayanlar ortaya çıkar: İki karakterden ilki kod 1, ikinci - 0 kodunu atayın. Bundan sonra önceki aşamaya gidin. Bu aşamadaki sıkıştırma içine katılmayan sembollere, aşağıdaki aşamadan kodları, iki kez en son iki karaktere iki kez tutturulduktan sonra elde edilen sembol kodunu ekleyin ve üst sembol kodunu 1, daha düşük - 0 ekleyin. Sembol, yapıştırma konusunda daha da katılır, kodu değişmeden kalır. Prosedür sonuna kadar devam ediyor (yani ilk aşamaya kadar).

Tablo 2.3, Hafman algoritması boyunca kodlamayı gösterir. Tablodan görülebileceği gibi, kodlama 7 aşamada gerçekleştirildi. Soldaki karakterlerin olasılıkları, sağ orta kodlar. Oklar, yeni oluşturulmuş karakterleri hareket ettiriyor. Her aşamada, son iki karakter yalnızca kodlama tekniğine karşılık gelen genç deşarj ile farklılık gösterir. Sözcüğün ortalama uzunluğunu hesaplıyoruz:

l CF \u003d 0.3 2 + 0.2 2 + 0.15 3 + + 2 0.1 3 + +0.05 4 + 0.05 5 + 0.03 6 + 0.02 6 \u003d 2.7

Entropiye daha yakın bile: kod daha da etkilidir. İncirde. 2.12 Hafman kod ağacını gösterir.

Tablo 2.3.

Hafman Algoritması'nda kodlama

N. P i. kodu BEN. II. III İv. V. Vi Vii
0.3 0.3 11 0.3 11 0.3 11 0.3 11 0.3 11 0.4 0 0.6 1
0.2 0.2 01 0.2 01 0.2 01 0.2 01 0.3 10 0.3 11 0.4 0
0.15 0.15 101 0.15 101 0.15 101 0.2 00 0.2 01 0.3 10
0.1 0.1 001 0.1 001 0.15 100 0.15 101 0.2 00
0.1 0.1 000 0.1 000 0.1 001 0.15 100
0.05 0.05 1000 0.1 1001 0.1 000
0.05 0.05 10011 0.05 1000
0.03 0.05 10010
0.02

Her iki kod da kod çözme gereksinimini karşılamaktadır: Tablolardan görülebileceği gibi, daha kısa kombinasyonlar daha uzun kodların başlangıcı değildir.

Artan sayıda sembol ile, kodların etkinliği artar, bu nedenle bazı durumlarda daha büyük blokları kodlar (örneğin, metinler hakkında konuşursak, en yaygın hecelerin, kelimelerin ve hatta öbeklerin bir kısmını kodlayabilirsiniz).

Bu tür kodların uygulanmasının etkisi, tek tip kodla karşılaştırıldığında belirlenir:

(2.24)

buradaki n, etkili bir şekilde değiştirilen tekdüze kod deşarjlarının sayısıdır.

Khafman Kodlarının Değiştirilmesi

Klasik Hafman algoritması iki taraflı, yani. Semboller ve mesajlardaki ilk istatistik setini ve ardından yukarıda açıklanan prosedürleri gerektirir. Uygulamada sakıncalıdır, çünkü mesajların işleme süresini ve sözlüğün birikimini arttırır. Birikimin ve kodlama prosedürlerinin birleştirildiği tek geçiş yöntemleri. Bu tür yöntemler, Hafman boyunca uyarlamalı sıkıştırma denir [46].

Hafman'da uyumlu sıkıştırma özü, ilk kod ağacının yapımına ve her bir sonraki sembolün alınmasından sonra tutarlı bir şekilde değiştirilmesine indirgenir. Daha önce olduğu gibi, ağaçlar buradasın ikilidir, yani Grafiğin her bir tepesinden - ahşap, maksimum iki yay oluşur. Orijinal zirveyi ebeveynin ve ilişkili iki bir sonraki köşeyi çağırmak gelenekseldir. Vertex'in ağırlığı kavramını tanıtıyoruz - bu, başlangıç \u200b\u200bdizisi uygulandığında elde edilen bu tepe noktasına karşılık gelen karakter sayısıdır (kelimeler). Açıkçası, çocukların ölçeklerinin toplamı ebeveynin ağırlığına eşittir.

Giriş dizisinin bir sonraki sembolünü girdikten sonra, kod ağacı revize edilir: köşelerin ağırlıkları yeniden hesaplanır ve gerekirse köşeler yeniden düzenlenir. Köşelerinin yeniden düzenlenmesi kuralları aşağıdaki gibidir: alt köşelerin ağırlıkları en küçüktür ve kolonda kalan köşeler en küçük ağırlıklara sahiptir.

Aynı zamanda, köşeler numaralandırılmıştır. Numaralandırma, soldan sağa sağdan sağa doğru olan (çocuk sahibi olmayan) alt (asılı, yani) ile başlar, sonra üst seviye vb. Sonun numaralandırılması için Kaynak Vertex. Aynı zamanda, aşağıdaki sonuç elde edilir: Vertex'in daha az ağırlığı, numarası daha az olur.

Permütasyon, esas olarak köşeleri asmak için gerçekleştirilir. Permütasyon, formüle edilmiş kural kabul edilir: Yüksek ağırlığa sahip üstler daha büyük bir sayıya sahiptir.

Sırayı geçtikten sonra (ayrıca kontrol veya test olarak da adlandırılır), kod kombinasyonları tüm asılı köşelere atanır. Kural ödevi kuralı yukarıdakine benzer: Kod deşarjlarının sayısı, rotanın kaynaktan bu asılı tepe noktasına geçtiği köşe sayısına eşittir ve spesifik bir boşalmanın değeri ebeveynin yönüne karşılık gelir. "Çocuk" (söyleyerek, ebeveynten sola geçiş 1, sağ - 0) değerine karşılık gelir.

Elde edilen kod kombinasyonları, sıkıştırma cihazının hafızasına, analogları ile birlikte girilir ve bir sözlük oluşturur. Algoritmanın kullanımı aşağıdaki gibidir. Sıkıştırılabilir karakter dizisi, mevcut sözlüğe uygun olarak parçalara ayrılır, daha sonra fragmanların her biri sözlüğündeki koduyla değiştirilir. Sözlükte tespit edilmeyen parçalar yeni asılı köşeleri oluşturur, kilo alır ve ayrıca sözlüğe girilir. Bu, bir sözlük ikmali için adaptif bir algoritma tarafından oluşturulur.

Yöntemin verimliliğini artırmak için, sözlüğün boyutunu arttırmak arzu edilir; Bu durumda, sıkıştırma katsayısı yükseliyor. Neredeyse sözlüğün boyutu 4 - 16 KB bellekdir.


Bir örnek tarafından verilen algoritmayı gösteriyoruz. İncirde. 2.13 Kaynak diyagramını göstermektedir (ayrıca bir hafman ağacı ile de çağrılır). Her odun tepe noktası, iki hanenin fraksiyon yoluyla yazıldığı bir dikdörtgenle gösterilir: Birincisi, köşelerin sayısı, ikincisi ağırlığıdır. Çeşitli ağırlıkların ve sayılarının memnun olduğundan nasıl emin olabilirsiniz.

Şimdi, Test dizisine, test dizisine karşılık gelen sembolün ikincil ile tanıştığını varsayalım. Şekillerde gösterildiği gibi köşelerin ağırlığı değiştirildi. 2.14, sonuç olarak, Vertex numaralandırma sayısı ihlal edilir. Bir sonraki aşamada, köşeleri 1 ve 4'ü değiştirdiğimiz ve ağacın tüm köşelerini yeniden kullandığımız asma köşeleri düzenini değiştiririz. Elde edilen grafik Şekil 2'de gösterilmiştir. 2.15. Daha sonra, prosedür benzer şekilde devam ediyor.

Hafman ağacındaki her asma zirvenin belirli bir sembole veya gruplarına tekabül ettiği unutulmamalıdır. Ebeveyn, çocuklardan bir karakter grubunun, kısa bir sembol için, çocuklarından daha uygun olduğu ve bu çocuklar son sembolde farklılık göstermesi gerçeğinden farklıdır. Örneğin, ebeveynler "araba" sembollerine karşılık gelir; Sonra çocuklar bir "Kara" ve "sazan" dizileri olabilir.

Yukarıdaki algoritma akademik değildir ve programlarda aktif olarak kullanılır - grafik verilerini sıkıştırırken (aşağıda tartışılacaktır).

Lempel - Ziva Algoritmaları

Bunlar en sık kullanılan sıkıştırma algoritmaları. Çoğu programda kullanılırlar - arşivler (örneğin, PKZIP. Arj, LHA). Algoritmaların özü, özel olarak oluşturulmuş bir sözlükte arşivlenirken, bazı karakter kümelerinin değiştirilmesidir. Örneğin, genellikle "mektubunuzda giden numara" ifadesinin işlerinde bulunur. "Sözlük pozisyonunda 121; Ardından, belirtilen cümleyi aktarmak veya depolamak yerine (30 bayt), cümle numarasını (1,5 bayt ikili - ondalık formda veya 1 baytta ikili) saklayabilirsiniz.

Algoritmalar, ilk olarak 1977'de onları öneren yazarlardan sonra isimlendirilir. Bunların, ilk - LZ77. Arşivleme için, iki bölümden oluşan kayma penceresi olarak adlandırılır. İlk kısım, daha fazla format, bir sözlük oluşturmaya yarar ve birkaç kilobayt siparişinin büyüklüğüne sahiptir. İkinci olarak, daha küçük kısım (genellikle 100 bayt'a kadar), görüntülenen metnin mevcut karakterleri tarafından kabul edilir. Algoritma, izlenen pencereyle çakışan karakter kümesinde bulmaya çalışıyor. Mümkünse, üç parçadan oluşan bir kod oluşturulur: sözlükteki bir yer değiştirme, bu alt tabaka karakterinin yanındaki bu alt tabakanın uzunluğu. Örneğin, özel bir substrat "Uygulama" sembollerinden (yalnızca 6 karakter) oluşur, aşağıdaki sembol "E" dır. Ardından, alt dizgin bir adrese sahipse (sözlükteki yer) 45, sözlükteki kayıt "45, 6. E" formuna sahiptir. Bundan sonra, pencerenin içeriği konumuna geçer ve arama devam eder. Böylece bir sözlük oluşur.

Algoritmanın avantajı, bir sözlük derlemek için kolayca resmileştirilmiş bir algoritmadır. Ek olarak, unzip ve ilk sözlük olmadan (bir test dizisine sahip olmak arzu edilir) - Sözlük Unimber sürecinde oluşturulur.

Algoritmanın dezavantajları, sözlük boyutunda bir artışla görünmektedir - Arama zamanı artar. Ek olarak, geçerli pencerede bir karakter dizisi eksikse, her sembol üç eleman koduna yazılır, yani. Sıkıştırma değil, ancak gerilmeyi ortaya çıkar.

En iyi özellikler 1978'de önerilen LZSS algoritmasına sahiptir. Sürgülü pencerenin ve kompresörün çıkış kodlarını korumada farklılıkları vardır. Pencereye ek olarak, algoritma, tesadüf aramasını hızlandırmak için Hafman Ağacına benzer bir ikili ağaç oluşturur: Geçerli pencereyi terk eden her bir alt, çocuklardan biri olarak ağaca eklenir. Böyle bir algoritma, geçerli pencerenin boyutunu daha da arttırmanıza olanak tanır (iki: 128, 256, vb.) Duyduğu değerinin arzu edilir. Dizi kodları ayrıca farklı şekilde oluşturulur: 1 bit öneki, yansıtılmamış karakterlerin "ofset, uzunluğu" çiftlerinden ayırt edilmesi için eklenir.

LZW Tip algoritmaları kullanılarak daha da büyük bir sıkıştırma elde edilir. Önceden tarif edilen algoritmaların sabit bir pencere boyutuna sahiptir, bu da cümlelerin sözlüğüne girmenin imkansızlığına yol açar pencere boyutundan daha uzundur. LZW algoritmalarında (ve selefleri LZ78) Görünüm penceresi sınırsız bir boyuta sahiptir ve sözlük cümleyi (ve daha önce olduğu gibi bir karakter toplamı) biriktirir. Sözlük sınırsız bir uzunluğa sahiptir ve enkoder (kod çözücü) bekleme modu modunda çalışır. Sözlüğe denk gelen ifade oluşturulduğunda, tesadüf kodu verilir (yani sözlükteki bu ifadenin kodu) ve arkasındaki aşağıdaki sembolün kodu. Semboller biriktirince yeni bir cümle oluşturulursa, en kısa olanı olarak sözlüğe de girilir. Sonuç olarak, hızlı kodlama ve kod çözme sağlayan özyinelemeli bir prosedür oluşturulur.

Ek fırsat Sıkıştırma, tekrarlayan karakterlerin sıkıştırılmış kodlamasını sağlar. Dizeleyerek, bazı karakterler bir satırda izlerse (örneğin, metinde, "alan" karakterleri, sayısal sekans akan sıfırlar, vb. Olabilir.), Çiftlerini değiştirmek için anlamlıdır "sembolü; uzunluk "veya" işareti, uzunluğu ". İlk durumda, kod, dizinin kodlandığı (genellikle 1 bit), daha sonra yinelenen sembolün kodunu ve sıranın uzunluğunun kodunu belirtir. İkinci durumda (en yaygın tekrarlanan semboller için sağlanan) öneki, sadece bir tekrarlama belirtisini gösterir.