Tudjon meg többet a hang konverziós beállításokról. Mi a bitráták? Hogyan befolyásolják a zene és a videó minőségét? Mi jobb, mint 128 vagy 320 kbps

Elgondolkodtál már valaha is, hogy pontosan mit vesz el, ha az MP3 128 kbps-ben vagy 320 kbps-ben veszteségmentes sűrítésre kerül?
Ellenőriztem, és az eredmény érdekesnek tűnt. Először is, javasolok egy felmérést, hogy megértsem magad, hogy hallja, hogy a különbség általában. Ha nem biztos benne, hogy hallja vagy magabiztos, hogy nem hallasz, javasolok egy egyszerű és elegáns ötletet a figyelmedre: két homlokot kell vinnie hang hullámok Ezek közül az egyik az antifázisban lesz, illetve a két szám információiban előnyös lesz, ami nem lesz visszaváltott. Érdekes diagramok még nem ígérnek, de hallani magukat a rendszerünkre, hogy milyen hangokat veszítenek el, ha a FLAC-tól az MP3 128 \\ 320 kbps-ig terjed, egy archívum példákkal a cikk végén.
Interjú
Letölteni és hallgatni kell 12 sávot 30 másodpercig. Ezután megadja mind a 4 kompozíciók mindegyikét a 3 opció egyikének (128 kbps, 320 kbps vagy veszteségmentes).
A felmérés névtelen, de megadhatja az egyedi hash-t, és elmondhatja nekem, mint egy utolsó lehetőség, közzéteszi véleményét itt, de szükségszerűen a spoiler alatt. A felmérés 25.02-ig tart, a kulcs és a statisztikák után.
Fájlok a Yandex lemezen, tükrözi a Dropbox-on (~ 80MB).
Kezdeti adatok
A fekete gombok - örökkévaló fény (FLAC, 44100 Hz, 24 bites, 1613 kbps), olvashatsz Youtube..
Ludovico Einaudi - Drop (FLAC, 96000 Hz, 24 bites, 2354 Kbps), olvashat yandex zenét.
CC Coletti - Rock and Roll (Flac, 192000 Hz, 24 bites, 4845 kbps), olvasható Youtube..
Annihilator - ultra-mozgás (FLAC, 44100 Hz, 16 bites, 1022 kbps), olvashatsz Youtube..
Konverziós paraméterek MP3-ban
44.1KHz, sztereó, 128 kbps vagy 320 kbps
A kísérlet leírása
A forrásfájlokat 10 másodperces darabokra vágjuk, mindegyik darabot a WAV-be exportálják. A kapott sávok behozatala után 2 másodperces csend és egy második hangjelzés hozzáadódik, majd az MP3-ra alakítva. Az MP3 fájlok importálása után kiderül, hogy az eredetihez képest az így kapott fájl "előre". Ez nem hiba, hanem. Szinkronizálást végzünk a megadott hangjelzéssel kapcsolatban az eredetiből (megpróbáltam minden egyes értéket, amely több értéket is megpróbáltam, amely később tisztázta a legjobb eredményt), megszabaduljon a hangjelzéstől, a csend és a kapott kereskedelem exportálva a WAV-be. Most továbbra is megfordítja a zeneszámokat, hogy többirányú csúcsokat kapjon, és csökkentse az eredetit.
Eredmény
Nem fogok megnyitni Amerikát ... Igen, van egy különbség. Igen, különösen 128kbps tömörítéskor. Igen, a zenétől függ. Igen, még inkább az audio kódból.
Készítsen egy független kimenetet, és hallja a különbséget, amit letölthet a fájlokat

Napjainkban sok beszélgetés van, hogy elvesztettük a valódi zenét a kompresszív hangformátumok, például MP3, AAC és hasonló érkezésével. Ez igaz? Veszélyes formátumok mentése? Lehet-e felkészületlen hallgató megkülönböztetni a zenét az MP3 formátumokban a Flac-tól? Tedd ki ezt ebben a kérdésben.

Mi a bitráta (bitráta)?

Valószínűleg már hallottad a "bitráta" kifejezést, és valószínűleg általános ötlete van arról, hogy mit jelent, de talán nem rossz, hogy megismerkedjen hivatalos definíciójával, hogy tudja, hogyan működik.

Bitráta - ez a feldolgozott adatok száma vagy mennyisége bizonyos időszak idő. Audióban ez általában azt jelenti, hogy kilobit / másodperc. Például az iTunes-ben vásárolt zene másodpercenként 256 kilobit, azaz minden második dal 256 kilobájt adatot tartalmaz.

Minél magasabb az útvonalbit arány, annál több helyet fog venni a számítógépen. Általános szabályként az audio CD elég sok helyet foglal el, így normális gyakorlat lett a fájlok tömörítéséhez, hogy több zenét rögzíthessen az Ön számára hDD (vagy ipod, dropbox vagy valami más). Itt van, hogy a "veszteségek nélkül" és a "veszteségek" formátumok vitathatók.

Veszthetetlen és veszteséges formátumok: Mi a különbség?


Amikor azt mondjuk, hogy "veszteség nélkül", azt értjük, hogy tényleg nem változtattuk meg a forrásfájlt. Ez az, hogy másoltuk a pályát a CD-ről a merevlemezre, de nem szorította meg azt olyan mértékben, hogy elvesztettük az adatokat. Ez lényegében ugyanaz, mint az eredeti CD-sáv.

Azonban leggyakrabban valószínűleg a zenét veszteséges formátumban másolja. Ez azt jelenti, hogy CD-t vettél, átmásolta a merevlemezre, és összeszorította a pályákat, hogy ne foglaljanak sok helyet. Egy tipikus album valószínűleg 100 MB-ot vesz igénybe. Ugyanaz az album veszteséges formátumban, mint például (más néven alma veszteségmentes), körülbelül 300 MB-ot vesz igénybe, így közös gyakorlatává vált a veszteséges formátumok használatához gyors letöltés és nagyobb merevlemez-megtakarítás.

A probléma az, hogy amikor egy fájlt a hely mentéséhez nyomja meg, törölheti az adatokat. Csakúgy, mint amikor kiváló minőségű képet készít, és tömöríti azt a JPEG-ben, a számítógép a forrásadatokat és a "megtéveszteni" a kép egyes részeit, így többnyire ugyanaz, de az egyértelműség és a kiváló minőségű elvesztés miatt.

Például, vegyen be két képet: A jobb jog egyértelműen tömörített, és ennek eredményeképpen a minőség csökkent.

Ne feledje, hogy megment egy merevlemez-területet, amely a zenét veszteséges formátumokban, amely nagy jelentőséggel bír az iPhone 32 GB memóriájára, de a térfogat / minőség mennyisége szerint ez csak kompromisszum.

Különböző tömörítési szintek vannak: 128 Kbps, például nagyon kevés helyet foglal el, de alacsonyabb lejátszási minőséget is kap, mint egy nagyobb 320 kbit / s fájl, amely viszont alacsonyabb, mint a referenciafájl, mint a referenciafájl 1.411 kbps. 1.411 Kbps az audio CD-szint minősége, amely a legtöbb esetben több mint elég.

Az egész probléma nem mennyire tömörítette a zenét, de melyik eszközt hallgatja.

A bitráta valóban számít?


Mivel a memória minden évben olcsóbbá válik, meghallgatja a hangot egy magasabb bitsebességgel, vagy egyáltalán veszte nélküli formátumban, egyre népszerűbbé válik. De megéri, erőfeszítés és forgalmas memória a telefonon vagy a számítógépen?

Nem szeretem válaszolni a kérdésekre, de sajnálatos módon a válasz: ez függ.

Az egyenlet része az Ön által használt berendezés. Ha kiváló minőségű fejhallgatót vagy hangszórókat használ, akkor nagy gyakorisággal és dinamikus tartományok. Így akkor valószínűleg észre a hiányosságokat, amelyek akkor jelentkeznek, amikor a tömörítés zenét fájlok kisebb bitrátával. Megjegyezheti, hogy az alacsony minőségű MP3 fájloknál nincs bizonyos részletességi szint; A vékony háttérfogatok nehezebbek lehetnek az észleléshez, a felső és az alacsony frekvenciák nem lesznek olyan dinamikusak, vagy hallhatsz torzulást a szólista énekében. Ezekben az esetekben szükség lehet egy magasabb bitsebességű pályára.

Ha azonban hallgatja a zenét egy olcsó fejhallgatóval az iPod-onValószínűleg nem fogja észrevenni a 128 Kbps-fájl és a 320 Kbit / S fájl közötti különbséget, és nem is beszélve a zenére 1,411 kbps veszteség nélkül. Ne feledje, amikor megmutattam egy többszörös bekezdést, és megjegyezte, hogy valószínűleg meg kellett néznie, hogy lássa a hiányosságokat? A fejhallgató olyan, mint a kép csonkolt változata: ezeknek a hátrányoknak nehézkesek lesznek az észleléshez, mivel fizikailag képesek játszani a zenét szükség szerint.

Az egyenlet másik része, természetesen a saját füleid. Néhány ember nagyon nehéz megkülönböztetni két különböző bitrátát egy egyszerű oknál - hallgatni kevés zenét hallgatni. A hallási készség, mint bármely más, a gyakorlatban fejlődik. Ha gyakran hallgatsz egy csomó kedvenc zenét, a pletyka pontosabbá válik, és elkezdi megragadni a kis részleteket és a féltónusokat. De addig nem számít, milyen bitráta van?

Tehát milyen formátum és bitráta van választani magadnak? 320 kbps lesz, vagy veszteséges formátumra van szüksége?

Az a tény, hogy nehéz hallani a veszteségfájl és a 320 kbps mp3 fájl közötti különbséget. A különbség hallani, komoly kiváló minőségű felszerelésre, jó hallásra és egy bizonyos típusú zenére lesz szüksége (például klasszikus vagy jazz).

Az emberek túlnyomó többsége, 320 kbps / több mint elég ahhoz, hogy meghallgassa.

Mi mást figyelembe venni?


A zene, amelyet rögzítettek, hasznosak lehetnek. A veszteséges formátumú fájlok a jövőben megbízhatóbbak a jövőben, abban az értelemben, hogy mindig a veszteséges formátumba szoríthatja őket, ha szüksége van rá, de nem lehet éppen ellenkezőleg, és visszaállíthatja az eredeti CD-minőséget az MP3 fájlból. Ez ismét az online zenei áruházak egyik alapvető problémája: Ha hatalmas zenei könyvtárat hozott létre az iTunes-i és egy nap úgy döntött, hogy több bitráta szükséges, akkor újra meg kell vásárolnia, de csak ezúttal CD formátumban.

Ha lehetséges, mindig vásárolok vagy másolok zenét veszteségmentes formátumban biztonsági mentési célokra.

Megértem, hogy audiofilek, olyan, mint egy köröm alatti tű. Ahogy mondtam, mindez attól függ, hogy Öntől függ, a hallásod és a felszerelésed.

Hasonlítsa össze a veszteséges és veszteséges formátumokban rögzített két számot. Próbáljon ki több különböző hangformátumot, hallgassa meg egy kis időt, és nézze meg, hogy lesz-e különbség az Ön számára, vagy sem.

A legrosszabb esetben néhány órát töltesz a kedvenc zenéjének hallgatására - nem olyan ijesztő, ugye? Élvezd!

Előnyök és hátrányok MP3 128 kbps

A hangadatok tömörítése bonyolult dolog. Semmi sem mondható előre ... A ma leggyakoribb formátuma az MPEG Layer3 128 kbps árammal rendelkezik - minőséget biztosít, hogy az első pillantásra nem különbözik az eredetitől. Ez is úgynevezett frivolous - "CD-minőség". Mindazonáltal szinte mindenki tudja, hogy sok ember kapja az orrát az ilyen "CD minőségről". Mi a baj? Miért nem elegendő ez a minőség? Nagyon nehéz kérdés. 128 kbps tömörítés ellenfele vagyok, mivel az eredmény néha hülye. De 128 kbps-ben számos rekord van, amelyekre gyakorlatilag nem találok hibát. Függetlenül attól, hogy az 128-as patak alkalmas-e egy vagy más anyag kódolására - sajnos csak akkor, ha az eredményt ismételten meghallgatná az eredményt. Nem lehet semmit előre mondani - személyesen nem ismeri azokat a jeleket, amelyek előzetesen lehetővé teszik az eredmény sikerességének meghatározását. De gyakran a 128 patak teljesen elegendő a kiváló minőségű zenei kódoláshoz.

A 128 kbps kódoláshoz a legjobb, ha a Fraunhofer - MP3 producer 2.1 vagy újabb termékeket használhat. A mp3enc 3.0 mellett - bosszantó hiba, amely nagyon rossz, nagyfrekvenciás kódolást eredményez. A 3.0 feletti verziók nem szenvednek ennek a hátránynak.

Először is, egy kis általános szavak. A hangkép érzékelése egy személy által nagyon sokan függ a két csatorna szimmetrikus továbbításától (sztereó). Különböző torzulások különböző csatornákban - sokkal rosszabb, mint ugyanaz. Általánosságban elmondható, hogy mindkét csatornán a lehető legnagyobb hangjellemzőket biztosítja, de közben különböző anyagok (Ellenkező esetben, milyen sztereó) nagy hangfelvételi probléma, amelyet általában alábecsülnek. Ha a mono kódolását 64 kbit / s-t használhatjuk, akkor a sztereó kódolása egyszerűen két csatornában, nem lesz elegendő 64 kbps csatornánként - a sztereó eredmény sokkal inkább hibásabb lesz, mint minden csatorna külön. A legtöbb Fraunhofer termékben a mono határértéke 64 kbps - és még nem láttam egy mono rekordot (tiszta rekord - zaj vagy torzítás nélkül), ami nagyobb áramot igényelne. Valamilyen oknál fogva a monofonikus hangnak való függőségünk sokkal gyengebb, mint a sztereó - nyilvánvalóan, egyszerűen nem érzékel minket komolyan :) - pszichoakusztikus szempontból egyszerűen egy hang kimenő az oszlopból, és nem egy próbáljon ki néhány hangképet.

A sztereó jelek továbbítására irányuló kísérlet sokkal szigorúbb követelményeket jelent - végül hallottál valaha olyan pszichoakusztikus modellről, amely figyelembe veszi az egyik csatorna maszkolását másoknak? Néhány hátramenetet is figyelmen kívül hagynak, például a hatások - például egy sztereó hatás, amelyet mindkét csatornára terveztek azonnal. A bal oldali csatorna elkülönítése a hatás saját részét maszkolja - nem fogjuk hallani. De a jobb csatorna jelenléte a hatás második része - megváltoztatja a bal csatorna érzékelését: tudatosan elvárjuk, hogy meghallgassuk a hatása bal oldali részét, és ezt a változását pszichoakusztika is figyelembe kell venni. Gyenge tömörítéssel - 128 kbps egy csatornán (összesen 256 kbps) Ezek a hatások közelednek, mivel minden csatorna teljesen teljes mértékben bemutatásra kerül, hogy átfedje az átviteli szimmetria szükségességét, de a csatornán körülbelül 64 kbps szálak esetében nagy Probléma - Az ízület vékony árnyalatának átadása A mindkét csatorna észlelése pontosabb átvitelt igényel, mint az ilyen patakokban.

Természetesen két csatorna számára teljes körű hangszóró modellt lehetett létrehozni, de az iparág egy másik úton haladt át, amely általában ezzel egyenértékű, de sokkal könnyebb. Számos algoritmus a fent leírt problémák közös sztereó-részleges megoldásának általános nevével. A legtöbb algoritmus az a tényre csökken, hogy a központi csatorna és a különbség csatorna hozzárendelve - közép / oldalsó sztereó. A központi csatorna hordozza a fő audio információt és szabályos mono csatorna, amely két forrásból csatornákat és a különbség a többi információt, amely lehetővé teszi, hogy visszaállítsa az eredeti sztereó hangot. Önmagában ez a művelet teljesen reverzibilis - ez csak egy másik módja annak, hogy két csatornát reprezentálunk, amellyel könnyebb dolgozni a sztereó információk tömörítése során.

Ezenkívül általában egy külön központi és különbségi csatorna tömörítését tömöríti, miközben az a tényt használja, hogy a valódi zene különbségcsatorna viszonylag gyenge - mindkét csatorna sok közös. A központi és differenciális csatorna melletti kompressziós egyensúlyt az útközben választják, de többnyire sokkal nagyobb átáramlik a központi csatornához. A komplex algoritmusok úgy döntenek, hogy mi vagyunk ebben a pillanatban Előnyösebb - egy helyesebb térbeli kép vagy az információcsatornák gyakori továbbításának minősége, vagy egyszerűen tömörítés a közép / oldalsó sztereó nélkül - azaz a kettős csatorna üzemmódban.

Furcsa módon, de a sztereó tömörítés a leggyengébb tömörítési eredmény a 148 kbps rétegben. Lehetetlen kritizálni a formátum alkotóit - ez még mindig kevéssé lehetséges. A vékony sztereó információ szinte nem érzékelhető tudatosan (ha nem veszi figyelembe a nyilvánvaló dolgok figyelmét - az űr, mesterséges hatások, stb. Általában valami mindig nem engedi meg, hogy elérje ezt: a számítógépes oszlopok, például sokkal jelentősebb hátrányokat tesznek, és az ilyen szubfikációkat, mivel a térbeli információk rossz továbbítása egyszerűen nem érhető el.

Nem szükséges azt gondolni, hogy mi nem teszi lehetővé a számítógépes akusztika hiányát, hogy az oszlopok 1 méter távolságra vannak elrendezve, a monitor oldalán, anélkül, hogy elegendő sztereó tálat hozna létre. A lényeg még ebben sem is van. Először is, ha az ilyen oszlopokhoz tartozik, az ember közvetlenül előttük ül - és ugyanolyan hatást gyakorol, mint az oszlopok a szoba sarkaiban, és még több: a normál akusztika és a jó kötet szinte soha nem jelölheti ki a hangok pontos térbeli helyét (ez nem a hangképről szól, amely ellenkezőleg, a számítógépes hangszórók soha nem épülnek fel, hanem a közvetlen, tudatos, felfogása a különbségek között a csatornák). A számítógéposzlopok (standard használat) vagy a fejhallgató sokkal világosabbá teszik a sztereó közvetlen kezelését, mint a szokásos zenei akusztika.

Megbízható mondani - a közvetlen, informatív hangfelelés érdekében, nem vagyunk túl szükség pontos sztereó információ. Közvetlenül észleli a különbséget ezen a szempontból az eredeti és a réteg3 128 kbps meglehetősen nehéz, bár lehetséges. Sok tapasztalatra van szüksége, vagy erősíti az érdeklődés hatásait. A legegyszerűbb dolog, ami lehet tenni, hogy gyakorlatilag terjessze a csatornákat, amelyek fizikailag lehetségesek. Ez általában ez a hatás, amely az olcsó bekapcsol számítástechnikus 3D hanggomb. Vagy olyan boom dobozokban, amelyek oszlopait nem különítik el a készülék testétől, és túl gyengék a gyönyörű sztereó továbbítására természetes módon. A térbeli információk átmenete mindkét csatorna specifikus hanginformációjára - a csatornák közötti különbség növekszik.

Erősebb hatást gyakoroltam, mint általában elfogadott, hogy jobban hallja a különbséget. Nézd meg, hogyan kell szólalnia - miután kódoló 256 kbps dupla csatorna (256_channels_wide.mp3, 172 kb), és hogyan hangzik a kódolás után 128 kbps Joint Stereo (128_channels_wide.mp3, 172 kb).

Visszavonulás. Mindkét fájl az MP3 256 kbps, az MP3 gyártó 2.1 használatával kódolva. Ne keverje össze: i, először, tesztelje az MP3-t, és másodszor - az MP3 tesztelési mp3 teszt eredményeit;). Mindez így volt: Először 128-ban és 256-ban a zene áthaladásait kódoltam. Ezeket a fájlokat, az alkalmazott feldolgozást (sztereó bővítő) 256-ban szétválasztottam - csak a tér megmentésére - és itt helyezték el.

By the way, csak 256 kbps az MP3 gyártó 2.1 kikapcsolja az ízületi sztereó és a kettős csatornák - két független csatorna. Még 192 kbps a 2.1-es gyártóban is valamilyen ízületi sztereó, mert a példáim nagyon helytelenül tömörítették kevesebb, mint 256 kbps. Ez a fő oka annak, hogy a "teljes" minőség 256 kbps-vel kezdődik - történelmileg kifejlesztette, hogy a Fraunhofer (legfeljebb 98 év) szabványos kereskedelmi termékeiben lévő kisebb áramlás közös sztereó, amely minden esetben elfogadhatatlan a teljesen helyes átvitelhez. Egyéb (vagy késői) termékek elvben lehetővé teszik, hogy önkényesen válasszon - közös sztereó vagy kettős csatornát - bármilyen szálra.

Az eredményekről

Az eredeti (ami ez az eset Pontosan 256 kbps) hallottunk egy hangot egy megerősített különbségcsatornával és gyengült központi. Nagyon jól hallották a hangot, mint általában, mindenfajta mesterséges reverb és echo - ezek a térbeli hatások elsősorban a különbségcsatornában vannak. Különösen beszélni, ebben az esetben a központi csatorna 33% -a és 300% -os különbség volt. Az abszolút hatás a központi csatorna 0% -a - bekapcsolja a berendezés típusát zenei központok "Karaoke vocal fader", "Voice Cancelation / Eltávolítás" vagy hasonló, amelynek jelentése az, hogy eltávolítsa a hangot a fonogramból. A művelet jelentése az, hogy a hangot általában csak a központi csatornán rögzítik - ugyanazt a jelenlétet a bal és a jobb oldali csatornában. A központi csatorna eltávolítása, eltávolítjuk a hangot (és sokkal többet, így ez a funkció való élet Elég haszontalan). Ha ilyen dolog van - hallgathatod az MP3-t vele - vicces ízületi sztereó érzékelőt kapunk.

Ezen a példában már közvetetten megértheti, hogy elvesztünk. Először is, észrevehetően rosszabb volt, mint az összes térbeli hatások - csak elveszettek. De a második - a bouffagon eredménye a térinformáció hangra való átmenetének eredménye. Milyen volt az űrben - igen, csaknem véletlenszerűen mozgó hangkomponensek, egy bizonyos "térbeli zaj", amely nem volt az eredeti hangogramban (legalábbis a térbeli információk átmenetének ellenáll a hangtalanságnak a külföldi megjelenése nélkül hatások). Ismeretes, hogy ez a fajta torzítás alacsony áramlásokban történő kódoláskor gyakran jelenik meg és közvetlenül további kezelések. Csak az azonnali hang torzítás (ami szinte mindig nem) tudatosan és azonnal érzékeli, és a sztereó (amely közös sztereó, mindig van nagy mennyiségű) - Csak tudat alatt és a hallgatás folyamatában egy ideig.

Ez a legfontosabb ok, amely nem adja meg a Layer3 128 kbps hangját, hogy teljes CD minőségnek tekinthető legyen. Az a tény, hogy önmagában a mono sztereó hangjának átalakulása erős negatív hatást fejt ki - gyakran ugyanazt a hangot ismétlődik különböző csatornákban, kis késéssel, hogy kevert, akkor csak az elmosódott hangot adja. A sztereó hangból készült mono hangzás sokkal rosszabb, mint az eredeti mono rekord. A különbségcsatorna a központi (vegyes mono-csatorna) mellett teljes fordított szétválasztást ad a jobb és bal oldali, de a különbségi csatorna részleges hiánya (elégtelen kódolás) nemcsak elégtelen térbeli képet eredményez, hanem ezek a kellemetlen hatások is a sztereó hang keverése egy mono csatornában.

Ha minden más akadály megszűnik - a berendezés jó, a tonális szín és a dinamika változatlan (a patak elég a központi csatorna kódolásához) - továbbra is fennmarad. De vannak olyan hangfelvételek, amelyek olyan módon vannak rögzítve, hogy a közép / oldalsó sztereó közepes / oldalsó sztereóra alapuló negatív hatásai ne manduláljanak -, majd 128 kbit / s ugyanazt a teljes minőséget biztosítja, mint 256 kbps. Privát eset - A fonogram gazdag lehet a sztereó információ, de rossz hanginformáció jelentése - például egy lassú játék a zongorán. Ebben az esetben a különbség csatorna kódolásához a patak teljesen elegendő a pontos térinformációk továbbításához. Nehézbb esetek - egy aktív elrendezés, amely különböző eszközökkel teli, mindazonáltal 128 kbps nagyon jónak hangzik - de ez ritkán található, esetleg öt-tízből. Azonban megtalálható.

Valójában hangzik. Nehéz kiemelni a központi csatorna hangjának közvetlen hangját a Layer3 128 kbps-ben. A frekvenciaviszlás hiánya magasabb, mint 16 kHz (az úton, nagyon ritka, de továbbra is továbbított), és az amplitúdó bizonyos csökkenése nagyon magas - szigorúan önmagában - csak értelmetlen. Egy személy néhány perc alatt teljesen megszokja, és nem olyan tonális torzulásokhoz, egyszerűen nem tekinthető erős negatív tényezőknek. Igen, ez torzítás, de a "teljes minőségű" észleléséhez - messze vissza. A központi, közvetlenül a hang, a csatorna másfajta - a rendelkezésre álló adatfolyam éles korlátozása lehetséges a csatorna kódolásához, amelyet egyszerűen bnezív körülmények okoznak - nagyon bőséges térbeli információk, amelyek különböző hangokkal vannak betöltve, gyakori nem hatékony rövid blokkok és mindezek következtében - teljesen fogyasztott tartalékpufferáramlás. Ez történik, de viszonylag ritka, és hogy - ha ilyen tény történik, általában folyamatosan észrevehető a nagy töredékekre.

Az ilyen jellegű hibák megjelenítése egy explicit formában, hogy észrevegye az embereket, nagyon nehéz. Könnyen észrevehetők még anélkül, hogy olyan személyt kezelnének, akit a hangzás kezelésére használják, de egy rendes, nem kritikus hallgató számára teljesen megkülönböztethetetlennek tűnhet az eredeti hangtól és néhány absztrakt ásástól, ami nem igazán. És még mindig nézd meg a példa. Erős feldolgozást kellett alkalmazni az elosztására - hogy a dekódolás után jelentősen csökkentse a közepes és nagy frekvenciák tartalmát. Eltávolítom, hogy zavarja ezeket a frekvencia árnyalatokat. Természetesen megsérti a kódolási modell munkáját, de segít abban, hogy jobban megértsük, hogy mi vesztes. Tehát - amint azt hangzik (256_bass.mp3, 172 kb), és mi történik a 128 kbps áramlását és feldolgozása után (128_bass.mp3, 172 kb). Figyeljen a folytonosság észrevehető veszteségére, a basszus hangzásának simítására, valamint néhány más anomáliára. Átruházás alacsony frekvenciák Ebben az esetben a magasabb frekvenciák és a térinformációk javára adományozott.

Meg kell jegyezni, hogy az akusztikus tömörítési modell munkája megfigyelhető (figyelmes tanulással, és van néhány tapasztalat a hanggal) és 256 kbps, ha többé-kevésbé erős egyenlítőt alkalmaz. Ha ezt megteszi, akkor hallgatja, néha (elég gyakran) lehetséges, hogy észrevegye a kellemetlen hatásokat (csengetés / bullhead). Ennél is fontosabb, hogy az ilyen eljárás után a hang egy kellemetlen, egyenetlen jellegű lesz, ami nagyon nehéz észrevenni azonnal, de ez jelentősen meghallgatható. A 128 és 256 közötti különbség csak egy 128 kbps áramlásában van, ezek a hatások gyakran feldolgozás nélkül léteznek. Ők is nehezen észrevenni őket, de ők - egy példa a basszussal, hogy valami ötletet ad, hogy hol keressük őket. A magas szálak (256 kbps feletti), a feldolgozás nélkül egyszerűen lehetetlen. Ez a probléma nem érinti a magas áramlást, de van valami, ami néha (nagyon ritkán) nem teszi lehetővé még réteget 3 - 256 kbit / az eredeti - ezek ideiglenes paraméterek (további részletek lesznek külön cikkben: lásd Mpeg Layer3 256 / LINK egy másik cikkhez /).

Vannak olyan hangfelvételek, amelyek nem érintik ezt a problémát. A legegyszerűbb módja annak, hogy felsorolják azokat a tényezőket, amelyek éppen ellenkezőleg, a fent leírt torzítás kialakulásához vezetnek. Ha egyikük sem fejeződik be - nagy esély van arra, hogy teljes mértékben sikeres legyen, ebben a szempontban, kódolva a Rétegben3 - 128 kbps. Mindez azonban attól függ, hogy egy adott anyagból ...

Először is, a zaj, mondjuk hardvert. Ha a hanghordozó kézzelfogható zaj - nagyon nem kívánatos, hogy kicsi patakokká váljanak, mivel túl nagy mennyiségű áramlás történik a felesleges információk kódolásához, ami szintén nem is ésszerű, hogy ésszerű kódolás az akusztikus modell segítségével.

  • Csak zaj - mindenféle nem kiáltott hangok. A város, az utcán, az étteremben stb. Ez a fajta hangok nagyon gazdag információkat adnak, amelyeket kódolni kell, és az algoritmus kénytelen lesz feláldozni valamit a fő anyagban.
  • Természetellenes erős sztereó hatások. Inkább az előző tételhez tartozik, de minden esetben - túl sok az áramlás a különbségi csatorna, és a központi csatorna kódolása erősen romlik.
  • Erős fázis torzítás, különböző a különböző csatornák esetében. Elvileg ez inkább a kódoló algoritmusok hibáira vonatkozik, mint a standard, de mégis. A legvadabb torzulások az egész folyamat teljes lebomlása miatt kezdődnek. A kezdeti hangfelvétel ilyen torzulásai a legtöbb esetben a kazetta berendezések és az azt követő digitalizálás révén, különösen akkor, ha gyenge minőségű, megfordulásokkal rendelkező olcsó szalagos felvevők. A fejek görbe vannak, a szalag a ferde, és a csatornák enyhén fogva tartják a másikhoz képest.
  • Csak túlterhelt rekord. Nagyon durván beszél - a nagy szimfonikus zenekar az egész :). Általában 128 kbps tömörítés eredményeként valami teljesen vázlatos kamra, réz, dob, szólista. Természetesen nem csak a klasszikusok.

Egy másik pólus az, ami általában tömörítette:

  • Egyéni eszköz viszonylag egyszerű hangzás - Gitár, zongora. A hegedű például túlságosan kitöltött spektrummal rendelkezik, és általában nem nagyon jó hangzik. A hegedű hegedűművészektől ténylegesen a munkától függ. Ezenkívül számos eszközzel is tömörítette - például SPard, például (szerszám + hang).
  • Minőség Modern zene. Ez nem jelenti a zenei minőséget, de a hangminőség a csökkentés, az eszközök helye, a komplex globális hatások kategorikus hiánya, amely hangokat díszít, és általában felesleges. Ebben a kategóriában például az egész modern pop, néhány szikla, és általában nagyon sok dolog van.
  • Agresszív, "villany" zene. Nos, annak érdekében, hogy valahogy egy példa - korai metallica (és általában általában is). [Emlékezz, nem a zenei stílusokról! csak egy példa.]

Érdemes megjegyezni, hogy a réteg3 tömörítés szinte nem lenyűgözi a paramétereket, például a magas frekvenciák, a basszus, a süket / csengetés stb. Van egy függőség, de olyan gyenge, hogy nem tudod figyelembe venni.

Sajnos (vagy szerencsére?), Maga nyugszik a személy maga. Sokan előkészítés nélkül és előválasztás hallani a különbséget flow körülbelül 128 kbps és az eredeti, sok még a szintetikus extrém példák nem érzékeli hallás, mint különbséget. Először nem kell semmit meggyőzni, a második példát, és nem meggyőzni ... egyszerűen azt mondhatnánk, hogy valaki különbsége van, és valaki nem rendelkezik, ha nem lenne egy dolog: a zene hallgatása során Idővel az észlelésünk minden idők javulnak. Látszik jó minőségű Tegnap, holnap már nem tűnik el - mindig történik. És ha ez meglehetősen értelmetlen (legalábbis véleményem szerint) a borogatást 320 kbps képest 256 kbps - a nyeremény nem túl fontos, bár nyilvánvaló, akkor a zenelejátszás legalább 256 kbps is.

Ebben a cikkben tisztázzuk az Aduo kódolásának lovakat, amelyek befolyásolják a hang minőségét. A konverziós beállítások megértése segít kiválasztani a legmegfelelőbb hangkódolási lehetőséget a fájlméret kapcsolatának szempontjából a hangminőséghez.

Mi a bitráta?

A bitráta az audioáram átadásához használt időtartamú adatok mennyisége. Például egy 128 kbps bitsebességet visszafejtünk 128 kilobit másodpercenként, és azt jelenti, hogy 128 ezer bitet használnak a hang kódolására (1 byte \u003d 8 bit). Ha ezt az értéket kilobájtban lefordítja, akkor kiderül, hogy egy második hang körülbelül 16 kb-t vesz igénybe.

Így minél magasabb a pálya útja, annál több helyet vesz igénybe a számításra. De ugyanakkor egy formátumban egy nagyobb bitsebesség lehetővé teszi, hogy a hangot nagyobb minőségű. Például ha Convery audio-CD MP3, majd egy bitrátát 256 kbps, a hang lesz lényegesen jobb, mint a bitráta 64 kbps.

Mivel most a lemezterület meglehetősen olcsóvá vált, javasoljuk, hogy MP3-re konvertáljon egy kicsit alacsonyabb, mint 192 Kbps.

Szintén megkülönböztetni az állandó és változó bitrátákat is.

Az AC (VBR) állandó bitráta (CBR) közötti különbség

Állandó bitrátával kódolva az összes hangszekció kódolását, ugyanolyan mennyiségű bitet használnak. De a hangszerkezet általában más, és például a csend kódolására, szignifikánsan kevesebb bit szükséges, mint a telített hang kódolásához. A változó bitráta, ellentétben az állandóval, automatikusan beállítja a kódolási minőséget, attól függően, hogy a hang összetettsége bizonyos időközönként. Vagyis az egyszerű kódolás szakaszaihoz alacsonyabb bitsebességet alkalmaznak, és a komplexumra magasabb értéket alkalmaznak. A változó bitráta segítségével nagyobb hangminőséget érhet el kisebb fájlmérettel.

Mi a mintavétel gyakorisága?

Ez a koncepció a konvertáláskor következik be analóg jel A digitális és jelzi a másodpercenkénti minták (mérési szint mérések) számát, amelyeket a jel konvertálnak.

Mi a csatornák száma?

A csatorna, adminisztratív módon az audio kódolás független hangáram. Mono - egy patak, sztereó - két patak. Nm-gyakran használják utal a csatornák száma, ahol N a számát teljes értékű hangcsatornák, és M az a szám az alacsony frekvenciájú csatornák (például 5.1).

Elgondolkodtál már valaha is, hogy pontosan mit vesz el, ha az MP3 128 kbps-ben vagy 320 kbps-ben veszteségmentes sűrítésre kerül?
Ellenőriztem, és az eredmény érdekesnek tűnt. Először is, javasolok egy felmérést, hogy megértsem magad, hogy hallja, hogy a különbség általában. Ha nem biztos benne, hogy hallja, hogy hallja, vagy biztos, hogy nem hallja, javasolok egy egyszerű és elegáns ötletet, hogy meglátogassák a figyelmet: amelyek közül az egyik az antipázisban lesz, a két sáv információiban, előnyösen hallottam, hogy nem váltották meg. Érdekes diagramok nem még ígérnek, de lehet hallani magukat a rendszer milyen hangok elvesznek préseljük FLAC MP3 128 \\ 320 kbps, egy archív példákkal végén a cikk.
Interjú
Letölteni és hallgatni kell 12 sávot 30 másodpercig. Ezután megadja mind a 4 kompozíciók mindegyikét a 3 opció egyikének (128 kbps, 320 kbps vagy veszteségmentes).
A felmérés névtelen, de megadhatja az egyedi hash-t, és elmondhatja nekem, mint egy utolsó lehetőség, közzéteszi véleményét itt, de szükségszerűen a spoiler alatt. A felmérés 25.02-ig tart, a kulcs és a statisztikák után.
Fájlok a Yandex lemezen, tükrözi a Dropbox-on (~ 80MB).
Kezdeti adatok
A fekete gombok - örökkévaló fény (FLAC, 44100 Hz, 24 bites, 1613 kbps), olvashatsz Youtube..
Ludovico Einaudi - Drop (FLAC, 96000 Hz, 24 bites, 2354 Kbps), olvashat yandex zenét.
CC Coletti - Rock and Roll (Flac, 192000 Hz, 24 bites, 4845 kbps), olvasható Youtube..
Annihilator - ultra-mozgás (FLAC, 44100 Hz, 16 bites, 1022 kbps), olvashatsz Youtube..
Konverziós paraméterek MP3-ban
44.1KHz, sztereó, 128 kbps vagy 320 kbps
A kísérlet leírása
A forrásfájlokat 10 másodperces darabokra vágjuk, mindegyik darabot a WAV-be exportálják. A kapott sávok behozatala után 2 másodperces csend és egy második hangjelzés hozzáadódik, majd az MP3-ra alakítva. Az MP3 fájlok importálása után kiderül, hogy az eredetihez képest az így kapott fájl "előre". Ez nem hiba, hanem. Szinkronizálást végzünk a megadott hangjelzéssel kapcsolatban az eredetiből (megpróbáltam minden egyes értéket, amely több értéket is megpróbáltam, amely később tisztázta a legjobb eredményt), megszabaduljon a hangjelzéstől, a csend és a kapott kereskedelem exportálva a WAV-be. Most továbbra is megfordítja a zeneszámokat, hogy többirányú csúcsokat kapjon, és csökkentse az eredetit.
Eredmény
Nem fogok megnyitni Amerikát ... Igen, van egy különbség. Igen, különösen 128kbps tömörítéskor. Igen, a zenétől függ. Igen, még inkább az audio kódból.
Készítsen egy független kimenetet, és hallja a különbséget, amit letölthet a fájlokat