Přečtěte si více o nastavení konverze zvuku. Co je to nabité? Jak ovlivňují kvalitu hudby a videa? Co je lepší než 128 nebo 320 kbps

Přemýšleli jste někdy, co přesně je ztraceno, když je komprimován od bezeztrátového v MP3 128 kbps nebo 320 kbps?
Zkontroloval jsem a výsledek se zdál zajímavý. Nejprve navrhuji průzkum, abychom pochopili, zda je rozdíl obecně. Pokud si nejste jisti, že slyšíte nebo přesvědčete, že neslyšíte, navrhuji vám jednoduchý a elegantní nápad: musíte si vzít dva čelo dva zvukové vlny Jednou z nich bude v antifázu, v tomto pořadí, v informacích o dvou tratích, bude s výhodou slyšitelný, co není vykoupeno. Zajímavé grafy ještě slibují, ale můžete slyšet sami v našem systému, jaký druh zvuku jsou ztraceny, když je stlačován z FLAC v MP3 128 320 kbps, archiv s příklady na konci článku.
Rozhovor
Musíte stáhnout a poslouchat 12 stop po dobu 30 sekund. Poté určete pro každou ze 4 skladeb jeden ze 3 možností (128 kb / s, 320 kbps nebo bezeztrátový).
Průzkum je anonymní, ale můžete určit jedinečný hash a říct mi to, jako poslední možnost, zveřejnit svůj názor zde, ale nutně pod spoilerem. Průzkum bude trvat až do 25.02, po klíčovém a statistikách.
Soubory na disku YanDEX, zrcadlo na Dropbox (~ 80MB).
Počáteční data
Černé klíče - věčné světlo (FLAC, 44100 Hz, 24-bit, 1613 kbps), můžete číst Youtube..
Ludovico Einaudi - Drop (Flac, 96000 Hz, 24-bit, 2354 kbps), můžete číst hudbu Yandex.
CC Coletti - Rock and Roll (Flac, 192000 Hz, 24-bit, 4845 kbps), můžete si přečíst Youtube..
Annihilator - Ultra-Motion (Flac, 44100 Hz, 16-bit, 1022 kbps), můžete přečíst dál Youtube..
Konverzní parametry v mp3
44.1KHz, stereo, 128 kbps nebo 320 kbps
Popis experimentu
Zdrojové soubory jsou vyříznuty na kousky 10 sekund, každá z kusů je exportována do WAV. Po importu získaných stop na začátek každého, se přidá 2 sekundy ticha a druhý tónový signál, pak převedeno na MP3. Po importu souborů MP3 se ukáže, že relativní k originálu, výsledný soubor "pokračoval". To není chyba, to je. Provádíme synchronizaci s ohledem na specifikovaný tónový signál z originálu (pokusil jsem se o každý soubor MP3 několik hodnot, které následně vyjasněno k nejlepšímu výsledku), zbavte se tónového signálu, ticha a získané obchody jsou exportovány do WAV. Nyní zůstane invertovat stopy, aby se získala vícedirovorální vrcholy a snížit originál.
Výsledek
Nebudu otevřít Amerika ... Ano, je to rozdíl. Ano, zvláště když komprimován na 128kbps. Ano, závisí na hudbě. Ano, ještě více z audio kódu.
Udělejte nezávislý výstup a slyšte rozdíl, můžete soubory stáhnout

V současné době existuje mnoho konverzací, které jsme ztratili skutečnou hudbu s příchodem kompresních audio formátů, jako je MP3, AAC a podobný. Je to pravda? Bude bezeztrátové formáty ušetřit? Může nepřipravený posluchač rozlišovat hudbu ve formátech MP3 z FLAC? Pojďme to v této záležitosti.

Co je bitrate (bitrate)?

Pravděpodobně jste již slyšeli termín "bitrate" dříve, a pravděpodobně máte obecnou představu o tom, co to znamená, ale možná to není špatné, aby se seznámili s její oficiální definicí, abyste věděli, jak to všechno funguje.

Bitrate - Toto je počet bitů nebo množství dat, které jsou zpracovány během určitá doba čas. Ve zvuku to obvykle znamená kilobit za sekundu. Například hudba, kterou kupujete v iTunes je 256 kilobit za sekundu, to znamená, že každá druhá píseň obsahuje 256 kilobajtů dat.

Čím vyšší je rychlost cesty, tím více prostor bude trvat v počítači. Zvláštní CD je zpravidla dostat do značné míry prostor, takže se stalo normální praxe komprimovat tyto soubory, takže můžete nahrát více hudby do svého hDD. (nebo iPod, Dropbox nebo něco jiného). Je to tady, že formáty "bez ztrát" a "s ztrátami" přicházejí do sporů.

Bezeztrátové a ztrátové formáty: Jaký je rozdíl?


Když říkáme "bez ztráty", máme na mysli, že jsme opravdu nezměnili zdrojový soubor. To znamená, že jsme zkopírovali trať z disku CD na náš pevný disk, ale nevrátili ji do takové míry, že jsme ztratili údaje. To je v podstatě stejné jako původní CD trať.

Nicméně, nejčastěji zkopírujete svou hudbu do ztrátového formátu. To znamená, že jste udělali CD, zkopíroval ji na pevný disk a stiskl stopy tak, aby nezabývali spoustu místa. Typické album pravděpodobně trvá 100 MB. Stejné album ve formátu ztráty, například (také známé jako bezeztrátové jablko), bude trvat asi 300 MB, takže se stala běžnou praxí pro použití ztrátových formátů pro více rychlé stahování a větší úspory pevného disku.

Problém je v tom, že při stisknutí souboru uložíte místo, odstraníte data. Stejně jako když budete mít vysoce kvalitní obraz, a komprimovat jej v JPEG, váš počítač vezme zdrojová data a "oklamat" určité části obrazu, což je většinou stejné, ale s nějakou ztrátou jasnosti a vysoké kvality.

Jako příklad vezměte dva obrázky nížeSprávné právo je jednoznačně komprimováno, a v důsledku toho se kvalita snížila.

Nezapomeňte, že uložíte pevný disk prostor mačkání hudby v ztrátových formátech, což může mít velký význam pro iPhone s 32 GB paměti, ale podle množství objemu / kvality je to jen kompromis.

Existují různé úrovně komprese: 128 kbps, například zabírají velmi málo místa, ale bude mít také nízký kvalitu přehrávání než větší 320 kbit / s soubor, který je zase nižší než kvalita než referenční soubor s 1 411 kbps. 1.411 Kbps je kvalita audio CD úrovně, která je ve většině případů více než dost.

Celý problém není, kolik hudby je komprimováno, ale na které vybavení posloucháte.

Je bitrate opravdu záleží?


Vzhledem k tomu, paměť každý rok se stává levnější, poslouchá zvuk s vyšší bitovou rychlostí nebo vůbec bezeztrátovými formáty, začíná se stále více populárnější. Ale stojí za to, úsilí a zaneprázdněnou paměť v telefonu nebo počítači?

Nechci odpovědět na otázky tímto způsobem, ale bohužel odpověď je: Záleží na tom.

Část rovnice je zařízení, které používáte. Pokud používáte vysoce kvalitní pár sluchátek nebo reproduktorů, jste zvyklí na velkou frekvenci a dynamické rozsahy. S největší pravděpodobností si všimnete nedostatků, ke kterým dochází při komprimování hudby do souborů s nižší bitovou rychlostí. Můžete si všimnout, že v nízko kvalitních MP3 souborech neexistuje určitá úroveň detailu; Tenké pozadí mohou být obtížnější pro vnímání, horní a nízké frekvence nebudou tak dynamické, nebo můžete slyšet zkreslení v hlasivosti solisty. V těchto případech můžete potřebovat stopu s vyšší bitovou rychlostí.

Pokud však posloucháte svou hudbu pomocí pár levných sluchátek na vašem iPoduPravděpodobně si nevšimnete rozdíl mezi souborem 128 kbps a souborem 320 kbit / s, nemluvě o hudbě bez ztráty 1,411 kbps. Pamatujte si, když jsem vám ukázal více odstavec výše a poznamenal, že jste pravděpodobně museli peering do něj, abyste viděli nedostatky? Vaše sluchátka jsou jako zkrácená verze obrazu: Budou tyto nevýhody obtížné pro vnímání, protože jsou fyzicky schopni hrát hudbu podle potřeby.

Další část rovnice, samozřejmě, vaše vlastní uši. Někteří lidé mohou být velmi obtížné rozlišovat dva různé bitry pro jednoduchý důvod - poslouchají málo poslouchat hudbu. Sluchová dovednost, stejně jako každý jiný, se vyvíjí s praxí. Pokud často posloucháte spoustu své oblíbené hudby, vaše pověsti se stává přesnější a začne zachytit malé detaily a polotónů. Ale až do té doby nezáleží na tom, co bitrate používáte?

Jaký formát a bitrate si musíte vybrat pro sebe? Budete mít 320 kbps nebo potřebujete bezeztrátový formát?

Faktem je, že je obtížné slyšet rozdíl mezi souborem ztráty a MP3 souborem 320 kbps. Chcete-li slyšet rozdíl, budete potřebovat vážné vysoce kvalitní vybavení, dobré slyšení a určitý typ hudby (například klasické nebo jazz).

Pro drtivou většinu lidí, 320 kbps / s více než dost než dost naslouchat.

Co ještě zohlednit?


Hudba, zaznamenaná, může být užitečná. Soubory ve formátu bezeztrátového stavu jsou v budoucnu spolehlivější, v tom smyslu, že je můžete vždy stlačit do ztrátového formátu, když ho potřebujete, ale nemůžete udělat naopak a obnovit původní kvalitu CD ze souboru MP3. To opět jedním ze základních problémů s online hudebním obchodem: Pokud jste vytvořili obrovskou hudební knihovnu v iTunes a jeden den rozhodl, že budete potřebovat více bitrate, budete muset znovu koupit, ale pouze tentokrát ve formátu CD.

Když je to možné, vždy si koupím nebo kopírovat hudbu v bezeztrátovém formátu pro účely zálohování.

Chápu, že audiofily, je to jako jehla pod nehty. Jak jsem řekl, vše závisí na vás, vaše slyšení a vybavení, které máte.

Porovnejte dvě stopy zaznamenaná v bezeztrátových a ztrátových formátech. Vyzkoušejte několik různých audio formátů, poslouchejte jejich nějaký čas a sledujte, zda pro vás bude rozdíl nebo ne.

V nejhorším případě strávíte několik hodin na poslechu své oblíbené hudby - ne tak děsivé, že? Užij si to!

Výhody a zápory mp3 128 kbps

Komplikovaná věc je komprese zvukových dat. Nic nemůže být řečeno předem ... Nejběžnější formát pro dnešek je MPEG Layer3 s proudem 128 kbps - poskytuje kvalitu, která se na první pohled neliší od originálu. To se také nazývá frivolní - "CD-kvalita". Přesto, téměř každý ví, že mnoho lidí je brány nosu z takové "kvality CD." Co je špatně? Proč tato kvalita nestačí? Velmi obtížná otázka. Jsem soupeřem komprese 128 kbps, protože výsledek je někdy hloupý. Ale mám řadu záznamů v 128 kbps, ke kterému prakticky nemohu najít chybu. Zda je proud 128 vhodný pro kódování jednoho nebo jiného materiálu - ukazuje se, bohužel, pouze po opakovaném poslechu výsledku. Není možné říci nic předem - osobně neznají známky, které by předem umožnily určit úspěšnost výsledku. Ale často je proud 128 zcela dost pro vysoce kvalitní hudební kódování.

Pro kódování v 128 kbps je nejlepší použít produkty z Fraunhofer - mp3 producent 2.1 nebo novější. Kromě MP3ENC 3.0 - má nepříjemnou chybu, která vede k velmi špatné vysokofrekvenční kódování. Verze nad 3.0 netrpí touto nevýhodou.

Za prvé, trochu obecných slov. Vnímání zvukového snímku osobně velmi závisí na symetrickém přenosu dvou kanálů (stereo). Různé zkreslení v různých kanálech - mnohem horší než totéž. Obecně řečeno, zajišťuje co nejvíce zvukových charakteristik v obou kanálech, ale mezitím různý materiál (Jinak, jaký stereofonní) je velký problém záznamu zvuku, který je obvykle podceňován. Pokud můžeme použít 64 kbit / s pro kódování mono, pak pro kódování stereo v jednoduše dvou kanálech, nebudeme mít dostatek 64 kbps na kanál - stereo výsledek bude znít mnohem nesprávněji než každý kanál zvlášť. Ve většině produktů Fraunhofer je limit pro mono 64 kbps - a já ještě neviděl mono záznam (čistý záznam - bez hluku nebo zkreslení), který by vyžadoval větší proud. Z nějakého důvodu je naše závislost na monofonním zvuku mnohem slabší než stereo - zřejmě, on je prostě vnímán nám vážně :) - Od psychoakustického hlediska je to prostě zvuk odcházející ze sloupu, a ne Pokus o dokončení některých zvukových snímků.

Pokus o přenos stereo signálů je mnohem přísnější požadavky - nakonec jste někdy slyšeli o psychoakustickém modelu, který bere v úvahu maskování jednoho kanálu k ostatním? Některé reverzní jsou také ignorovány například účinky - například stereo efekt, který je určen pro obě kanály ihned. Samostatně vzato vlevo kanálové masky jeho vlastní část efektu - neslyšíme to. Ale přítomnost pravého kanálu je druhá část účinku - mění naše vnímání levého kanálu: podvědomě očekáváme, že slyšíte levou část účinku, a tato změna naší psychoakustiky by měla být také zvážena. Se slabým kompresí - 128 kbps na kanálu (celkem 256 kbps) tyto účinky se blíží ne, protože každý kanál je prezentován poměrně plně, aby se překrývalo potřebu přenosu symetricality, ale pro podprocesy asi 64 kbps na kanálu je velký Problém - Přenos tenkých nucení spoje Vnímání obou kanálů vyžaduje přesnější přenos, než je dnes možné v takových tokech.

Samozřejmě bylo možné provést plnohodnotný model reproduktoru pro dva kanály, ale průmysl prošel další cestou, což je obecně ekvivalentní tomu, ale mnohem jednodušší. Mnoho algoritmů s obecným názvem společného stereo - částečné řešení problémů popsaných výše. Většina algoritmů se sníží na skutečnost, že centrální kanál a rozdílový kanál je přidělen - střední / boční stereo. Centrální kanál nese hlavní zvukové informace a je pravidelný mono kanál vytvořený ze dvou zdrojových kanálů a rozdíl ve zbytku informací, které vám umožní obnovit původní stereo zvuk. Tuto operaci je zcela reverzibilní - je to jen další způsob, jak reprezentovat dva kanály, s nimiž je snazší pracovat při komprimování stereofonních informací.

Dále obvykle komprimuje komprese samostatného centrálního a diferenčního kanálu, přičemž používáte skutečnost, že rozdílový kanál v reálné hudbě je relativně špatný - oba kanály mají hodně společného. Zůstatek komprese ve prospěch centrálního a diferenčního kanálu je vybrána na cestách, ale většinou mnohem větší proud vyniká centrálnímu kanálu. Komplexní algoritmy rozhodnou, že jsme v tento moment Je výhodné - správnější prostorový obraz nebo kvalita přenosu společného pro obě informační kanály, nebo jednoduše komprese bez středního / bočního stereofonu - to znamená v režimu duálního kanálu.

Dostatečně dost, ale stereo komprese je nejslabším místem komprese výsledků v Layer3 128 kbps. Není možné kritizovat tvůrce formátu - je to stále trochu možné zlo. Tenké stereofonní informace téměř nejsou vnímány vědomě (pokud neberete pozornost zjevných věcí - hrubé uspořádání nástrojů ve vesmíru, umělých účincích atd.), Takže kvalita stereofonního je odhadnuta osoba poslední. Obvykle něco neumožňuje dostat k tomu: Počítačové sloupce, například, dělat mnohem podstatnější nevýhody, a na takové sublications, protože nesprávný přenos prostorových informací prostě nedosáhne.

Není nutné si myslet, že to, co neumožňuje slyšet tento nedostatek počítačové akustiky, je, že sloupce jsou uspořádány ve vzdálenosti 1 metr, po stranách monitoru, aniž by vytvořily dostatečné stereofonní thase. Bod není ani v tomto .. Nejprve, pokud jde o takové sloupy, muž sedí přímo před nimi - a vytváří stejný účinek jako sloupy v rozích místnosti a ještě více: na normální akustiku a dobrý objem, který téměř nemůžete nikdy zvýraznit přesné prostorové umístění zvuků (není to o zvukovém obrázku, který naopak počítačové reproduktory nebudou nikdy postaveny, ale o přímém, vědomém, vnímání rozdílů mezi kanály). Počítačové sloupce (standardní použití) nebo sluchátka poskytují mnohem jasnější přímé vnímání stereu než běžné hudební akustiky.

Spolehlivé říkat - pro přímé, informativní zvukové vnímání nejsme příliš nezbytné přesné stereofonní informace. Přímo detekovat rozdíl v tomto aspektu mezi originálem a vrstvou3 128 kbps poměrně obtížným, i když je to možné. Potřebují mnoho zkušeností nebo posílení účinků zájmu. Nejjednodušší věc, kterou lze udělat, je prakticky šířit kanály dál, než je možné fyzicky. To je obvykle tento efekt, který se zapne v levném počítačový technik 3D tlačítko zvuku. Nebo v boom boxech, jejichž sloupce nejsou odděleny od tělesa zařízení a jsou příliš slabé pro přenos krásné stereo přirozený způsob. Existuje přechod prostorových informací do specifických zvukových informací obou kanálů - rozdíl mezi kanály se zvyšuje.

Použil jsem silnější účinek, než je obvykle přijat, aby lépe slyšel rozdíl. Podívejte se, jak to by mělo zvuk - po kódování v 256 kbps s dvojitým kanálem (256_Channels_wide.mp3, 172 kB) a jak to zní po kódování v 128 kbps s společným stereofonním (128_Channels_wide.mp3, 172 kB).

Ústraní. Oba tyto soubory jsou mp3 z 256 kbps, kódované pomocí mp3 producent 2.1. Nezaměňujte se: i, první, test mp3 a za druhé - zveřejním výsledky mp3 testování mp3;). Všechno to bylo takto: Zpočátku jsem kódoval průchod hudby v 128 a 256. Pak jsme rozdělili tyto soubory, aplikované zpracování (stereo expander), mačkané v 256 - pouze pro úsporu místa - a vyloženo zde.

Mimochodem, pouze na 256 kbps v mp3 producentu 2.1 vypne společný stereofonní a otočí se na dvojité kanály - dva nezávislé kanály. Dokonce i 192 kbps v producentu 2.1 je nějaký druh společného stereo, protože mé příklady byly velmi nesprávně stlačeny v méně než 256 kbps. To je hlavní důvod, že "plná" kvalita začíná 256 kbps - historicky vyvinutá, že jakýkoliv menší proud ve standardních komerčních produktech z Fraunhoferu (do 98 let) je společný stereofonní stereofonní, což je v každém případě nepřijatelné pro plně správný přenos. Ostatní (nebo pozdě) produkty, v zásadě umožňují libovolně zvolit - společný stereofonní nebo dvojitý kanál - pro všechny vlákno.

O výsledcích

V originálu (který tento případ Je to právě 256 kbps) jsme slyšeli zvuk se zesíleným rozdílovým kanálem a oslabeným centrálem. Velmi dobře, reverb hlasu byl slyšel, jako obecně, všechny druhy umělého reverbu a echo - tyto prostorové účinky jsou převážně v diferenčním kanálu. Mluvit konkrétně, v tomto případě bylo 33% centrálního kanálu a 300% rozdíl. Absolutní účinek je 0% centrálního kanálu - zapne se na typu zařízení hudební centra "Karaoke vokální fader", "Zrušení hlasu / Odstranit" nebo podobný význam je odstranit hlas z fonogramu. Význam operace je, že hlas se obvykle zaznamenává pouze na centrálním kanálu - stejnou přítomnost v levém a pravém kanálu. Odstranění centrálního kanálu, odstraníme hlas (a mnohem více, takže tato funkce reálný život Docela zbytečné). Pokud máte takovou věc - můžete poslouchat svůj MP3 s ním - je získán legrační společný stereofonní detektor.

Na tomto příkladu již můžete nepřímo pochopit, že jsme ztratili. Za prvé, to bylo znatelně horší než všechny prostorové efekty - právě ztratili. Ale ve druhém - Boufgon je výsledkem přechodu prostorových informací do zvuku. Co to odpovídalo v prostoru - ano, jen po celou dobu téměř náhodně pohybující se zvukové komponenty, určitý "prostorový hluk", který nebyl v originálním fonogramu (může vydržet alespoň přechod prostorových informací do sukně bez vzhledu cizího účinky). Je známo, že tento typ zkreslení při kódování v nízkých tokech se často objevuje a přímo bez jakéhokoliv další procedury. Jen okamžité zkreslení zvuku (což je téměř vždy ne) vnímáno vědomě a okamžitě a stereo (které se společným stereofonním velké množství) - Pouze podvědomě a v procesu naslouchání po určitou dobu.

To je hlavní důvod, který nedává zvuk Layer3 128 kbps být považován za kompletní kvalitu CD. Skutečnost je, že sama o sobě transformace stereofonního zvuku v mono dává silné negativní účinky - často se stejný zvuk opakuje v různých kanálech s malým zpožděním, které při míchání, to dává jen rozmazaný zvuk v čase. Mono zvuk vyrobený ze stereofonního zvuku zní mnohem horší než původní mono záznam. Rozdílový kanál, kromě centrálního (smíšeného mono kanálu), dává úplnou reverzní separaci vpravo a vlevo, ale dílčí absence diferenčního kanálu (nedostatečné kódování) přináší nejen nedostatečný prostorový obraz, ale také tyto nepříjemné účinky míchání stereofonního zvuku v jednom mono kanálu.

Když jsou všechny ostatní překážky odstraněny - zařízení je dobré, tonální barva a dynamika se nezměněna (proud je dostačující pro kódování centrálního kanálu) - bude stále zůstat. Existují však fonogramy zaznamenané takovým způsobem, že negativní účinky komprese na základě středního / bočního stereofonu nejsou projeveny - a poté 128 kbit / s dává stejné plné kvalitě jako 256 kbps. Soukromý případ - fonogram může být bohatý ve smyslu stereofonních informací, ale špatné zvukové informace - například pomalá hra na klavír. V tomto případě pro kódování rozdílového kanálu je proud zcela dostatečný pro vysílání přesných prostorových informací. Existuje více obtížnějších případů - aktivní uspořádání, plněné různými nástroji, nicméně zvuky 128 kbps velmi dobré - ale to je zřídka nalezeno, může v jednom případě z pěti až deseti. Nicméně, to je nalezeno.

Vlastně zvuk. Je těžké zdůraznit přímý zvuk zvuku centrálního kanálu v Layer3 128 kbps. Nedostatek frekvenčního přenosu je vyšší než 16 kHz (mimochodem je velmi vzácný, ale stále vysílaný) a určitý pokles amplitudy je velmi vysoký - přísně řečeno samo o sobě - \u200b\u200bjen nesmysl. Osoba za pár minut zcela zcela zvyklý na takové tonální zkreslení, to prostě nemůže být považováno za silné negativní faktory. Ano, je to zkreslení, ale pro vnímání "plné kvality" - daleko zpět. Na straně centrálního, přímo zvuku, je kanál možný jiným druhem - prudké omezení dostupného proudu pro kódování tohoto kanálu, způsobené jednoduše bytostmi - velmi hojné prostorové informace naložené s různými zvuky, časté neefektivní krátké Bloky a v důsledku toho všeho - plně spotřebovaného toku rezervního vyrovnávací paměti. To se děje, ale poměrně vzácné, a že - pokud taková skutečnost probíhá, je obvykle patrné na velkých fragmentech nepřetržitě.

Zobrazit vady tohoto druhu v explicitním formuláři, aby si všimli, že každá osoba je velmi obtížná. Snadno si všimnou i bez manipulace s osobou, která se používá k řešení zvuku, ale pro obyčejný nekritický posluchač se může zdát naprosto nerozeznatelné od původního zvuku a některé abstraktní kopání v tom, co není opravdu .. a stále se podíváme na příklad. Bylo nutné aplikovat silné zpracování na její alokaci - významně snížit obsah středních a vysokých frekvencí po dekódování. Odstraním rušení slyšet tyto frekvenční nuance. Samozřejmě, porušujeme práci modelu kódování, ale pomůže mu lépe pochopit, co ztrácíme. Takže - jako by měl zvuk (256_bass.mp3, 172 kB) a co se stane po dekódování a zpracování proudu 128 kbps (128_bass.mp3, 172 kB). Věnujte pozornost zneuřejné ztrátě kontinuity, hladkost zvuku basů, stejně jako některé jiné anomálie. Převod nízké frekvence V tomto případě daroval ve prospěch vyšších frekvencí a prostorových informací.

Je třeba poznamenat, že práce akustického modelu komprese lze pozorovat (s pozorným učením a mít nějaké zkušenosti se zvukem) a 256 kbps, pokud použijete více či méně silný ekvalizér. Pokud to uděláte a pak posloucháte, bude to někdy možné (poměrně často) všimnout si nepříjemné efekty (vyzvánění / bullhead). Ještě důležitější je, že zvuk po takovém postupu bude mít nepříjemný, nerovný charakter, který je velmi obtížně všimnout okamžitě, ale bude znatelně s dlouhým poslechem. Rozdíl mezi 128 a 256 je pouze to v proudu 128 kbps, tyto účinky často existují bez jakýchkoliv zpracování. Jsou také obtížné si všimnout okamžitě, ale jsou - příklad s basem dává nějakou představu o tom, kde je hledat. Slyšet to ve vysokých nitích (nad 256 kbps) bez zpracování je prostě nemožné. Tento problém se netýká s vysokým tokem, ale tam je něco, co někdy (velmi zřídka) neumožňuje ani vrstva3 - 256 kbit / s originálem - jedná se o dočasné parametry (více podrobností bude v samostatném článku později: viz MPEG Layer3 - 256 / Odkaz na jiný článek /).

Tam jsou fonogramy, které se netýkají tohoto problému. Nejjednodušší způsob je uvést faktory, které naopak vést k vzniku zkreslení popsaného výše. Pokud žádný z nich není dokončen - je tu velká šance plně úspěšná, v tomto aspektu kódování v Layer3 - 128 kbps. To vše záleží od specifického materiálu ...

Za prvé, hluk, pojďme říkat hardware. Pokud je fonogram hmatatelný hluk - je velmi nežádoucí, aby kódoval do malých proudů, protože příliš mnoho průtoku jde na kódování zbytečných informací, což také není příliš rozumné být přiměřené kódování s pomocí akustického modelu.

  • Jen hluk - všechny druhy endided Sounds.. Monotónní hluk města, ulice, restaurace atd., Protože probíhá hlavní akce. Tento typ zvuků poskytuje velmi hojný tok informací, které by měly být kódovány, a algoritmus bude nucen obětovat něco v hlavním materiálu.
  • Nepřirozené silné stereo efekty. To spíše patří k předchozí položce, ale v každém případě - příliš mnoho průtoku jde do diferenčního kanálu a kódování centrálního kanálu se silně zhoršuje.
  • Silné fázové zkreslení, různé pro různé kanály. V zásadě se to týká spíše do nedostatků kódujících algoritmů běžných v této době než na standard, ale stále. Nejdivočejší zkreslení začínají z důvodu úplného členění celého procesu. Pro takové zkreslení počátečního fonogramu ve většině případů, záznamy o kazetových zařízení a následné digitalizaci, zejména při hraní levných rekordérů pásků s nekvalitními reverzemi. Hlavy jsou zkroucené, stuha větrná šikmá a kanály jsou mírně zadrženy jeden vzhledem k druhému.
  • Příliš přetížený záznam. Docela hrubě mluví - velký symfonický orchestr hraje všude :). Obvykle, v důsledku komprese v 128 kbps, něco zcela povrchní - komory, měď, bubny, sólisty. Nachází se samozřejmě nejen v klasice.

Další pól je to, co je obvykle komprimováno:

  • Sólový nástroj s relativně jednoduchý zvuk - kytara, klavír. Například housle má příliš naplněný spektrum a zvuky obvykle není příliš dobré. Z housle houslista skutečně závisí na samotné práci. Je také poměrně dobře komprimován několika nástroji - BARDS nebo SSP, například (nástroj + hlas).
  • Kvalita moderní hudba. To neznamená, že hudební kvalita, ale kvalita zvuku je snížení, umístění nástrojů, kategorická absence komplexních globálních efektů, které zdobí zvuky a je obecně nadbytečná. V této kategorii, například celý moderní pop, také nějaká skála, a obecně existuje spousta věcí.
  • Agresivní, "elektřina" hudba. No, aby se nějakým způsobem uvedl příklad - časná metallica (a moderní obecně). [Pamatujte si, ne o hudebních stylech! Jen příklad.]

Stojí za zmínku, že komprese vrstvy3 téměř nezapůsobí na parametry, jako je přítomnost / absence vysokých frekvencí, basů, neslyšících / zvonění atd. Existuje závislost, ale tak slabá, že ji nemůžete vzít v úvahu.

Bohužel (nebo naštěstí?), Spočívá na samotném člověku. Mnoho lidí bez přípravy a předběžného výběru slyší rozdíl mezi toky asi 128 kbps a originál, mnoho i syntetických extrémních příkladů nejsou vnímány slyšením jako rozlišení. Nejprve nemusíte nic přesvědčit, druhé příklady a nepřesvědčit ... Člověk by jednoduše mohl říci, že někdo má rozdíl, a někdo nemá, kdyby to nebylo pro jednu věc: v procesu poslechu hudby V průběhu času je naše vnímání po celou dobu zlepšování. Zdát se dobrá kvalita Včera, zítra se už nemůže zdát jeden - to se vždy stane. A pokud je to spíše zbytečné (alespoň podle mého názoru), aby komprimoval v 320 kbps ve srovnání s 256 kbps - výhry nejsou příliš důležité, i když je jasné, pak udržet hudbu nejméně 256 kbps.

V tomto článku objasníme koně kódování ADUO, které ovlivňují kvalitu jeho zvuku. Pochopení nastavení konverze vám pomůže zvolit nejvhodnější volbu zvukové kódování z hlediska velikosti souboru vztahu ke kvalitě zvuku.

Co je bitrate?

Bitrate je množství dat na jednotku času používaného pro přenos zvukového proudu. Například bitová rychlost 128 kbps je dešifrována jako 128 kilobit za sekundu a znamená, že 128 tisíc bitů se používá k zakódování jedné sekundy zvuku (1 bajt \u003d 8 bitů). Pokud tuto hodnotu přeložíte v kilobajtech, pak se ukáže, že jeden druhý zvuk trvá přibližně 16 kb.

Čím vyšší je cesta dráhy, tím více místa vás vezme na váš výpočet. Ale současně v rámci jediného formátu umožňuje větší bitová rychlost nahrávat zvuk s vyšší kvalitou. Například, pokud konverzujete audio CD do MP3, pak s batažem 256 kb / s, bude zvuk výrazně lepší než s batažem 64 kbps.

Protože nyní se místo na disku stává poměrně levné, doporučujeme převést na MP3 s bitovou rychlostí nižší než 192 kbps.

Také rozlišovat konstantní a variabilní titulu.

Rozdíl mezi konstantním bitátem (CBR) z AC (VBR)

S konstantním bitanem pro kódování všech částí zvuku se používá stejné množství bitů. Zvuková struktura je však obvykle odlišná a například pro kódování ticha, je nutné výrazně méně bitů než kódovat nasycený zvuk. Variabilní bitrate, na rozdíl od konstanty, automaticky upraví kvalitu kódování v závislosti na složitosti zvuku v určitých intervalech. To znamená, že nižší bitová rychlost bude použita pro úseky jednoduchých kódování a pro komplex bude použita vyšší hodnota. Použití proměnné bitry umožňuje dosáhnout vyšší kvality zvuku s menší velikostí souboru.

Jaká je frekvence vzorkování?

Tento koncept nastane při převodu analogový signál V digitálním a indikuje počet vzorků (měření měření měření) za sekundu, které se provádí pro převod signálu.

Jaký je počet kanálů?

Kanál, administrativně k kódování zvuku je nezávislý zvukový proud. Mono - jeden proud, stereo - dva proudy. N.M je často používán odkazovat na počet kanálů, kde n je počet plnohodnotných zvukových kanálů a m je počet nízkofrekvenčních kanálů (například 5.1).

Přemýšleli jste někdy, co přesně je ztraceno, když je komprimován od bezeztrátového v MP3 128 kbps nebo 320 kbps?
Zkontroloval jsem a výsledek se zdál zajímavý. Nejprve navrhuji průzkum, abychom pochopili, zda je rozdíl obecně. Pokud si nejste jisti, že slyšíte nebo zda neslyšíte, navrhuji jednoduchý a elegantní nápad navštívit vaši pozornost: z nichž jeden bude v antifázu, v souvislosti s informacemi obou tratí, bude s výhodou slyšel, že nebyl vykoupen. Zajímavé grafy ještě slibují, ale můžete slyšet sami v našem systému, jaký druh zvuku jsou ztraceny, když je stlačován z FLAC v MP3 128 320 kbps, archiv s příklady na konci článku.
Rozhovor
Musíte stáhnout a poslouchat 12 stop po dobu 30 sekund. Poté určete pro každou ze 4 skladeb jeden ze 3 možností (128 kb / s, 320 kbps nebo bezeztrátový).
Průzkum je anonymní, ale můžete určit jedinečný hash a říct mi to, jako poslední možnost, zveřejnit svůj názor zde, ale nutně pod spoilerem. Průzkum bude trvat až do 25.02, po klíčovém a statistikách.
Soubory na disku YanDEX, zrcadlo na Dropbox (~ 80MB).
Počáteční data
Černé klíče - věčné světlo (FLAC, 44100 Hz, 24-bit, 1613 kbps), můžete číst Youtube..
Ludovico Einaudi - Drop (Flac, 96000 Hz, 24-bit, 2354 kbps), můžete číst hudbu Yandex.
CC Coletti - Rock and Roll (Flac, 192000 Hz, 24-bit, 4845 kbps), můžete si přečíst Youtube..
Annihilator - Ultra-Motion (Flac, 44100 Hz, 16-bit, 1022 kbps), můžete přečíst dál Youtube..
Konverzní parametry v mp3
44.1KHz, stereo, 128 kbps nebo 320 kbps
Popis experimentu
Zdrojové soubory jsou vyříznuty na kousky 10 sekund, každá z kusů je exportována do WAV. Po importu získaných stop na začátek každého, se přidá 2 sekundy ticha a druhý tónový signál, pak převedeno na MP3. Po importu souborů MP3 se ukáže, že relativní k originálu, výsledný soubor "pokračoval". To není chyba, to je. Provádíme synchronizaci s ohledem na specifikovaný tónový signál z originálu (pokusil jsem se o každý soubor MP3 několik hodnot, které následně vyjasněno k nejlepšímu výsledku), zbavte se tónového signálu, ticha a získané obchody jsou exportovány do WAV. Nyní zůstane invertovat stopy, aby se získala vícedirovorální vrcholy a snížit originál.
Výsledek
Nebudu otevřít Amerika ... Ano, je to rozdíl. Ano, zvláště když komprimován na 128kbps. Ano, závisí na hudbě. Ano, ještě více z audio kódu.
Udělejte nezávislý výstup a slyšte rozdíl, můžete soubory stáhnout