Citiți mai multe despre setările de conversie a sunetului. Ce sunt bitrate? Cum afectează calitatea muzicii și a videoclipurilor? Ce este mai bun de 128 sau 320 kbps

Ați întrebat vreodată ce anume se pierde atunci când este comprimat de la Lossless în MP3 128 kbps sau 320 kbps?
Am verificat și rezultatul părea interesant. În primul rând, propun un sondaj pentru a înțelege pentru tine să audă dacă diferența este în general. Dacă nu sunteți sigur că auziți sau sunteți încrezători că nu auziți, voi propune o idee simplă și elegantă în atenția dvs.: trebuie să luați două frunte două unde sonore Unul dintre care se va afla în antifaza, respectiv, în informațiile celor două piese, va fi audibil în mod avantajos ceea ce nu este răscumpărat. Diagramele interesante nu promite încă, dar vă puteți auzi în sistemul nostru ce fel de sunete sunt pierdute atunci când sunt comprimate de la Flac în mp3 128 \\ 320 kbps, o arhivă cu exemple la sfârșitul articolului.
Interviu
Trebuie să descărcați și să ascultați 12 melodii timp de 30 de secunde. Apoi, pentru a specifica pentru fiecare dintre cele 4 compoziții una din cele 3 opțiuni (128 kbps, 320 kbps sau fără pierderi).
Sondajul este anonim, dar puteți specifica un hash unic și să-mi spuneți, ca o ultimă soluție, publicați părerea dvs. aici, dar neapărat sub spoiler. Sondajul va dura până la 25.02, după cheia și statisticile.
Fișiere pe discul Yandex, oglindă pe Dropbox (~ 80MB).
Datele inițiale.
Tastele negre - Lumina veșnică (FLAC, 44100 Hz, 24 de biți, 1613 kbps), puteți citi YouTube..
Ludovico Einaudi - Drop (FLAC, 96000 Hz, 24 de biți, 2354 kbps), puteți citi muzica Yandex.
CC Coletti - Rock and Roll (Flac, 192000 Hz, 24 de biți, 4845 kbps), puteți citi YouTube..
Annihilator - Ultra-Motion (Flac, 44100 Hz, 16 biți, 1022 kbps), puteți citi YouTube..
Parametrii de conversie în MP3
44.1KHz, stereo, 128 kbps sau 320 kbps
Descrierea experimentului
Fișierele sursă sunt tăiate în bucăți de 10 secunde, fiecare dintre piesele este exportată la WAV. După importul pieselor obținute la începutul fiecăruia, se adaugă 2 secunde de tăcere și un al doilea semnal de ton, apoi se convertesc la MP3. După importul fișierelor MP3, se pare că în raport cu originalul, fișierul rezultat "a mers înainte". Acesta nu este un bug, este. Realizăm sincronizarea cu privire la semnalul de ton specificat de la original (am încercat pentru fiecare fișier MP3 mai multe valori, care clarificate ulterior la cel mai bun rezultat), scapă de semnalul de ton, tăcerea și meserii obținute sunt exportate în WAV. Acum rămâne să inverseze piesele pentru a obține vârfuri multidirecționale și pentru a reduce originalul.
Rezultat
Nu voi deschide America ... Da, există o diferență. Da, mai ales când este comprimat la 128 kbps. Da, depinde de muzică. Da, chiar mai mult din codul audio.
Faceți o ieșire independentă și auziți diferența pe care o puteți descărca fișierele

În zilele noastre, există o mulțime de conversații pe care am pierdut muzica reală cu sosirea formatelor audio comprimate, cum ar fi MP3, AAC și similare. Este adevarat? Formatele fără pierderi salvează? Poate un ascultător nepregătit pentru a distinge muzica în formate MP3 de la Flac? Să ne dăm seama în această chestiune.

Ceea ce este bitrate (bitrate)?

Probabil ați auzit deja termenul "bitrate" înainte și probabil că aveți o idee generală despre ceea ce înseamnă, dar poate că nu este rău să vă familiarizați cu definiția ei oficială, astfel încât să știți cum funcționează totul.

Bitrate - acesta este numărul de biți sau cantitatea de date care sunt procesate în timpul o anumită perioadă timp. În audio, acest lucru înseamnă de obicei kilobit pe secundă. De exemplu, muzica pe care o cumpărați în iTunes este de 256 kilobit pe secundă, adică fiecare a doua melodie conține 256 kilobyte de date.

Cu cât este mai mare rata de biți a calea, cu atât mai mult spațiu va dura computerul. De regulă, CD-ul audio are un spațiu destul de mult, deci a devenit o practică normală de a comprima aceste fișiere astfel încât să puteți înregistra mai multă muzică la dvs. hDD. (sau iPod, Dropbox sau altceva). Aici se află formatele "fără pierderi" și "cu pierderi".

Formatele pierdute și pierderi: Care este diferența?


Când spunem "fără pierderi", înțelegem că într-adevăr nu am schimbat fișierul sursă. Adică am copiat pista de pe CD pe hard disk, dar nu am strâns într-o asemenea măsură încât am pierdut datele. Acest lucru este, în esență, la fel ca și pista originală CD.

Cu toate acestea, cel mai adesea vă copiați probabil muzica în format pierdută. Adică, ați luat un CD, ați copiat-o pe hard disk și ați strâns piesele astfel încât să nu ocupe o mulțime de spațiu. Un album tipic durează probabil 100 MB sau cam asa ceva. Același album într-un format de pierdere, cum ar fi (cunoscut și sub numele de Apple Lossless), va dura aproximativ 300 MB, deci a devenit o practică obișnuită de a folosi formatele de pierdere pentru mai mult descarcare rapida și economii mai mari de hard disk.

Problema este că atunci când strângeți un fișier pentru a economisi spațiu, ștergeți bucăți de date. La fel ca atunci când luați o imagine de înaltă calitate și comprimați-o în JPEG, calculatorul dvs. ia datele sursă și "înșelătoare" anumite părți ale imaginii, făcându-l în mare parte la fel, dar cu o pierdere de claritate și de înaltă calitate.

De exemplu, luați două imagini de mai jos: Dreptul potrivit este clar comprimat și, ca rezultat, calitatea a scăzut.

Amintiți-vă că salvați un spațiu pe hard disk stoarce muzică în formate pierdute, care poate fi de mare importanță pentru iPhone cu memorie de 32 GB, dar în funcție de cantitatea de volum / calitate este doar un compromis.

Există diferite niveluri de compresie: 128 kbps, de exemplu, ocupă un spațiu foarte mic, dar va avea, de asemenea, o calitate redusă de redare decât un fișier mai mare de 320 kbit / s, care, la rândul său, este mai mic decât calitatea decât fișierul de referință cu 1.411 kbps. 1.411 Kbps este calitatea nivelului de CD audio, care, în majoritatea cazurilor, este mai mult decât suficient.

Întreaga problemă nu este cât de multă muzică este comprimată, dar pe ce echipament îl ascultați.

Bitratul este foarte important?


Deoarece memoria în fiecare an devine mai ieftină, ascultarea sunetului cu o rată de biți mai mare sau deloc în formatele fără pierderi, începe să devină din ce în ce mai populară. Dar merită, efort și memorie ocupată în telefonul sau computerul dvs.?

Nu-mi place să răspund la întrebări în acest fel, dar, din păcate, răspunsul este: depinde.

O parte din ecuație este echipamentul pe care îl utilizați. Dacă utilizați o pereche de căști de înaltă calitate sau difuzoare, sunteți obișnuiți cu o frecvență mare și intervale dinamice. Astfel, veți observa cel mai probabil deficiențele care apar atunci când se comprimă muzică în fișiere cu o rată de biți mai mică. Puteți observa că în fișiere MP3 de calitate scăzută nu există un anumit nivel de detaliu; Piesele subțiri de fundal pot fi mai dificile pentru percepție, frecvențele superioare și joase nu vor fi atât de dinamice sau puteți auzi distorsiuni în vocalul solist. În aceste cazuri, este posibil să aveți nevoie de o pistă cu o rată de biți mai mare.

Cu toate acestea, dacă ascultați muzica dvs. utilizând o pereche de căști ieftine pe iPod-ul dvs.Probabil că nu veți observa diferența dintre fișierul de 128 kbps și fișierul 320 kbit / s, fără a menționa muzica fără pierderi de 1.411 kbps. Amintiți-vă când v-am arătat un alt paragraf de mai sus și am observat că probabil că ați trebuit să vă uitați să vedeți deficiențele? Căștile dvs. sunt ca o versiune trunchiată a imaginii: vor face ca aceste dezavantaje să fie dificil de percepție, deoarece sunt fizic capabili să joace muzică după cum este necesar.

O altă parte a ecuației, desigur, propriile dvs. urechi. Unii oameni pot fi foarte greu să distingă două biți diferite pentru un motiv simplu - ascultă puțin muzică ascultă. Abilitatea auzului, ca oricare alta, se dezvoltă cu practica. Dacă ascultați adesea o mulțime de muzică preferată, zvonul dvs. devine mai precis și începe să surprindă detalii mici și jumătate. Dar până atunci nu contează ce biți folosiți?

Deci, ce format și bitrate trebuie să alegeți pentru dvs.? Veți avea 320 kbps sau aveți nevoie de un format fără pierderi?

Faptul este că este dificil să auziți diferența dintre fișierul de pierdere și fișierul MP3 320 Kbps. Pentru a auzi diferența, veți avea nevoie de un echipament serios de înaltă calitate, auz bun și un anumit tip de muzică (de exemplu, clasic sau jazz).

Pentru majoritatea covârșitoare a oamenilor, 320 kbps / cu mai mult decât suficient pentru a asculta.

Ce altceva să ia în considerare?


Muzica, înregistrată, poate fi utilă. Fișierele din format fără pierderi sunt mai fiabile în viitor, în sensul că le puteți strânge mereu la formatul Lossy când aveți nevoie, dar nu puteți face contrariul și restabiliți calitatea originală a CD din fișierul MP3. Acest lucru, din nou, una dintre problemele fundamentale cu magazinele de muzică online: Dacă ați creat o bibliotecă de muzică imensă în iTunes și o zi a decis că aveți nevoie de mai mult biți, va trebui să o cumpărați din nou, dar numai acest timp în format CD.

Când este posibil, am cumpărat întotdeauna sau copie muzică în format fără pierderi pentru scopuri de backup.

Înțeleg că audiofilele, este ca un ac sub unghii. Așa cum am spus, totul depinde de tine, auzul și echipamentul pe care îl aveți.

Comparați două piste înregistrate în formatele pierdute și pierdute. Încercați mai multe formate audio diferite, ascultați-le puțin timp și urmăriți dacă va exista o diferență pentru dvs. sau nu.

În cel mai rău caz, petreceți câteva ore pe ascultarea muzicii dvs. preferate - nu atât de înfricoșătoare, nu? Bucură de ea!

Pro și CON MP3 128 Kbps

Comprimarea datelor audio este un lucru complicat. Nimic nu poate fi spus în avans ... Cel mai comun format pentru ziua de azi este MPEG Layer3 cu un flux de 128 kbps - oferă o calitate care la prima vedere nu este diferită de original. Se numește, de asemenea, frivol - "CD-calitate". Cu toate acestea, aproape toată lumea știe că mulți oameni sunt poarta nasul de la o astfel de calitate CD ". Ce s-a întâmplat? De ce această calitate nu este suficientă? Întrebare foarte dificilă. Sunt un adversar de compresie de 128 kbps, deoarece rezultatul este uneori prost. Dar am o serie de înregistrări în 128 kbps, la care practic nu pot găsi vina. Indiferent dacă fluxul 128 este potrivit pentru codificarea unuia sau a unui alt material - se dovedește, din păcate, numai după ce a ascultat în mod repetat rezultatul. Nu este posibil să spunem nimic în avans - personal nu cunoaște semnele care ar permite în avans să determine succesul rezultatului. Dar adesea fluxul 128 este suficient de complet pentru codarea muzicii de înaltă calitate.

Pentru codificarea în 128 kbps, este mai bine să utilizați produse de la Fraunhofer - MP3 producător 2.1 sau mai târziu. În plus față de MP3enc 3.0 - are o eroare enervantă care duce la codificarea frecvenței foarte slabe. Versiunile de peste 3.0 nu suferă de acest dezavantaj.

În primul rând, un pic de cuvinte generale. Percepția imaginii sonore de către o persoană depinde foarte mult de transmisia simetrică a două canale (stereo). Diferite distorsiuni în diferite canale - mult mai rău decât la fel. În general, asigurând cât mai mult posibil caracteristicile sonore în ambele canale, dar între timp material diferit (Altfel, ceea ce un stereo) este o problemă mare de înregistrare a sunetului, care este de obicei subestimată. Dacă putem folosi 64 kbit / s pentru a codifica Mono, apoi pentru codarea stereoului în doar două canale, nu vom avea suficiente 64 kbps pe canal - rezultatul stereo va suna mult mai incorect decât fiecare canal separat. În majoritatea produselor Fraunhofer, limita pentru mono este de 64 kbps - și nu am văzut încă o înregistrare mono (înregistrare curată - fără zgomot sau distorsiune), ceea ce ar necesita un flux mai mare. Din anumite motive, dependența noastră de sunet monofonic este mult mai slabă decât să se pare că este pur și simplu percepută de noi serios :) - Din punct de vedere psihoacustic, este pur și simplu o ieșire de ieșire din coloană și nu încercați să completați unele imagini solide.

O încercare de a transmite semnale stereo face cerințe mult mai stricte - În cele din urmă ați auzit vreodată despre un model psihoacustic care ia în considerare mascarea unui canal altora? Unele inverse sunt, de asemenea, ignorate, de exemplu, efectele - de exemplu, un efect stereo proiectat imediat pentru ambele canale. Canalul stâng luat separat maschează propria parte a efectului - nu o vom auzi. Dar prezența canalului drept este a doua parte a efectului - se schimbă percepția canalului stâng: ne așteptăm subconștient să auzim partea stângă a efectului, iar această schimbare a psihoacusticii noastre ar trebui, de asemenea, luată în considerare. Cu o compresie slabă - 128 kbps pe un canal (total de 256 kbps), aceste efecte se apropie de faptul că fiecare canal este prezentat destul de complet pentru a suprapune nevoia de simetralitate de transmisie, dar pentru firele de aproximativ 64 kbps pe canal este un mare Problema - Transferul nuanțelor subțiri ale articulației Percepția ambelor canale necesită o transmisie mai precisă decât cea astăzi este posibilă în astfel de fluxuri.

Desigur, a fost posibil să se facă un model de difuzor cu drepturi depline pentru două canale, dar industria a trecut printr-o altă cale, ceea ce este, în general, echivalentă cu acest lucru, dar mult mai ușor. Mulți algoritmi cu numele general al soluției stereo-parțiale comune a problemelor descrise mai sus. Majoritatea algoritmilor sunt redusi la faptul că canalul central și canalul de diferență sunt alocate - stereo mijlocie / laterală. Canalul central poartă informațiile audio principale și este un canal mono regulat format din două canale sursă și diferența în restul informațiilor care vă permite să restaurați sunetul stereo original. Prin ea însăși, această operațiune este complet reversibilă - este doar o altă modalitate de a reprezenta două canale, cu care este mai ușor să lucrați la comprimarea informațiilor stereo.

În plus, comprimă, de obicei, comprimarea unui canal central și diferență separat, folosind faptul că diferența canal în muzica reală este relativ slabă - ambele canale au o mulțime în comun. Soldul compresiei în favoarea canalului central și de diferență este ales în mișcare, dar mai ales un flux mult mai mare se remarcă la canalul central. Algoritmi complexi decid că suntem în acest moment Este de preferat - o imagine spațială mai corectă sau calitatea transmiterii comune la ambele canale de informații sau pur și simplu comprimarea fără stereo medie / laterală - adică în modul canal dual.

Destul de ciudat, însă compresia stereo este cel mai slab loc de compresie rezultă în Layer3 128 Kbps. Este imposibil să criticați creatorii formatului - este încă un mic rău posibil. Informațiile stereo subțiri nu sunt aproape nu sunt percepute în mod conștient (dacă nu luați în atenția lucrurilor evidente - aspectul grosier al instrumentelor în spațiu, efecte artificiale etc.), astfel încât calitatea stereo este estimată de o persoană ultima. De obicei, ceva întotdeauna nu permite să ajungă la acest lucru: Coloanele de calculator, de exemplu, face dezavantaje mult mai substanțiale și la astfel de sublicări, deoarece transmiterea greșită a informațiilor spațiale nu ajunge pur și simplu.

Nu este necesar să credem că ceea ce nu permite să auziți această lipsă de acustică pe calculator este că coloanele sunt aranjate la o distanță de 1 metru, pe părțile laterale ale monitorului, fără a crea o stereo suficientă. Punctul nu este nici măcar în acest lucru .. În primul rând, dacă vine vorba de astfel de coloane, omul stă chiar în fața lor - și creează același efect ca și coloanele din colțurile camerei și chiar mai mult: pe acustic normal iar volumul bun pe care aproape nu-l puteți evidenția niciodată locația spațială exactă a sunetelor (nu este vorba despre imaginea sonoră, care, dimpotrivă, difuzoarele de calculator nu vor fi niciodată construite, ci despre percepția directă, conștientă, a diferențelor dintre canale). Coloanele de calculator (utilizarea standard) sau căștile oferă o percepție directă cu mult mai clară asupra acusticii muzicale obișnuite decât acustica obișnuită.

Fiabil pentru a spune - Pentru percepția acustică directă, informativă, nu suntem informații exacte exacte. Detectați direct diferența dintre acest aspect între original și stratul3 128 kbps destul de dificil, deși este posibil. Au nevoie de o mulțime de experiență sau să consolideze efectele interesului. Cel mai simplu lucru care se poate face este să difuzeze practic canalele mai departe decât este posibil fizic. De obicei, acest efect se aprinde în ieftine tehnician de calculator Butonul 3D sunet. Sau în cutii de boom ale căror coloane nu sunt separate de corpul dispozitivului și sunt prea slabe pentru transmiterea unui stereo frumos calea naturală. Există o tranziție a informațiilor spațiale în informații audio specifice ale ambelor canale - diferența dintre canale crește.

Am aplicat un efect mai puternic decât este de obicei acceptat să audă mai bine diferența. Uită-te la modul în care ar trebui să sune - după codificarea în 256 kbps cu un canal dublu (256_Channels_wide.mp3, 172 kb) și cum sună după codificarea în 128 kbps cu stereo articulată (128_Channels_wide.mp3, 172 Kb).

Retragere. Ambele fișiere sunt MP3 de la 256 kbps, codificate utilizând producătorul MP3 2.1. Nu confunda: i, mai întâi, test mp3, și în al doilea rând - postez rezultatele testului MP3 MP3;). Era altceva așa: la început am codificat trecerea muzicii în 128 și 256. Apoi am împărțit aceste fișiere, procesarea aplicată (expandanța stereo), stoarse în 256 - numai pentru salvarea spațiului - și stabilit aici.

Apropo, numai la 256 kbps în producătorul MP3 2.1 dezactivează stereo-ul comun și pornește canale duale - două canale independente. Chiar și 192 kbps la producător 2.1 este un fel de stereo comun, deoarece exemplele mele au fost comprimate foarte incorect în mai puțin de 256 kbps. Acesta este principalul motiv pentru care calitatea "completă" începe cu 256 Kbps - a dezvoltat istoric că orice flux mai mic în produsele comerciale standard de la Fraunhofer (până la 98 de ani) este stereo comun, care, în orice caz, este inacceptabil pentru transmiterea pe deplin corectă. Alte produse (sau târziu), în principiu, vă permit să alegeți arbitrar - stereo-ul comun sau un canal dublu - pentru orice fir.

Despre rezultate

În original (care acest caz Este tocmai 256 kbps) Am auzit un sunet cu un canal de diferență armat și am slăbit central. Foarte bine, a fost auzită o reverb de voce, ca, în general, tot felul de reverb și ecou artificial - aceste efecte spațiale sunt în principal în canalul de diferență. Pentru a vorbi în mod specific, în acest caz au existat 33% din canalul central și o diferență de 300%. Efectul absolut este de 0% din canalul central - activează tipul de echipament centrele de muzică "Karaoke Vocal Fader", "Voice Cancelation / Eliminare" sau similare, a cărei semnificație este de a îndepărta vocea din fonogramă. Semnificația operațiunii este că vocea este de obicei înregistrată numai pe canalul central - aceeași prezență în canalul din stânga și din dreapta. Îndepărtarea canalului central, eliminăm vocea (și mult mai mult, deci această caracteristică în viata reala Destul de inutil). Dacă aveți un astfel de lucru - puteți asculta MP3 cu el - este obținut un detector stereo amortizat.

Pe acest exemplu, puteți înțelege deja indirect că am pierdut. În primul rând, a devenit considerabil mai rău decât toate efectele spațiale - tocmai au pierdut. Dar în al doilea - Bouffagon este rezultatul tranziției informațiilor spațiale în sunet. Ceea ce a corespuns în spațiu - da, tocmai tot timpul mișcând aproape aleand componentele de sunet, un anumit "zgomot spațial", care nu era în fonograma originală (poate rezista cel puțin tranziției informațiilor spațiale în lipsă de incendiu fără apariția străinilor efecte). Se știe că acest tip de distorsiune atunci când se codifică în fluxuri mici apare adesea și direct, fără nici unul tratamente suplimentare. Doar denaturarea imediată a sunetului (care este aproape întotdeauna nu) percepută conștient și imediat și stereo (care, cu stereo comun, există întotdeauna în cantitati mari) - numai subconștient și în procesul de ascultare de ceva timp.

Acesta este motivul principal care nu oferă sunetul de lay3 128 Kbps să fie considerat o calitate completă a CD-ului. Faptul este că, în sine, transformarea sunetului stereo în Mono oferă efecte negative puternice - adesea același sunet se repetă în diferite canale, cu o mică întârziere că atunci când sunt amestecate, dă doar sunet încețoșat în timp. Sunetul mono realizat din sunet stereo sună mult mai rău decât înregistrarea mono originală. Diferența canalului, în plus față de centrul de mono mixt), oferă o separare completă inversă față de dreapta și stânga, dar absența parțială a unui canal de diferență (codificarea insuficientă) aduce nu numai o imagine spațială insuficientă, ci și aceste efecte neplăcute de amestecare a sunetului stereo într-un canal mono.

Când toate celelalte obstacole sunt eliminate - echipamentul este bun, culoarea tonală și dinamica sunt neschimbate (fluxul este suficient pentru codarea canalului central) - va rămâne în continuare. Dar există fonograme înregistrate în așa fel încât efectele negative ale compresiei bazate pe stereo mijlociu / lateral nu se manifestă - și apoi 128 kbit / s oferă aceeași calitate completă ca 256 kbps. Cazul privat - Fonograma poate fi bogată în sensul informațiilor stereo, dar informații slabe de sunet - de exemplu, un joc lent pe pian. În acest caz, pentru codificarea unui canal de diferență, fluxul este complet suficient pentru transmiterea unor informații spațiale exacte. Există cazuri mai dificile - un aranjament activ, umplut cu diverse instrumente, sună foarte bine de 128 kbps - dar acest lucru este rar găsit, poate într-un singur caz din cinci până la zece. Cu toate acestea, se găsește.

De fapt sunet. Este dificil să evidențiezi sunetul direct al sunetului canalului central în Layer3 128 Kbps. Lipsa transmisiei de frecvență este mai mare de 16 kHz (apropo, este foarte rară, dar încă transmisă) și o anumită scădere a amplitudinii este foarte mare - strict vorbind în sine - doar prostii. O persoană în câteva minute se obișnuiește complet la și nu distorsiuni tonale, pur și simplu nu poate fi considerată factori negativi puternici. Da, este de distorsiune, ci pentru percepția "calității complete" - departe. Din partea centrală, direct, canalul este posibil prin altă natură - o limitare accentuată a fluxului disponibil pentru codificarea acestui canal, cauzată de circumstanțele pur și simplu brevete - informații spațiale foarte abundente încărcate cu o varietate de sunete, frecvente ineficiente scurte Blocuri și ca rezultat al întregului flux de rezervă complet consumat. Acest lucru se întâmplă, dar relativ rare și că - dacă are loc un astfel de fapt, este de obicei vizibil pe fragmente mari continuu.

Afișați defectele de acest fel într-o formă explicită pentru a observa că orice persoană este foarte dificilă. Ei vor observa cu ușurință chiar și fără a manipula o persoană care este obișnuită să se ocupe de sunet, dar pentru un ascultător obișnuit non-critic poate părea complet indistinguizabil de sunetul original și unele abstracte în ceea ce nu este într-adevăr ... și încă uită la exemplu. A fost necesar să se aplice o prelucrare puternică la alocarea sa - pentru a reduce semnificativ conținutul frecvențelor medii și înalte după decodificare. Am eliminat interferarea pentru a auzi aceste nuanțe de frecvență. Noi, desigur, încalcăm lucrarea modelului de codare, dar va ajuta mai bine să înțelegeți ceea ce pierdem. Așa - așa cum ar trebui să sune (256_bass.mp3, 172 Kb) și ce se întâmplă după decodificare și procesare a unui flux de 128 kbps (128_bass.mp3, 172 Kb). Fiți atenți la pierderea vizibilă de continuitate, netezimea sunetului basului, precum și alte anomalii. Transfer frecvențe joase În acest caz, donată în favoarea frecvențelor mai mari și a informațiilor spațiale.

Trebuie remarcat faptul că activitatea modelului de compresie acustică poate fi observată (cu învățare atentă și cu o anumită experiență cu sunetul) și 256 kbps, dacă aplicați un egalizator mai mult sau mai puțin puternic. Dacă faceți acest lucru și apoi ascultați, va fi posibil uneori (destul de des) pentru a observa efecte neplăcute (sunete / bullhead). Mai important, sunetul după o astfel de procedură va avea un caracter neplăcut, inegal, care este foarte dificil de observat imediat, dar va fi considerabil cu o lungă ascultare. Diferența dintre 128 și 256 este doar că într-un curent de 128 kbps, aceste efecte există adesea fără prelucrare. De asemenea, sunt greu de observat imediat, dar sunt - un exemplu cu Bass oferă o idee despre locul unde să le caute. Pentru a auzi-o în fire înalte (peste 256 kbps) fără prelucrare este pur și simplu imposibilă. Această problemă nu se referă la fluxuri mari, dar există ceva care uneori (foarte rar) nu permite chiar strat3 - 256 kbit / cu originalul - acestea sunt parametrii temporari (mai multe detalii vor fi într-un articol separat mai târziu: a se vedea MPEG Lay3 - 256 / Link către un alt articol /).

Există fonograme care nu se referă la această problemă. Cea mai ușoară cale este să enumerăm factorii că, dimpotrivă, să conducă la apariția distorsiunii descrise mai sus. Dacă nici unul dintre ele nu este finalizat - există o mare șansă de a reuși pe deplin, în acest aspect, codificarea în Layer3 - 128 Kbps. Totul depinde, totuși, dintr-un material specific ...

În primul rând, zgomotul, să spunem hardware-ul. Dacă fonograma este un zgomot tangibil - este foarte nedorit să codifice în fluxuri mici, deoarece prea mult din fluxul este de a codifica informațiile inutile, care nu este, de asemenea, prea rezonabil să fie o codificare rezonabilă cu ajutorul unui model acustic.

  • Doar zgomot - tot felul sunete au depășit. Zgomotul monoton al orașului, strada, restaurantul etc., împotriva cărora are loc acțiunea principală. Acest tip de sunete oferă un flux foarte abundent de informații care ar trebui să fie codificate, iar algoritmul va fi forțat să sacrifice ceva în materialul principal.
  • Efecte stereo puternic nefiresc. Mai degrabă aparține elementului anterior, dar în orice caz - prea mult din fluxul se duce la canalul diferenței, iar codificarea canalului central se deteriorează puternic.
  • Distorsiune de fază puternică, diferită pentru diferite canale. În principiu, aceasta se referă mai degrabă la defectele algoritmilor de codificare obișnuiți în acest moment decât la standard, dar totuși. Cele mai sălbatice distorsiuni încep din cauza defalcării complete a întregului proces. La astfel de denaturări ale fonogramei inițiale, în majoritatea cazurilor, înregistrările pe echipamente de casetă și digitalizarea ulterioară, în special atunci când se joacă înregistrări de bandă ieftine cu inversări de calitate slabă. Capetele sunt strâmbe, panglica vânează oblicele, iar canalele sunt ușor deținute una față de cealaltă.
  • Doar o înregistrare prea supraîncărcată. Destul de vorbitori - Marea Orchestra Simfonică joacă peste tot :). De obicei, ca rezultat al compresiei în 128 kbps, ceva este complet schiță - cameră, cupru, tobe, solist. Se găsește, desigur, nu numai în clasic.

Un alt pol este ceea ce este de obicei comprimat:

  • Un instrument solo cu relativ suficient simplu. - Chitara, pian. Vioara, de exemplu, are un spectru prea umplut și sunete, de obicei, nu foarte bun. De la violonistul de vioară depinde efectiv de munca în sine. De asemenea, este destul de bine comprimat de mai multe instrumente - barduri sau SSP, de exemplu (instrument + voce).
  • Calitatea muzicii moderne de realizare. Acest lucru nu înseamnă calitatea muzicală, dar calitatea sunetului este reducerea, localizarea instrumentelor, absența categorică a efectelor globale complexe care decorează sunete și este în general inutilă. În această categorie, de exemplu, întregul pop modern, și unele rock, și, în general, există destul de multe lucruri.
  • Muzică agresivă, "electricitate". Ei bine, pentru a aduce într-un fel un exemplu - metalica timpurie (și modern în general). [Amintiți-vă, nu despre stilurile muzicale! Doar un exemplu.]

Este demn de remarcat faptul că comprimarea stratului3 aproape nu impresionează parametrii cum ar fi prezența / absența frecvențelor înalte, basului, surd / sunătoare etc. Există o dependență, dar atât de slabă încât nu o puteți lua în considerare.

Din păcate (sau din fericire?), Se sprijină pe persoana însuși. Mulți oameni fără pregătire și pre-selecție aud diferența dintre fluxurile de aproximativ 128 kbps și originalul, multe exemple extreme chiar sintetice nu sunt percepute prin auz ca distincție. Mai întâi nu trebuie să convingeți nimic, al doilea exemple și nu convingeți ... S-ar putea spune pur și simplu că cineva are o diferență, iar cineva nu are, dacă nu ar fi fost pentru un singur lucru: în procesul de ascultare a muzicii În timp, percepția noastră este tot timpul se îmbunătățește. Se pare calitate bună Ieri, mâine nu mai poate părea unul - se întâmplă întotdeauna. Și dacă este destul de inutilă (cel puțin în opinia mea) să se comprimă în 320 kbps, comparativ cu 256 kbps - câștigurile nu sunt prea importante, deși este clar, atunci să păstreze muzică de cel puțin 256 kbps.

În acest articol, vom clarifica caii de codare a ADUO, afectând calitatea sunetului său. Înțelegerea setărilor de conversie vă va ajuta să alegeți cea mai potrivită opțiune de codare a sunetului din punctul de vedere al relației de dimensiune a fișierului cu calitatea sunetului.

Ce este un bitrate?

Bitrate este cantitatea de date pe unitate de timp utilizată pentru transmiterea fluxului audio. De exemplu, o rată de biți 128 kbps este decriptată ca 128 kilobit pe secundă și înseamnă că 128 mii de biți sunt utilizați pentru a codifica o secundă de sunet (1 octeți \u003d 8 biți). Dacă traduceți această valoare în Kilobytes, atunci se pare că un al doilea sunet durează aproximativ 16 kb.

Astfel, cu cât este mai mare calea piesei, cu atât mai mult spațiu vă duce pe calculator. Dar, în același timp, într-un singur format, o rată de biți mai mare vă permite să înregistrați sunetul cu o calitate superioară. De exemplu, dacă convocați Audio-CD la MP3, atunci cu un biți de 256 kbps, sunetul va fi semnificativ mai bun decât cu un biți de 64 kbps.

Deoarece acum spațiul pe disc a devenit destul de ieftin, vă recomandăm să convertiți la MP3 cu o rată de biți nu mai mică de 192 kbps.

De asemenea, distinge bittele constante și variabile.

Diferența dintre bitratul constant (CBR) din AC (VBR)

Cu o bitare constantă pentru codificarea tuturor secțiunilor de sunet, se utilizează aceeași cantitate de biți. Dar structura sunetului este de obicei diferită și, de exemplu, pentru codificarea tăcerii, sunt necesare biți semnificativ mai puțin decât pentru a codifica sunetul saturat. O bitare variabilă, spre deosebire de constantă, ajustează automat calitatea codării, în funcție de complexitatea sunetului pe anumite intervale. Aceasta este, o rată de biți mai mică va fi utilizată pentru secțiunile de codare simplă și va fi aplicată o valoare mai mare pentru complexă. Utilizarea unei biți variabile vă permite să obțineți o calitate mai bună a sunetului cu o dimensiune mai mică a fișierului.

Care este frecvența eșantionării?

Acest concept apare la conversia semnal analog În digital și indică numărul de eșantioane (măsurători ale nivelului de măsurare) pe secundă, care sunt efectuate pentru a converti semnalul.

Care este numărul de canale?

Canalul, administrativ la codificarea audio este un flux de sunet independent. Mono - un flux, stereo - două fluxuri. N.M este adesea folosit pentru a se referi la numărul de canale, unde n este numărul de canale de sunet cu drepturi depline, iar M este numărul de canale de joasă frecvență (de exemplu 5.1).

Ați întrebat vreodată ce anume se pierde atunci când este comprimat de la Lossless în MP3 128 kbps sau 320 kbps?
Am verificat și rezultatul părea interesant. În primul rând, propun un sondaj pentru a înțelege pentru tine să audă dacă diferența este în general. Dacă nu sunteți sigur că auziți sau sigur că nu auziți, propun o idee simplă și elegantă de a vă vizita atenția: dintre care unul va fi în antifaze, respectiv, în informațiile celor două piese, va fi de preferință au auzit că nu este răscumpărat. Diagramele interesante nu promite încă, dar vă puteți auzi în sistemul nostru ce fel de sunete sunt pierdute atunci când sunt comprimate de la Flac în mp3 128 \\ 320 kbps, o arhivă cu exemple la sfârșitul articolului.
Interviu
Trebuie să descărcați și să ascultați 12 melodii timp de 30 de secunde. Apoi, pentru a specifica pentru fiecare dintre cele 4 compoziții una din cele 3 opțiuni (128 kbps, 320 kbps sau fără pierderi).
Sondajul este anonim, dar puteți specifica un hash unic și să-mi spuneți, ca o ultimă soluție, publicați părerea dvs. aici, dar neapărat sub spoiler. Sondajul va dura până la 25.02, după cheia și statisticile.
Fișiere pe discul Yandex, oglindă pe Dropbox (~ 80MB).
Datele inițiale.
Tastele negre - Lumina veșnică (FLAC, 44100 Hz, 24 de biți, 1613 kbps), puteți citi YouTube..
Ludovico Einaudi - Drop (FLAC, 96000 Hz, 24 de biți, 2354 kbps), puteți citi muzica Yandex.
CC Coletti - Rock and Roll (Flac, 192000 Hz, 24 de biți, 4845 kbps), puteți citi YouTube..
Annihilator - Ultra-Motion (Flac, 44100 Hz, 16 biți, 1022 kbps), puteți citi YouTube..
Parametrii de conversie în MP3
44.1KHz, stereo, 128 kbps sau 320 kbps
Descrierea experimentului
Fișierele sursă sunt tăiate în bucăți de 10 secunde, fiecare dintre piesele este exportată la WAV. După importul pieselor obținute la începutul fiecăruia, se adaugă 2 secunde de tăcere și un al doilea semnal de ton, apoi se convertesc la MP3. După importul fișierelor MP3, se pare că în raport cu originalul, fișierul rezultat "a mers înainte". Acesta nu este un bug, este. Realizăm sincronizarea cu privire la semnalul de ton specificat de la original (am încercat pentru fiecare fișier MP3 mai multe valori, care clarificate ulterior la cel mai bun rezultat), scapă de semnalul de ton, tăcerea și meserii obținute sunt exportate în WAV. Acum rămâne să inverseze piesele pentru a obține vârfuri multidirecționale și pentru a reduce originalul.
Rezultat
Nu voi deschide America ... Da, există o diferență. Da, mai ales când este comprimat la 128 kbps. Da, depinde de muzică. Da, chiar mai mult din codul audio.
Faceți o ieșire independentă și auziți diferența pe care o puteți descărca fișierele