Baca lebih lanjut tentang pengaturan konversi suara. Apa itu Bitrate? Bagaimana mereka mempengaruhi kualitas musik dan video? Apa yang lebih baik dari 128 atau 320 kbps

Pernahkah Anda bertanya-tanya apa yang sebenarnya hilang ketika dikompresi dari lossless di MP3 128 kbps atau 320 kbps?
Saya memeriksa dan hasilnya tampak menarik. Pertama-tama, saya mengusulkan survei untuk memahami diri sendiri untuk mendengar apakah perbedaannya secara umum. Jika Anda tidak yakin bahwa Anda mendengar atau yakin bahwa Anda tidak mendengar, saya mengusulkan ide yang sederhana dan elegan untuk perhatian Anda: Anda perlu mengambil dua dahi dua gelombang suara Salah satunya akan berada di Antiphase, masing-masing, dalam informasi dua trek, itu akan terdengar secara menguntungkan apa yang tidak ditebus. Bagan menarik belum menjanjikan, tetapi Anda dapat mendengar diri mereka pada sistem kami seperti apa suara yang hilang ketika dikompresi dari FLAC di MP3 128 \\ 320 kbps, arsip dengan contoh-contoh di akhir artikel.
Wawancara
Anda perlu mengunduh dan mendengarkan 12 trek selama 30 detik. Kemudian untuk menentukan masing-masing 4 komposisi satu dari 3 opsi (128 kbps, 320 kbps atau lossless).
Survei ini anonim, tetapi Anda dapat menentukan hash unik dan menceritakan kepada saya, sebagai pilihan terakhir, menerbitkan pendapat Anda di sini, tetapi tentu di bawah spoiler. Survei akan berlangsung hingga 25.02, setelah kunci dan statistik.
File pada Yandex Disk, Mirror di Dropbox (~ 80MB).
Data awal
Kunci hitam - lampu abadi (FLAC, 44100 Hz, 24-bit, 1613 Kbps), Anda dapat membaca Youtube..
Ludovico Einaudi - Drop (FLAC, 96000 HZ, 24-bit, 2354 Kbps), Anda dapat membaca musik Yandex.
CC Coletti - Rock and Roll (Flac, 192000 Hz, 24-bit, 4845 Kbps), Anda dapat membaca Youtube..
Annihilator - Ultra-Motion (FLAC, 44100 HZ, 16-bit, 1022 Kbps), Anda dapat membaca Youtube..
Parameter konversi dalam mp3
44.1KHz, Stereo, 128 Kbps atau 320 Kbps
Deskripsi percobaan
File sumber dipotong menjadi potongan 10 detik, masing-masing potongan diekspor ke wav. Setelah mengimpor trek yang diperoleh ke awal masing-masing, hening 2 detik dan sinyal nada kedua ditambahkan, kemudian dikonversi ke MP3. Setelah mengimpor file MP3, ternyata relatif terhadap yang asli, file yang dihasilkan "maju". Ini bukan bug, itu. Kami melakukan sinkronisasi sehubungan dengan sinyal nada yang ditentukan dari aslinya (saya mencoba untuk setiap file MP3 beberapa nilai, yang kemudian diklarifikasi ke hasil terbaik), singkirkan sinyal nada, keheningan dan perdagangan yang diperoleh diekspor ke WAV. Sekarang tetap membalikkan trek untuk mendapatkan puncak multidirectional, dan mengurangi aslinya.
Hasil
Saya tidak akan membuka Amerika ... Ya, ada perbedaan. Ya, terutama saat dikompresi hingga 128kbps. Ya, tergantung pada musiknya. Ya, bahkan lebih dari kode audio.
Membuat output independen dan mendengar perbedaan Anda dapat mengunduh file pada

Saat ini, ada banyak percakapan bahwa kami telah kehilangan musik nyata dengan kedatangan format audio tekan, seperti MP3, AAC dan sejenisnya. Benarkah? Akankah format lossless menghemat? Bisakah pendengar yang tidak siap untuk membedakan musik dalam format MP3 dari FLAC? Mari kita cari tahu dalam hal ini.

Apa itu bitrate (bitrate)?

Mungkin Anda sudah mendengar istilah "bitrate" sebelumnya, dan Anda mungkin memiliki gambaran umum tentang apa artinya, tetapi mungkin tidak buruk untuk berkenalan dengan definisi resminya sehingga Anda tahu bagaimana semuanya bekerja.

Bitrate - Ini adalah jumlah bit atau jumlah data yang diproses selama periode tertentu waktu. Dalam audio, ini biasanya berarti kilobit per detik. Misalnya, musik yang Anda beli di iTunes adalah 256 kilobit per detik, yaitu, setiap lagu kedua berisi 256 kilobyte data.

Semakin tinggi laju bit jalur, semakin banyak ruang yang akan diambil di komputer Anda. Sebagai aturan, CD audio mengambil ruang yang cukup banyak, sehingga menjadi praktik normal untuk mengompres file-file ini sehingga Anda dapat merekam lebih banyak musik ke Anda hdd. (atau iPod, Dropbox atau sesuatu yang lain). Di sinilah format "tanpa kerugian" dan "dengan kerugian" datang ke dalam perselisihan.

Format lossless dan lossy: Apa bedanya?


Ketika kami mengatakan "tanpa kerugian", kami maksudkan bahwa kami benar-benar tidak mengubah file sumber. Artinya, kami menyalin trek dari CD ke hard disk kami, tetapi tidak memerasnya sedemikian rupa sehingga kami kehilangan data apa pun. Ini pada dasarnya sama dengan jalur CD asli.

Namun, paling sering Anda mungkin menyalin musik Anda dalam format lossy. Artinya, Anda mengambil CD, menyalinnya ke hard disk dan meremas trek sehingga mereka tidak menempati banyak ruang. Album khas mungkin membutuhkan 100 MB atau lebih. Album yang sama dalam format kerugian, seperti (juga dikenal sebagai Apple Lossless), akan memakan waktu sekitar 300 MB, sehingga telah menjadi praktik umum untuk menggunakan format kehilangan untuk lebih unduhan cepat dan penghematan hard disk yang lebih besar.

Masalahnya adalah ketika Anda menekan file untuk menghemat ruang, Anda menghapus potongan data. Sama seperti ketika Anda mengambil gambar berkualitas tinggi, dan kompres di JPEG, komputer Anda mengambil data sumber dan "menipu" bagian-bagian tertentu dari gambar, menjadikannya sama, tetapi dengan beberapa keheraman kejelasan dan berkualitas tinggi.

Sebagai contoh, ambil dua gambar di bawah ini: Hak kanan dikompresi dengan jelas, dan sebagai hasilnya, kualitasnya menurun.

Ingatlah bahwa Anda menyimpan musik hard disk yang meremas musik dalam format lossy, yang dapat sangat penting bagi iPhone dengan memori 32 GB, tetapi sesuai dengan jumlah volume / kualitas itu hanya kompromi.

Ada berbagai tingkat kompresi: 128 Kbps, misalnya, menempati ruang yang sangat sedikit, tetapi juga akan memiliki kualitas pemutaran rendah daripada file 320 kbit / s yang lebih besar, yang, pada gilirannya, lebih rendah dari kualitas daripada file referensi dengan 1.411 Kbps. 1.411 Kbps adalah kualitas level CD audio, yang, dalam banyak kasus, lebih dari cukup.

Seluruh masalahnya bukan berapa banyak musik yang dikompresi, tetapi di mana peralatan yang Anda dengarkan.

Apakah bitrate benar-benar penting?


Karena memori setiap tahun menjadi lebih murah, mendengarkan suara dengan bit rate yang lebih tinggi, atau sama sekali dalam format lossless, mulai menjadi semakin populer. Tetapi apakah itu layak, usaha dan memori sibuk di ponsel atau komputer Anda?

Saya tidak suka menjawab pertanyaan dengan cara ini, tetapi sayangnya, jawabannya adalah: itu tergantung.

Bagian dari persamaan adalah peralatan yang Anda gunakan. Jika Anda menggunakan sepasang headphone atau speaker berkualitas tinggi, Anda terbiasa dengan frekuensi besar dan rentang dinamis. Dengan demikian, kemungkinan besar Anda akan melihat kekurangan yang terjadi saat mengompresi musik ke dalam file dengan lease bit yang lebih rendah. Anda mungkin memperhatikan bahwa dalam file MP3 berkualitas rendah tidak ada tingkat detail tertentu; Trek latar belakang tipis bisa lebih sulit untuk persepsi, frekuensi atas dan rendah tidak akan begitu dinamis, atau Anda dapat mendengar distorsi dalam vokal solist. Dalam kasus ini, Anda mungkin memerlukan trek dengan bit rate yang lebih tinggi.

Namun, jika Anda mendengarkan musik Anda menggunakan sepasang headphone murah di iPod AndaAnda mungkin tidak akan melihat perbedaan antara file 128 kbps dan file 320 kbit / s, belum lagi musik tanpa kehilangan 1,411 kbps. Ingat ketika saya menunjukkan kepada Anda beberapa paragraf di atas dan mencatat bahwa Anda mungkin harus mengintip ke dalamnya untuk melihat kekurangannya? Headphone Anda seperti versi gambar terpotong: Mereka akan membuat kerugian ini sulit untuk persepsi, karena secara fisik dapat memainkan musik sesuai kebutuhan.

Bagian lain dari persamaan, tentu saja, telinga Anda sendiri. Beberapa orang bisa sangat sulit untuk membedakan dua bitrate yang berbeda untuk alasan sederhana - mereka mendengarkan sedikit mendengarkan musik. Keterampilan pendengaran, seperti yang lain, berkembang dengan latihan. Jika Anda sering mendengarkan banyak musik favorit Anda, rumor Anda menjadi lebih akurat dan mulai menangkap detail kecil dan halftone. Tetapi sampai saat itu tidak masalah apa bitrate yang Anda gunakan?

Jadi format dan bitrate apa yang harus Anda pilih sendiri? Apakah Anda memiliki 320 kbps, atau apakah Anda memerlukan format lossless?

Faktanya adalah sulit untuk mendengar perbedaan antara file kerugian dan file MP3 320 Kbps. Untuk mendengar perbedaannya, Anda akan memerlukan peralatan berkualitas tinggi yang serius, pendengaran yang baik dan jenis musik tertentu (misalnya, klasik atau jazz).

Untuk mayoritas orang, 320 kbps / dengan lebih dari cukup untuk mendengarkan.

Apa lagi yang diperhitungkan?


Musik, direkam, dapat bermanfaat. File dalam format lossless lebih dapat diandalkan di masa depan, dalam arti bahwa Anda selalu dapat memerasnya ke format lossy ketika Anda membutuhkannya, tetapi Anda tidak dapat melakukan sebaliknya dan mengembalikan kualitas CD asli dari file MP3. Sekali lagi, salah satu masalah fundamental dengan toko musik online: Jika Anda telah membuat perpustakaan musik besar di iTunes dan suatu hari memutuskan bahwa Anda perlu lebih banyak bitrate, Anda harus membelinya lagi, tetapi hanya saat ini dalam format CD.

Ketika dimungkinkan, saya selalu membeli atau menyalin musik dalam format lossless untuk keperluan cadangan.

Saya mengerti bahwa audiophiles, itu seperti jarum di bawah kuku. Seperti yang saya katakan, itu semua tergantung pada Anda, persidangan dan peralatan Anda yang Anda miliki.

Bandingkan dua track yang direkam dalam format lossless dan lossy. Cobalah beberapa format audio yang berbeda, dengarkan beberapa waktu dan tonton apakah akan ada perbedaan untuk Anda atau tidak.

Dalam kasus terburuk, Anda menghabiskan beberapa jam untuk mendengarkan musik favorit Anda - tidak begitu menakutkan, kan? Bersenang senang lah!

Pro dan Cons Mp3 128 Kbps

Kompresi data audio adalah hal yang rumit. Tidak ada yang bisa dikatakan sebelumnya ... Format yang paling umum untuk hari ini adalah MPEG Layer3 dengan aliran 128 kbps - memberikan kualitas yang pada pandangan pertama tidak berbeda dengan aslinya. Ini juga disebut sembrono - "CD-Quality". Namun demikian, hampir semua orang tahu bahwa banyak orang gerbang hidung dari "kualitas CD." Apa yang salah? Mengapa kualitas ini tidak cukup? Pertanyaan yang sangat sulit. Saya lawan kompresi 128 kbps, karena hasilnya kadang-kadang bodoh. Tetapi saya memiliki sejumlah catatan dalam 128 Kbps, yang praktis tidak dapat menemukan kesalahan. Apakah aliran 128 cocok untuk mengkodekan satu atau bahan lain - ternyata, sayangnya, hanya setelah berulang kali mendengarkan hasilnya. Tidak mungkin mengatakan apa pun di muka - secara pribadi tidak tahu tanda-tanda yang akan memungkinkan terlebih dahulu untuk menentukan keberhasilan hasilnya. Namun seringkali aliran 128 cukup cukup untuk pengkodean musik berkualitas tinggi.

Untuk pengkodean dalam 128 Kbps, yang terbaik adalah menggunakan produk dari Fraunhofer - produser MP3 2.1 atau yang lebih baru. Selain Mp3 3.0 - Ini memiliki kesalahan yang mengganggu yang mengarah pada pengkodean frekuensi tinggi yang sangat buruk. Versi di atas 3.0 tidak menderita kerugian ini.

Pertama-tama, sedikit kata-kata umum. Persepsi gambar suara oleh seseorang sangat tergantung pada transmisi simetris dua saluran (stereo). Distorsi yang berbeda di berbagai saluran - jauh lebih buruk dari yang sama. Secara umum, memastikan sebanyak mungkin karakteristik suara di kedua saluran, tetapi sementara itu bahan yang berbeda. (Kalau tidak, apa stereo) adalah masalah rekaman suara besar, yang biasanya diremehkan. Jika kita dapat menggunakan 64 kbit / s untuk menyandikan Mono, maka untuk pengkodean stereo hanya dalam dua saluran, kita tidak akan memiliki cukup 64 kbps per saluran - hasil stereo akan terdengar jauh lebih salah daripada setiap saluran secara terpisah. Di sebagian besar produk Fraunhofer, batas Mono adalah 64 kbps - dan saya belum melihat rekor mono (catatan bersih - tanpa noise atau distorsi), yang akan membutuhkan aliran yang lebih besar. Untuk beberapa alasan, kecanduan kami terhadap suara monofonik jauh lebih lemah daripada stereo - rupanya, ia tidak dirasakan oleh kami dengan serius :) - dari sudut pandang psikoakustik, itu hanyalah suara keluar dari kolom, dan bukan mencoba untuk menyelesaikan beberapa gambar suara.

Upaya untuk mengirimkan sinyal stereo membuat persyaratan yang jauh lebih ketat - pada akhirnya, apakah Anda pernah mendengar tentang model psikoacoustic yang memperhitungkan masking satu saluran ke orang lain? Beberapa kebalikan juga diabaikan, misalnya, efeknya - misalnya, efek stereo yang dirancang untuk kedua saluran segera. Secara terpisah diambil saluran kiri atas bagiannya sendiri - kami tidak akan mendengarnya. Tetapi kehadiran saluran yang tepat adalah bagian kedua dari efeknya - itu mengubah persepsi kita tentang saluran kiri: kita secara tidak sadar berharap untuk mendengar bagian kiri efeknya, dan perubahan psikoacoustics kita juga harus dipertimbangkan. Dengan kompresi yang lemah - 128 kbps pada saluran (total 256 kbps) Efek ini mendekati no, karena setiap saluran disajikan sepenuhnya untuk tumpang tindih dengan kebutuhan simetrisitas transmisi, tetapi untuk utas sekitar 64 kbps pada saluran itu besar Masalah - transfer nuansa tipis dari sambungan persepsi kedua saluran membutuhkan transmisi yang lebih akurat daripada saat ini dimungkinkan dalam aliran tersebut.

Tentu saja, dimungkinkan untuk membuat model speaker penuh untuk dua saluran, tetapi industri melewati jalur lain, yang umumnya setara dengan ini, tetapi jauh lebih mudah. Banyak algoritma dengan nama umum stereo bersama - larutan parsial dari masalah yang dijelaskan di atas. Sebagian besar algoritma dikurangi menjadi fakta bahwa saluran pusat dan saluran perbedaan dialokasikan - stereo tengah / samping. Saluran sentral membawa informasi audio utama dan merupakan saluran mono biasa yang dibentuk dari dua saluran sumber, dan perbedaan dalam sisa informasi yang memungkinkan Anda mengembalikan suara stereo asli. Dengan sendirinya, operasi ini sepenuhnya reversibel - itu hanyalah cara lain untuk mewakili dua saluran, yang dengannya lebih mudah untuk bekerja ketika mengompres informasi stereo.

Selanjutnya, biasanya kompresi kompresi saluran tengah dan perbedaan yang terpisah, sementara menggunakan fakta bahwa saluran perbedaan dalam musik nyata relatif buruk - kedua saluran memiliki banyak kesamaan. Keseimbangan kompresi yang mendukung saluran sentral dan perbedaan dipilih saat bepergian, tetapi sebagian besar aliran yang jauh lebih besar menonjol ke saluran pusat. Algoritma kompleks memutuskan bahwa kita berada di saat ini Ini lebih disukai - gambar spasial yang lebih benar atau kualitas transmisi umum untuk saluran informasi, atau sekadar kompresi tanpa stereo mid / samping - yaitu, dalam mode saluran ganda.

Anehnya, tetapi kompresi stereo adalah tempat terkemuka hasil kompresi di layer3 128 kbps. Tidak mungkin untuk mengkritik pencipta format - itu masih sedikit kemungkinan kejahatan. Informasi stereo tipis hampir tidak dirasakan secara sadar (jika Anda tidak memperhatikan hal-hal yang jelas - tata letak instrumen yang kasar di ruang angkasa, efek buatan, dll.), Jadi kualitas stereo diperkirakan oleh seseorang. Biasanya sesuatu selalu tidak memungkinkan untuk mencapai ini: kolom komputer, misalnya, membuat lebih banyak kerugian substansial, dan ke sublikasi seperti itu sebagai transmisi yang salah dari informasi spasial tidak mencapai.

Tidak perlu berpikir bahwa apa yang tidak memungkinkan untuk mendengar kurangnya akustik komputer ini adalah bahwa kolom disusun pada jarak 1 meter, di sisi monitor, tanpa menciptakan stereo thase yang cukup. Intinya bahkan tidak dalam hal ini .. Pertama, jika datang ke kolom seperti itu, pria itu duduk tepat di depan mereka - dan itu menciptakan efek yang sama dengan kolom di sudut-sudut ruangan, dan bahkan lebih lagi: pada akustik normal dan volume yang baik Anda hampir tidak dapat menyorot lokasi spasial yang tepat dari suara (ini bukan tentang gambar suara, yang, sebaliknya, speaker komputer tidak akan pernah dibangun, tetapi tentang langsung, sadar, persepsi perbedaan antara saluran). Kolom komputer (penggunaan standar) atau headphone memberikan persepsi langsung yang jauh lebih jelas tentang stereo daripada akustik musikal biasa.

Handal untuk dikatakan - untuk persepsi suara langsung, informatif, kami tidak sangat diperlukan informasi stereo yang akurat. Langsung mendeteksi perbedaan dalam aspek ini antara aslinya dan layer3 128 kbps agak sulit, meskipun itu mungkin. Butuh banyak pengalaman, atau memperkuat efek bunga. Hal paling sederhana yang dapat dilakukan adalah untuk menyebarluaskan saluran lebih jauh dari yang mungkin secara fisik. Biasanya efek ini yang dihidupkan dengan murah teknisi komputer Tombol suara 3D. Atau dalam kotak boom yang kolomnya tidak lepas dari badan perangkat dan terlalu lemah untuk transmisi stereo yang indah cara alami. Ada transisi informasi spasial ke dalam informasi audio tertentu dari kedua saluran - perbedaan antara saluran meningkat.

Saya menerapkan efek yang lebih kuat daripada biasanya diterima dengan lebih baik mendengar perbedaannya. Lihatlah bagaimana seharusnya suara - setelah pengkodean dalam 256 Kbps dengan saluran ganda (256_channels_wide.mp3, 172 Kb), dan bagaimana kedengarannya setelah pengkodean dalam 128 kbps dengan stereo bersama (122 kb).

Mundur. Kedua file ini adalah MP3 dari 256 Kbps, dikodekan menggunakan MP3 Producer 2.1. Jangan bingung: i, pertama, uji mp3, dan kedua - saya memposting hasil pengujian mp3 mp3;). Itu semua seperti ini: pada awalnya saya mengkodekan jalan musik pada 128 dan 256. Kemudian kami membagi file-file ini, pemrosesan terapan (expander stereo), diperas dalam 256 - hanya untuk menghemat ruang - dan ditata di sini.

By the way, hanya pada 256 Kbps di produsen MP3 2.1 mematikan stereo bersama dan menyalakan saluran ganda - dua saluran independen. Bahkan 192 Kbps di Produser 2.1 adalah semacam stereo bersama, karena contoh saya sangat terkompresi dalam kurang dari 256 kbps. Ini adalah alasan utama bahwa kualitas "penuh" dimulai dengan 256 kbps - secara historis dikembangkan bahwa aliran yang lebih kecil dalam produk komersial standar dari Fraunhofer (hingga 98 tahun) adalah stereo bersama, yang dalam hal apa pun tidak dapat diterima untuk transmisi yang sepenuhnya benar. Produk lain (atau terlambat), pada prinsipnya, memungkinkan Anda untuk secara sewenang-wenang memilih - stereo bersama atau saluran ganda - untuk utas apa pun.

Tentang hasil

Dalam aslinya (yang kasus ini Justru 256 kbps) kami telah mendengar suara dengan saluran perbedaan yang diperkuat dan melemah pusat. Sangat baik, reverb suara terdengar, seperti pada umumnya, segala macam reverb dan gema buatan - efek spasial ini terutama dalam saluran perbedaan. Untuk berbicara secara spesifik, dalam hal ini ada 33% dari saluran pusat dan 300% perbedaan. Efek absolut adalah 0% dari saluran pusat - menyala pada jenis peralatan pusat musik "Karaoke Vocal Fader", "Pembatalan Suara / Hapus" atau serupa, yang berarti untuk menghapus suara dari fonogram. Arti operasi adalah bahwa suara biasanya hanya direkam pada saluran pusat - kehadiran yang sama di saluran kiri dan kanan. Melepas saluran pusat, kami menghapus suara (dan lebih banyak lagi, jadi fitur ini di kehidupan nyata Cukup tidak berguna). Jika Anda memiliki hal seperti itu - Anda dapat mendengarkan MP3 Anda dengan itu - detektor stereo sendi yang lucu diperoleh.

Pada contoh ini, Anda sudah dapat memahami secara tidak langsung bahwa kami telah kehilangan. Pertama, itu menjadi lebih buruk daripada semua efek spasial - mereka hanya hilang. Tetapi pada bouffagon kedua adalah hasil dari transisi informasi spasial ke dalam suara. Apa yang sesuai dalam ruang - ya, hanya sepanjang waktu yang hampir secara acak memindahkan komponen suara, "noise spasial", yang tidak dalam fonogram asli (dapat tahan setidaknya transisi informasi spasial ke dalam suara orang asing tanpa penampilan asing efek). Diketahui bahwa jenis distorsi ini ketika pengkodean dalam arus rendah sering muncul dan langsung, tanpa perawatan tambahan. Hanya distorsi suara langsung (yang hampir selalu tidak) dirasakan secara sadar dan segera, dan stereo (yang, dengan stereo bersama, selalu ada di jumlah besar) - Hanya secara tidak sadar dan dalam proses mendengarkan untuk beberapa waktu.

Ini adalah alasan utama yang tidak memberikan suara layer3 128 Kbps untuk dianggap kualitas CD lengkap. Faktanya adalah bahwa dalam dirinya sendiri transformasi suara stereo di mono memberikan efek negatif yang kuat - seringkali suara yang sama diulangi di saluran yang berbeda dengan penundaan kecil yang ketika dicampur, itu hanya memberikan suara yang kabur dalam waktu. Suara mono yang terbuat dari suara stereo terdengar jauh lebih buruk daripada catatan mono asli. Saluran perbedaan, di samping pusat (saluran mono campuran), memberikan pemisahan terbalik lengkap ke kanan dan kiri, tetapi sebagian tidak adanya saluran perbedaan (kode tidak cukup) menghasilkan tidak hanya gambar spasial tidak cukup, tetapi juga efek yang tidak menyenangkan ini mencampur suara stereo dalam satu saluran mono.

Ketika semua hambatan lainnya dihilangkan - peralatannya bagus, warna nada dan dinamika tidak berubah (alirannya cukup untuk mengkodekan saluran pusat) - itu akan tetap ada. Tetapi ada fonogram yang direkam sedemikian rupa sehingga efek negatif dari kompresi berdasarkan stereo tengah / samping tidak dimanifestasikan - dan kemudian 128 kbit / s memberikan kualitas penuh yang sama dengan 256 kbps. Kasus pribadi - Fonogram mungkin kaya akan arti informasi stereo, tetapi informasi suara yang buruk - misalnya, permainan lambat di piano. Dalam hal ini, untuk mengkodekan saluran perbedaan, alirannya sepenuhnya cukup untuk mentransmisikan informasi spasial yang akurat. Ada lebih banyak kasus sulit - pengaturan aktif, diisi dengan berbagai alat, namun, terdengar 128 kbps sangat baik - tetapi ini jarang ditemukan, mungkin dalam satu kasus dari lima hingga sepuluh. Namun, ditemukan.

Sebenarnya terdengar. Sulit untuk menyoroti suara langsung suara saluran pusat di layer3 128 Kbps. Kurangnya transmisi frekuensi lebih tinggi dari 16 kHz (omong-omong, sangat jarang, tetapi masih ditransmisikan) dan penurunan tertentu dalam amplitudo sangat tinggi - secara ketat berbicara sendiri - hanya omong kosong. Seseorang dalam beberapa menit sepenuhnya terbiasa dan tidak untuk distorsi nada seperti itu, itu tidak dapat dianggap sebagai faktor negatif yang kuat. Ya, itu distorsi, tetapi untuk persepsi "kualitas penuh" - jauh kembali. Di bagian pusat, langsung suara, saluran itu dimungkinkan oleh jenis lain - batasan tajam dari aliran yang tersedia untuk mengkode saluran ini, yang disebabkan oleh keadaan ByTensice - Informasi spasial yang sangat berlimpah dengan berbagai suara, sering tidak efisien blok dan sebagai hasil dari semua aliran buffer cadangan yang sepenuhnya dikonsumsi. Ini terjadi, tetapi relatif jarang, dan itu - jika fakta seperti itu terjadi, biasanya terlihat pada fragmen besar secara terus menerus.

Tampilkan cacat semacam ini dalam bentuk eksplisit untuk memperhatikan siapa pun itu sangat sulit. Mereka akan dengan mudah memperhatikan bahkan tanpa menangani seseorang yang digunakan untuk menangani suara, tetapi untuk pendengar yang tidak kritis biasa, mungkin tampaknya benar-benar tidak dapat dibedakan dari suara asli dan beberapa menggali abstrak dalam apa yang tidak benar-benar .. dan masih melihat contoh. Diperlukan untuk menerapkan pemrosesan yang kuat untuk alokasi - untuk secara signifikan mengurangi kandungan frekuensi menengah dan tinggi setelah decoding. Saya menghapus interferensi untuk mendengar nuansa frekuensi ini. Kami, tentu saja melanggar pekerjaan model pengkodean, tetapi itu akan membantu lebih memahami apa yang hilang. Jadi - seperti yang seharusnya terdengar (256_bass.mp3, 172 kb), dan apa yang terjadi setelah decoding dan pemrosesan aliran 128 kbps (128_bass.mp3, 172 kb). Perhatikan hilangnya kontinuitas, kelancaran suara bass, serta beberapa anomali lainnya. Transfer frekuensi rendah Dalam hal ini, disumbangkan demi frekuensi dan informasi spasial yang lebih tinggi.

Perlu dicatat bahwa karya model kompresi akustik dapat diamati (dengan pembelajaran penuh perhatian dan memiliki pengalaman dengan suara) dan 256 kbps, jika Anda menerapkan equalizer yang kurang lebih kuat. Jika Anda melakukan ini dan kemudian mendengarkan, itu akan mungkin terjadi (cukup sering) untuk memperhatikan efek yang tidak menyenangkan (dering / bullhead). Lebih penting lagi, suara setelah prosedur seperti itu akan memiliki karakter yang tidak menyenangkan dan tidak merata, yang sangat sulit untuk segera diperhatikan, tetapi itu akan terasa dengan mendengarkan panjang. Perbedaan antara 128 dan 256 hanya dalam aliran 128 Kbps, efek ini sering ada tanpa pemrosesan. Mereka juga sulit untuk memperhatikan, tetapi mereka - contoh dengan bass memberikan beberapa gagasan tentang di mana mencarinya. Untuk mendengarnya di benang tinggi (di atas 256 kbps) tanpa pemrosesan tidak mungkin. Masalah ini tidak menyangkut arus tinggi, tetapi ada sesuatu yang kadang-kadang (sangat jarang) tidak memungkinkan bahkan layer3 - 256 kbit / dengan aslinya - ini adalah parameter sementara (detail lebih lanjut akan berada dalam artikel terpisah nanti: lihat MPEG Layer3 - 256 / tautan ke artikel lain /).

Ada fonogram yang tidak memperhatikan masalah ini. Cara termudah adalah mendaftarkan faktor-faktor yang, sebaliknya, mengarah pada munculnya distorsi yang dijelaskan di atas. Jika tidak ada dari mereka yang selesai - ada peluang besar untuk sepenuhnya berhasil, dalam aspek ini, pengkodean di Layer3 - 128 Kbps. Itu semua tergantung, dari bahan tertentu ...

Pertama-tama, kebisingan, katakanlah perangkat keras. Jika fonogram kebisingan berwujud - sangat tidak diinginkan untuk menyandikan ke dalam aliran kecil, karena terlalu banyak aliran pergi untuk mengkodekan informasi yang tidak perlu, yang juga tidak terlalu masuk akal untuk menjadi pengkodean yang masuk akal dengan bantuan model akustik.

  • Hanya kebisingan - segala macam suara di luar. Noise monoton kota, jalan, restoran, dll., Yang bertentangan dengan tindakan utama. Jenis suara ini memberikan aliran informasi yang sangat berlimpah yang harus dikodekan, dan algoritma akan dipaksa untuk mengorbankan sesuatu di materi utama.
  • Efek stereo kuat yang tidak wajar. Ini agak milik item sebelumnya, tetapi dalam hal apa pun - terlalu banyak aliran masuk ke saluran perbedaan, dan pengkodean saluran pusat sangat memburuk.
  • Distorsi fase yang kuat, berbeda untuk saluran yang berbeda. Pada prinsipnya, ini terkait dengan kelemahan algoritma pengkodean yang umum saat ini daripada standar, tetapi tetap saja. Distorsi paling liar dimulai karena kerusakan lengkap dari seluruh proses. Untuk distorsi seperti fonogram awal, dalam banyak kasus, catatan pada peralatan kaset dan digitalisasi selanjutnya, terutama ketika memainkan perekam pita murah dengan pembalikan kualitas buruk. Kepala bengkok, pita angin miring, dan saluran sedikit ditahan satu relatif terhadap yang lain.
  • Rekaman terlalu kelebihan beban. Secara kasar berbicara - orkestra simfoni besar memainkan seluruh :). Biasanya, sebagai akibat dari kompresi dalam 128 kbps, sesuatu benar-benar samar - ruang, tembaga, drum, soloist. Ditemukan, tentu saja, tidak hanya dalam klasik.

Tiang lain adalah apa yang biasanya dikompres:

  • Alat solo dengan relatif suara sederhana - Gitar, piano. Biola, misalnya, memiliki spektrum yang terlalu terisi dan suara biasanya tidak terlalu bagus. Dari biola biola sebenarnya tergantung pada pekerjaan itu sendiri. Ini juga cukup dikompresi oleh beberapa alat - Bards atau SSP, misalnya (Alat + Suara).
  • Musik pembuatan modern berkualitas. Ini tidak berarti kualitas musik, tetapi kualitas suara adalah reduksi, lokasi alat, tidak adanya efek global yang kompleks yang menghiasi suara dan umumnya berlebihan. Dalam kategori ini, misalnya, seluruh pop modern, juga beberapa batu, dan secara umum ada banyak hal.
  • Musik agresif, "listrik". Nah, untuk entah bagaimana membawa contoh - Metallica awal (dan modern pada umumnya juga). [Ingat, bukan tentang gaya musik! Contohnya saja.]

Perlu dicatat bahwa kompresi layer3 hampir tidak mengesankan parameter seperti ada / tidak adanya frekuensi tinggi, bass, tuli / dering, dll. Ada ketergantungan, tetapi sangat lemah sehingga Anda tidak dapat memperhitungkannya.

Sayangnya (atau untungnya?), Ia bertumpu pada orang itu sendiri. Banyak orang tanpa persiapan dan pra-pemilihan mendengar perbedaan antara aliran sekitar 128 kbps dan aslinya, banyak contoh ekstrim sintetis tidak dirasakan dengan mendengar sebagai perbedaan. Pertama-tama Anda tidak perlu meyakinkan apa-apa, contoh kedua dan tidak meyakinkan ... seseorang hanya bisa mengatakan bahwa seseorang memiliki perbedaan, dan seseorang tidak memiliki, jika itu bukan untuk satu hal: dalam proses mendengarkan musik Seiring waktu, persepsi kami sepanjang waktu membaik. Terlihat kualitas baik Kemarin, besok tidak bisa lagi tampak satu - itu selalu terjadi. Dan jika itu agak tidak ada gunanya (setidaknya menurut saya) untuk mengompres dalam 320 kbps dibandingkan dengan 256 kbps - kemenangannya tidak terlalu penting, meskipun jelas, kemudian untuk menjaga musik setidaknya 256 kbps masih.

Pada artikel ini, kami akan mengklarifikasi kuda-kuda pengkodean Aduo, memengaruhi kualitas suaranya. Memahami pengaturan konversi akan membantu Anda memilih opsi pengkodean suara yang paling tepat dari sudut pandang hubungan ukuran file dengan kualitas suara.

Apa bitrate?

Bitrate adalah jumlah data per unit waktu yang digunakan untuk mengirimkan aliran audio. Misalnya, bit rate 128 kbps didekripsi sebagai 128 kilobit per detik dan berarti bahwa 128 ribu bit digunakan untuk menyandikan satu detik suara (1 byte \u003d 8 bit). Jika Anda menerjemahkan nilai ini dalam kilobytes, maka ternyata suara satu detik membutuhkan waktu sekitar 16 KB.

Dengan demikian, semakin tinggi jalur trek, semakin banyak ruang yang dibutuhkan Anda pada komputasi Anda. Tetapi pada saat yang sama, dalam satu format, bit rate yang lebih besar memungkinkan Anda merekam suara dengan kualitas yang lebih tinggi. Misalnya, jika Anda menggunakan Audio-CD ke MP3, kemudian dengan bitrate 256 kbps, suara akan jauh lebih baik daripada dengan bitrate 64 kbps.

Karena sekarang ruang disk menjadi cukup murah, kami sarankan untuk mengkonversi ke MP3 dengan bit rate tidak lebih rendah dari 192 kbps.

Bedakan juga bitrate konstan dan variabel.

Perbedaan antara bitrate konstan (CBR) dari AC (VBR)

Dengan bitrate konstan untuk mengkode semua bagian suara, jumlah bit yang sama digunakan. Tetapi struktur suara biasanya berbeda dan, misalnya, untuk pengkodean keheningan, sangat sedikit bit diperlukan daripada menyandikan suara jenuh. Bitrate variabel, tidak seperti konstanta, secara otomatis menyesuaikan kualitas pengkodean, tergantung pada kompleksitas suara pada interval tertentu. Artinya, bit rate yang lebih rendah akan digunakan untuk bagian pengkodean sederhana, dan nilai yang lebih tinggi akan diterapkan untuk kompleks. Menggunakan bitrate variabel memungkinkan Anda untuk mencapai kualitas suara yang lebih tinggi dengan ukuran file yang lebih kecil.

Apa frekuensi pengambilan sampel?

Konsep ini terjadi saat mengkonversi sinyal analog Dalam digital dan menunjukkan jumlah sampel (pengukuran level pengukuran) per detik, yang dilakukan untuk mengkonversi sinyal.

Berapa jumlah saluran?

Saluran, secara administratif untuk encoding audio adalah aliran suara independen. Mono - satu aliran, stereo - dua stream. N.m sering digunakan untuk merujuk pada jumlah saluran, di mana n adalah jumlah saluran suara penuh, dan m adalah jumlah saluran frekuensi rendah (misalnya 5.1).

Pernahkah Anda bertanya-tanya apa yang sebenarnya hilang ketika dikompresi dari lossless di MP3 128 kbps atau 320 kbps?
Saya memeriksa dan hasilnya tampak menarik. Pertama-tama, saya mengusulkan survei untuk memahami diri sendiri untuk mendengar apakah perbedaannya secara umum. Jika Anda tidak yakin bahwa Anda mendengar atau yakin bahwa Anda tidak mendengar, saya mengusulkan ide yang sederhana dan elegan untuk mengunjungi perhatian Anda: salah satunya akan secara antiphase, masing-masing, dalam informasi dua trek, itu akan lebih disukai mendengar yang tidak ditebus. Bagan menarik belum menjanjikan, tetapi Anda dapat mendengar diri mereka pada sistem kami seperti apa suara yang hilang ketika dikompresi dari FLAC di MP3 128 \\ 320 kbps, arsip dengan contoh-contoh di akhir artikel.
Wawancara
Anda perlu mengunduh dan mendengarkan 12 trek selama 30 detik. Kemudian untuk menentukan masing-masing 4 komposisi satu dari 3 opsi (128 kbps, 320 kbps atau lossless).
Survei ini anonim, tetapi Anda dapat menentukan hash unik dan menceritakan kepada saya, sebagai pilihan terakhir, menerbitkan pendapat Anda di sini, tetapi tentu di bawah spoiler. Survei akan berlangsung hingga 25.02, setelah kunci dan statistik.
File pada Yandex Disk, Mirror di Dropbox (~ 80MB).
Data awal
Kunci hitam - lampu abadi (FLAC, 44100 Hz, 24-bit, 1613 Kbps), Anda dapat membaca Youtube..
Ludovico Einaudi - Drop (FLAC, 96000 HZ, 24-bit, 2354 Kbps), Anda dapat membaca musik Yandex.
CC Coletti - Rock and Roll (Flac, 192000 Hz, 24-bit, 4845 Kbps), Anda dapat membaca Youtube..
Annihilator - Ultra-Motion (FLAC, 44100 HZ, 16-bit, 1022 Kbps), Anda dapat membaca Youtube..
Parameter konversi dalam mp3
44.1KHz, Stereo, 128 Kbps atau 320 Kbps
Deskripsi percobaan
File sumber dipotong menjadi potongan 10 detik, masing-masing potongan diekspor ke wav. Setelah mengimpor trek yang diperoleh ke awal masing-masing, hening 2 detik dan sinyal nada kedua ditambahkan, kemudian dikonversi ke MP3. Setelah mengimpor file MP3, ternyata relatif terhadap yang asli, file yang dihasilkan "maju". Ini bukan bug, itu. Kami melakukan sinkronisasi sehubungan dengan sinyal nada yang ditentukan dari aslinya (saya mencoba untuk setiap file MP3 beberapa nilai, yang kemudian diklarifikasi ke hasil terbaik), singkirkan sinyal nada, keheningan dan perdagangan yang diperoleh diekspor ke WAV. Sekarang tetap membalikkan trek untuk mendapatkan puncak multidirectional, dan mengurangi aslinya.
Hasil
Saya tidak akan membuka Amerika ... Ya, ada perbedaan. Ya, terutama saat dikompresi hingga 128kbps. Ya, tergantung pada musiknya. Ya, bahkan lebih dari kode audio.
Membuat output independen dan mendengar perbedaan Anda dapat mengunduh file pada