درباره تنظیمات تبدیل صدا بیشتر بدانید. بیت ریت چیست؟ آنها چگونه بر کیفیت موسیقی و ویدئو تأثیر می گذارند؟ که از 128 یا 320 کیلوبیت بر ثانیه بهتر است

آیا تا به حال به این فکر کرده اید که وقتی از حالت فشرده سازی بدون ضبط به mp3 128 کیلوبیت بر ثانیه یا 320 کیلوبیت بر ثانیه فشرده می شود دقیقاً چه چیزی از بین می رود؟
من بررسی کردم و نتیجه جالب به نظر می رسید. اول از همه ، من پیشنهاد می کنم یک نظرسنجی انجام دهید تا خودتان بفهمید که آیا اصلا تفاوت را می شنوید. اگر از آنچه می شنوید مطمئن نیستید یا مطمئن هستید که نمی شنوید ، من یک ایده ساده و زیبا را به شما توجه می کنم: شما باید دو مورد را بگیرید و فشار دهید امواج صوتییکی از آنها به ترتیب در آنتی فاز خواهد بود ، هنگام مخلوط کردن دو آهنگ ، عمدتاً آنچه را خاموش نمی کنید می شنوید. من هنوز گرافیک جالبی قول نمی دهم ، اما در سیستم خود شما قادر خواهید بود بشنوید که دقیقا چه صداهایی هنگام فشرده سازی از flac به mp3 128 \ 320 kbps از بین رفته اند ، بایگانی با مثال هایی در انتهای مقاله.

نظر سنجی

شما باید 12 آهنگ ، هر کدام 30 ثانیه بارگیری و گوش دهید. سپس برای هر یک از 4 آهنگ یکی از 3 گزینه (128 کیلوبیت بر ثانیه ، 320 کیلوبیت بر ثانیه یا بدون ضرر) را مشخص کنید.
نظرسنجی ناشناس است ، اما می توانید یک هش منحصر به فرد را مشخص کرده و به من بگویید ، در آخرین راه ، نظر خود را در اینجا بنویسید ، اما همیشه زیر اسپویلر. نظرسنجی تا 25 فوریه ادامه خواهد داشت ، پس از آن من کلید و آمار را منتشر می کنم.
فایل ها بر روی دیسک Yandex ، آینه در Dropbox (M 80Mb).

اطلاعات اولیه

کلیدهای سیاه - نور ابدی (flac ، 44100 هرتز ، 24 بیت ، 1613 کیلوبیت بر ثانیه) ، ببینید یوتیوب.
Ludovico Einaudi - Drop (flac ، 96000 هرتز ، 24 بیت ، 2354 کیلوبیت بر ثانیه) ، موجود در Yandex Music.
CC Coletti - Rock and Roll (flac ، 192000 هرتز ، 24 بیت ، 4845 کیلوبیت بر ثانیه) ، ببینید یوتیوب.
Annihilator-Ultra-motion (flac، 44100 Hz، 16-bit، 1022 kbps)، see یوتیوب.

گزینه های تبدیل Mp3

44.1 کیلوهرتز ، استریو ، 128 کیلوبیت بر ثانیه یا 320 کیلوبیت بر ثانیه

شرح آزمایش

فایلهای منبع به مدت 10 ثانیه به قطعات تقسیم می شوند ، هر قطعه به wav صادر می شود. پس از وارد کردن آهنگ های به دست آمده ، 2 ثانیه سکوت و یک سیگنال لحن دوم به ابتدای هر یک اضافه می شود و سپس به mp3 تبدیل می شود. پس از وارد کردن فایل های mp3 ، معلوم می شود که نسبت به فایل اصلی ، "پیش رفت". این یک اشکال نیست ، این است. ما با توجه به سیگنال تن داده شده از نسخه اصلی همگام سازی می کنیم (من برای هر فایل mp3 چند مقدار را امتحان کردم ، که بعداً آنها را به بهترین نتیجه رساندم) ، از سیگنال تن خلاص می شویم ، سکوت را انجام می دهیم و آهنگهای حاصل را به wav صادر می کنیم. اکنون باید مسیرها را وارونه کرد تا قله های چند جهته به دست آیند و با نسخه اصلی ترکیب شوند.

نتیجه

من آمریکا را باز نمی کنم ... بله ، تفاوت وجود دارد. بله ، مخصوصاً وقتی تا 128 کیلوبیت بر ثانیه فشرده می شود. بله ، بستگی به موسیقی دارد. بله ، حتی بیشتر از مسیر صوتی.
می توانید با بارگیری پرونده ها به یک نتیجه گیری مستقل برسید و تفاوت را بشنوید

این روزها صحبت های زیادی وجود دارد مبنی بر اینکه ما با ورود فرمت های صوتی فشرده مانند MP3 ، AAC و مواردی از این دست ، موسیقی واقعی را از دست داده ایم. آیا واقعا اینطور است؟ آیا موسیقی بدون تلف موسیقی را ذخیره می کند؟آیا یک شنونده آموزش دیده نمی تواند تفاوت بین موسیقی MP3 و FLAC را تشخیص دهد؟ اجازه دهید نگاهی به این موضوع بیندازیم.

بیت ریت چیست؟

احتمالاً شما قبلاً اصطلاح "نرخ بیت" را شنیده اید و احتمالاً تصور اولیه ای از معنی آن دارید ، اما شاید ایده خوبی باشد که خود را با تعریف رسمی آن آشنا کنید تا بدانید چگونه همه کار می کنند.

میزان بیتتعداد بیت ها یا میزان داده هایی است که در طول پردازش می شوند یک دوره معینزمان. در صدا ، این معمولاً به معنای کیلوبیت بر ثانیه است. به عنوان مثال ، موسیقی که از iTunes خریداری می کنید 256 کیلوبیت بر ثانیه است ، به این معنی که هر ثانیه آهنگ حاوی 256 کیلوبایت داده است.

هرچه نرخ بیت آهنگ بیشتر باشد ، فضای بیشتری در رایانه شما خواهد داشت... سی دی های صوتی معمولاً فضای زیادی را اشغال می کنند ، بنابراین فشرده سازی این فایل ها به طور معمول رایج شده است تا بتوانید موسیقی بیشتری را به موسیقی خود بسوزانید. HDD(یا iPod ، Dropbox یا هر چیز دیگری). اینجاست که قالب های "بدون ضرر" و "ضرر" مورد بحث قرار می گیرند.

فرمت های بدون ضرر و باخت: تفاوت چیست؟

وقتی می گوییم بدون ضرر ، منظور ما این است که ما واقعاً فایل اصلی را تغییر نداده ایم... به این معنا که ما یک قطعه از CD را روی هارد دیسک خود کپی کردیم ، اما آن را فشرده نکردیم تا جایی که هیچ داده ای را از دست دادیم. این اساساً همان آهنگ اصلی CD است.

با این حال ، بیشتر اوقات ، احتمالاً از موسیقی خود در قالب Lossy کپی می کنید. یعنی شما یک سی دی برداشته ، روی هارد دیسک خود کپی کرده و آهنگ ها را فشرده کرده اید تا فضای زیادی را اشغال نکنند. یک آلبوم معمولی احتمالاً 100 مگابایت یا بیشتر است. همان آلبوم در قالب بدون ضرر مانند (همچنین به عنوان Apple Lossless شناخته می شود) حدود 300 مگابایت حجم دارد ، بنابراین استفاده از فرمت های تلف کننده برای موارد بیشتر متداول شده است. بارگذاری سریعو صرفه جویی بیشتر در هارد دیسک.

مشکل این است که وقتی فایلی را برای صرفه جویی در فضا فشرده می کنید ، تکه های داده را حذف می کنید. درست مانند زمانی که تصویری با کیفیت بالا می گیرید و آن را به JPEG فشرده می کنید ، رایانه شما داده های خام را گرفته و قسمت های خاصی از تصویر را "ترفند" می کند و در اصل یکسان است ، اما وضوح و کیفیت آن از بین می رود.

دو تصویر زیر را به عنوان مثال در نظر بگیرید.: سمت راست به وضوح فشرده شده و در نتیجه کیفیت کاهش می یابد.

به یاد داشته باشید که با فشرده سازی موسیقی خود در فرمت های Lossy ، فضای هارد را ذخیره می کنید ، که می تواند برای iPhone با 32 گیگابایت فضای ذخیره سازی تفاوت بزرگی ایجاد کند ، اما این فقط از نظر حجم / کیفیت یک معامله است.

سطوح مختلف فشرده سازی وجود دارد: برای مثال ، 128 کیلوبیت بر ثانیه فضای بسیار کمی را اشغال می کند ، اما کیفیت پخش پایینی نسبت به یک فایل بزرگتر 320 کیلوبیت بر ثانیه دارد که به نوبه خود کیفیت پایین تری نسبت به فایل مرجع 1.411 کیلوبیت بر ثانیه دارد. 1.411 کیلوبیت بر ثانیه کیفیت CD صوتی است که در بیشتر موارد بیش از حد کافی است.

کل مشکل این نیست که موسیقی چقدر فشرده شده است ، بلکه در چه وسایلی است که به آن گوش می دهید.

آیا بیت ریت واقعا مهم است؟

هر سال که حافظه ارزان تر می شود ، گوش دادن به صدا با نرخ بیت بالاتر یا حتی در قالب های Lossless محبوبیت بیشتری پیدا کرده است. اما آیا ارزش وقت ، تلاش و فضای ذخیره سازی روی تلفن یا رایانه شما را دارد؟

من دوست ندارم به این شکل به سوالات پاسخ دهم ، اما متأسفانه پاسخ این است: بستگی دارد.

بخشی از معادله سخت افزاری است که استفاده می کنید.... اگر از یک هدفون یا بلندگو با کیفیت خوب استفاده می کنید ، به فرکانس زیاد عادت کرده اید و محدوده های پویا... به این ترتیب ، به احتمال زیاد متوجه اشکالاتی می شوید که با فشرده سازی موسیقی در فایل های بیت ریت پایین تر ایجاد می شود. ممکن است متوجه شوید که فایل های MP3 با کیفیت پایین فاقد سطح خاصی از جزئیات هستند. ممکن است انتخاب آهنگهای بک گراند دشوارتر باشد ، صدای سه تایی و بیس آنقدر پویا نباشد ، یا ممکن است اعوجاج را در خواننده اصلی خواننده بشنوید. در این موارد ، ممکن است بخواهید آهنگ bitrate بالاتری داشته باشید.

با این حال ، اگر در حال گوش دادن به موسیقی خود با یک جفت هدفون ارزان قیمت روی آی پاد خود هستید، احتمالاً متوجه تفاوت بین یک فایل 128Kbps و یک فایل 320Kbps نخواهید شد ، چه برسد به موسیقی بدون ضرر 1.411Kbps. به یاد دارید زمانی که تصویر را در چند پاراگراف بالا به شما نشان دادم و اشاره کردم که احتمالاً برای مشاهده عیب ها باید آن را بررسی کنید؟ هدفون های شما مانند نسخه ای کوتاه از تصویر هستند: درک این نقایص را دشوار می کند ، زیرا از نظر جسمی قادر به پخش موسیقی به آن شکلی نیستند که شما می خواهید.

بخش دیگر معادله ، البته ، گوش خود شماست.ممکن است برای برخی افراد تشخیص دو نرخ بیت متفاوت به دلیل ساده ای دشوار باشد - آنها به موسیقی کمی گوش می دهند. مهارت شنوایی ، مانند سایر موارد ، با تمرین ایجاد می شود. اگر به موسیقی مورد علاقه خود اغلب و زیاد گوش می دهید ، شنوایی شما دقیق تر می شود و شروع به جمع آوری جزئیات کوچک و نیمه های نیمه می کند. اما تا آن زمان ، واقعاً مهم نیست که از چه بیت ریتی استفاده می کنید؟

بنابراین کدام فرمت و نرخ بیت را باید برای خود انتخاب کنید؟ آیا 320 کیلوبیت بر ثانیه برای شما کافی است یا قطعاً به قالب Lossless نیاز دارید؟

نکته این است که شنیدن تفاوت بین یک فایل بدون ضرر و یک فایل MP3 320Kbps دشوار است. برای شنیدن تفاوت ، به تجهیزات جدی با کیفیت بالا ، شنوایی خوب و انواع موسیقی (به عنوان مثال کلاسیک یا جاز) نیاز دارید.

برای اکثریت قریب به اتفاق مردم ، 320 کیلوبیت بر ثانیه برای گوش دادن بیش از حد کافی است.

چه چیز دیگری را باید در نظر بگیرید؟

موسیقی ضبط شده می تواند مفید باشد. فایلهای بدون تلفات در آینده قابل اطمینان تر هستند ، به این معنا که همیشه می توانید آنها را در زمان نیاز به فرمت Lossy فشرده کنید ، اما نمی توانید عکس این کار را انجام دهید و کیفیت اصلی CD را از فایل MP3 بازیابی کنید. این ، دوباره ، یکی از مشکلات اساسی فروشگاه های موسیقی آنلاین است: اگر یک کتابخانه بزرگ موسیقی در iTunes ایجاد کرده اید و روزی تصمیم بگیرید که به نرخ بیت بیشتری احتیاج دارید ، باید دوباره آن را خریداری کنید ، اما فقط این بار در CD قالب. ...

در صورت امکان ، من همیشه موسیقی را در قالب Lossless برای اهداف پشتیبان خریداری یا کپی می کنم.

من درک می کنم که شنوایی سوزنی مانند یک سوزن زیر ناخن های خود هستند. همانطور که گفتم ، همه چیز به شما ، شنوایی شما و وسایلی که دارید بستگی دارد.

دو آهنگ ضبط شده در قالب Lossless و Lossy را مقایسه کنید. چند فرمت مختلف صوتی را امتحان کنید ، مدتی به آنها گوش دهید و ببینید آیا برای شما تفاوتی ایجاد می کند یا خیر.

در بدترین حالت ، شما چند ساعت را به گوش دادن به موسیقی مورد علاقه خود اختصاص خواهید داد - نه چندان ترسناک ، درست است؟ لذت ببرید!

جوانب مثبت و منفی MP3 128 کیلوبیت بر ثانیه

فشرده سازی داده های صوتی مشکل است. هیچ چیز را نمی توان از قبل گفت ... رایج ترین فرمت امروزی - MPEG Layer3 با جریان 128 کیلوبیت بر ثانیه - کیفیتی را ارائه می دهد که در نگاه اول با نسخه اصلی تفاوتی ندارد. این نامعمول - "کیفیت CD" نامیده می شود. با این حال ، تقریباً همه می دانند که بسیاری از افراد با این "کیفیت سی دی" بینی خود را بالا می آورند. مشکل چیه؟ چرا این کیفیت کافی نیست؟ این سوال بسیار سختی است. من خودم مخالف فشرده سازی 128 کیلوبیت بر ثانیه هستم ، زیرا نتیجه گاهی احمقانه است. اما تعداد مشخصی از ضبط های 128 کیلوبیت بر ثانیه دارم که عملاً نمی توانم در آنها عیب پیدا کنم. متأسفانه آیا جریان 128 برای کدگذاری این یا آن مواد مناسب است ، متأسفانه فقط پس از بارها گوش دادن به نتیجه مشخص می شود. نمی توان از قبل چیزی گفت - من شخصاً علائمی را نمی شناسم که می تواند موفقیت نتیجه را از قبل تعیین کند. اما اغلب جریان 128 برای رمزگذاری با کیفیت موسیقی کاملاً کافی است.

برای رمزگذاری 128 کیلوبیت بر ثانیه ، بهتر است از محصولات Fraunhofer - MP3 Producer 2.1 یا بالاتر استفاده کنید. علاوه بر MP3enc 3.0 - حاوی یک اشکال آزاردهنده است که منجر به رمزگذاری بسیار ضعیف با فرکانس بالا می شود. نسخه های بالاتر از 3.0 از این عیب رنج نمی برند.

اول از همه چند کلمه کلی. درک تصویر صوتی توسط شخص بسیار به انتقال متقارن دو کانال (استریو) بستگی دارد. تحریف های مختلف در کانال های مختلف بسیار بدتر از کانال های مشابه است. به طور کلی ، اطمینان از ویژگی های صوتی یکسان در هر دو کانال تا حد ممکن ، اما در عین حال مواد مختلف(در غیر این صورت چه نوع استریو است) یک مشکل بزرگ در ضبط است که معمولاً دست کم گرفته می شود. اگر می توانیم از 64 کیلوبیت بر ثانیه برای رمزگذاری مونو استفاده کنیم ، سپس برای رمزگذاری استریو در حالت فقط دو کانال ، 64 کیلوبیت بر ثانیه به اندازه کافی در هر کانال نخواهیم داشت - نتیجه استریو بسیار اشتباه تر از هر کانال به طور جداگانه به نظر می رسد. اکثر محصولات Fraunhofer به طور کلی مونو را به 64 کیلوبیت بر ثانیه محدود می کنند - و من هنوز ضبط مونو (ضبط تمیز - بدون سر و صدا یا اعوجاج) را مشاهده نکرده ام که به جریان بیشتری نیاز داشته باشد. بنا به دلایلی ، تمایلات ما برای صدای مونوفونیک بسیار ضعیف تر از صدای استریوفونیک است - ظاهراً به سادگی توسط ما جدی گرفته نمی شود :) - از نظر روانشناختی ، این فقط صدایی است که از بلندگو می آید و نه تلاش برای انتقال کامل انواع نقاشی های صوتی.

تلاش برای انتقال سیگنال های استریو بسیار سخت تر است - به هر حال ، آیا تا به حال در مورد مدلی روانشناختی شنیده اید که امکان پوشاندن یک کانال توسط کانال دیگر را فراهم کند؟ همچنین ، برخی از اثرات معکوس ، فرض کنیم نادیده گرفته می شوند - به عنوان مثال ، یک اثر استریو خاص ، که برای هر دو کانال به طور همزمان طراحی شده است. یک کانال چپ جداگانه قسمت خودش از جلوه را در خود می پوشاند - ما آن را نخواهیم شنید. اما وجود کانال راست - قسمت دوم اثر - تصور ما را از کانال چپ تغییر می دهد: ما ناخودآگاه انتظار داریم قسمت چپ اثر را بیشتر بشنویم و این تغییر در روانکاستیک ما نیز باید مورد توجه قرار گیرد. با فشرده سازی ضعیف - 128 کیلوبیت بر ثانیه در هر کانال (مجموع 256 کیلوبیت بر ثانیه) ، این تأثیرات از بین می رود ، زیرا هر کانال به اندازه کافی کامل ارائه شده است تا نیاز به تقارن انتقال با حاشیه را پوشش دهد ، اما برای جریانهای حدود 64 کیلوبیت بر ثانیه در هر کانال یک مشکل بزرگ - انتقال ظرافت های ظریف مفصل درک هر دو کانال مستلزم یک انتقال دقیق تر از آنچه در حال حاضر در چنین جریانهایی امکان پذیر است است.

البته امکان ساخت یک مدل صوتی کامل برای دو کانال وجود داشت ، اما صنعت راه دیگری را در پیش گرفت ، که به طور کلی معادل این است ، اما بسیار ساده تر. مجموعه ای از الگوریتم ها که به طور جمعی Joint Stereo نامیده می شود ، راه حلی جزئی برای مشکلات فوق است. اکثر الگوریتم ها به این دلیل خلاصه می شوند که کانال مرکزی و کانال تفاوت اختصاص داده شده اند - استریو میانی / جانبی. کانال مرکزی اطلاعات صوتی اصلی را حمل می کند و یک کانال مونو معمولی است که از دو کانال اصلی تشکیل شده است ، و کانال تفاوت بقیه اطلاعات را به شما امکان می دهد تا صدای استریو اصلی را بازیابی کنید. به خودی خود ، این عملیات کاملاً برگشت پذیر است - این فقط یک راه دیگر برای نمایش دو کانال است که هنگام فشرده سازی اطلاعات استریو کار با آن راحت تر است.

علاوه بر این ، فشرده سازی کانال های مرکز و تفاوت معمولاً جداگانه انجام می شود ، با استفاده از این واقعیت که کانال تفاوت در موسیقی واقعی نسبتاً ضعیف است - هر دو کانال اشتراکات زیادی دارند. تعادل فشرده سازی به نفع کانال مرکزی و کانال تفاوت در حالت مستقیم انتخاب می شود ، اما به طور کلی جریان بسیار بیشتری به کانال مرکزی اختصاص می یابد. الگوریتم های پیچیده تصمیم می گیرند که در ما چیست این لحظهترجیحا - یک تصویر فضایی صحیح تر یا کیفیت انتقال اطلاعات رایج برای هر دو کانال ، یا فشرده سازی بدون استریو میانی / جانبی - یعنی در حالت دو کانالی.

به طرز عجیبی ، اما فشرده سازی استریو ضعیف ترین نقطه نتیجه فشرده سازی در Layer3 128 kbps است. شما نمی توانید خالقان قالب را مورد انتقاد قرار دهید - این هنوز یک شر کوچک تر است. اطلاعات ظریف استریوفونیک تقریباً آگاهانه درک نمی شوند (اگر چیزهای بدیهی را در نظر نگیریم - ترتیب ناهموار سازها در فضا ، جلوه های مصنوعی و غیره) ، بنابراین ، کیفیت استریو توسط شخص در آخرین مکان ارزیابی می شود. به معمولاً چیزی همیشه به شما اجازه نمی دهد به این نتیجه برسید: به عنوان مثال بلندگوهای رایانه اشکالات بسیار بیشتری را وارد می کند و این موضوع به سادگی به ظرافت هایی مانند انتقال نادرست اطلاعات فضایی نمی رسد.

فکر نکنید آنچه شما را از شنیدن این ایراد در آکوستیک کامپیوتر باز می دارد این است که بلندگوها در فاصله 1 متری ، در کناره های مانیتور ، بدون ایجاد پایه استریو کافی ، قرار گرفته اند. این حتی نکته اصلی نیست .. اولاً ، اگر صحبت از چنین بلندگوهایی می شود ، فرد درست جلوی آنها نشسته است - و این همان تأثیر بلندگوهای گوشه اتاق را ایجاد می کند ، و حتی بیشتر: در حالت عادی آکوستیک و حجم خوب ، شما تقریباً هرگز نخواهید توانست آرایش فضایی دقیق صداها را مشخص کنید (ما در مورد تصویر صوتی صحبت نمی کنیم ، که برعکس ، بلندگوهای رایانه هرگز آن را ایجاد نمی کنند ، بلکه در مورد مستقیم و آگاهانه صحبت می کنند ، درک تفاوت بین کانال ها). بلندگوهای رایانه ای (در استفاده معمولی) یا هدفون نسبت به آکوستیک موسیقی معمولی ، تجربه استریو مستقیم بسیار واضح تری را ارائه می دهند.

صادقانه بگویم ، برای درک مستقیم ، اطلاعاتی و شناختی صدا ، ما واقعاً به اطلاعات استریو دقیق نیاز نداریم. تشخیص مستقیم تفاوت در این زمینه بین نسخه اصلی و Layer3 128 kbps بسیار دشوار است ، اگرچه ممکن است. شما یا به تجربه زیادی احتیاج دارید یا به افزایش تأثیرات علاقه توجه دارید. ساده ترین کاری که می توان انجام داد این است که مجلات را عملاً بیش از حد امکان فیزیکی گسترش دهیم. معمولا این اثر است که در ارزان قیمت گنجانده شده است فناوری رایانهدکمه "صدای سه بعدی" یا در جعبه های بوم ، بلندگوهای آن از بدنه دستگاه جدا نشده و برای انتقال استریو زیبا بسیار از هم فاصله دارند به طور طبیعی... انتقال اطلاعات فضایی به اطلاعات صوتی خاص هر دو کانال وجود دارد - تفاوت بین کانال ها افزایش می یابد.

من برای اینکه تفاوت را بهتر بشنوم ، از اثری قوی تر از آنچه که عموماً پذیرفته شده است استفاده کردم. بررسی کنید که چگونه باید پس از رمزگذاری با سرعت 256 کیلوبیت بر ثانیه با کانال دوگانه (256_channels_wide.mp3 ، 172 کیلوبایت) و پس از رمزگذاری با سرعت 128 کیلوبیت بر ثانیه با استریو مشترک (128_channels_wide.mp3 ، 172 کیلوبایت) چگونه به نظر می رسد.

عقب نشینی کنید... هر دوی این فایلها 256 کیلوبیت بر ثانیه mp3 رمزگذاری شده با mp3 Producer 2.1 هستند. اشتباه نگیرید: اولاً ، من mp3 را آزمایش می کنم ، و ثانیاً ، نتایج آزمایش mp3 را در mp3 ارسال می کنم ؛). به این صورت بود: ابتدا یک قطعه موسیقی را در 128 و 256 رمزگذاری کردم. سپس این فایلها را از حالت فشرده خارج کردم ، پردازش (استریو گسترش دهنده) را اعمال کردم ، در 256 فشرده کردم - فقط برای صرفه جویی در فضا - و آن را اینجا قرار دادم.

به هر حال ، تنها با سرعت 256 کیلوبیت بر ثانیه در mp3 Producer 2.1 استریو مشترک خاموش است و دو کانال روشن می شوند - دو کانال مستقل. حتی 192 کیلوبیت بر ثانیه در Producer 2.1 نوعی استریو مشترک است ، زیرا نمونه های من به اشتباه به کمتر از 256 کیلوبیت بر ثانیه فشرده شده اند. این دلیل اصلی است که کیفیت "کامل" دقیقاً از 256 کیلوبیت بر ثانیه شروع می شود - از لحاظ تاریخی ، هر جریان کوچکتر در محصولات تجاری استاندارد از Fraunhofer (قبل از 98) استریو مشترک است ، که در هر صورت برای انتقال کاملاً صحیح غیرقابل قبول است. سایر محصولات (یا بعدا) ، در اصل ، امکان انتخاب دلخواه کانال استریو یا دوگانه مشترک برای هر جریان را فراهم می کنند.

درباره نتایج

در اصل (که در این مورددقیقاً با 256 کیلوبیت بر ثانیه مطابقت دارد) ، ما صدا را با یک کانال تفاوت افزایش یافته و یک مرکز ضعیف شنیدیم. طنین صدا بسیار خوب شنیده شد ، و همه نوع طنین مصنوعی و به طور کلی پژواک - این تأثیرات فضایی عمدتا به کانال تفاوت می رسد. به طور خاص ، در این مورد 33 درصد کانال مرکزی و 300 درصد دیفرانسیل وجود داشت. اثر مطلق - 0٪ کانال مرکزی - در تجهیزاتی مانند مراکز موسیقیدکمه ای مانند "صدای کارائوکه" ، "لغو / حذف صدا" یا مواردی از این قبیل ، که معنی آن حذف صدا از فونوگرام است. نکته عملیات این است که صدا معمولاً فقط در کانال مرکزی ضبط می شود - همان حضور در کانال های چپ و راست. با حذف کانال مرکزی ، صدا را حذف می کنیم (و خیلی بیشتر ، بنابراین این عملکرد در زندگی واقعیتقریباً بی فایده است) اگر چنین چیزی دارید - می توانید به mp3 های خود گوش دهید - یک آشکارساز استریو مشترک خنده دار دریافت می کنید.

در این مثال ، در حال حاضر می توان به طور غیر مستقیم درک کرد که چه چیزی را از دست داده ایم. اولاً ، همه تأثیرات فضایی به طرز چشمگیری بدتر شد - آنها به سادگی از بین رفتند. اما ثانیاً ، غرغره نتیجه انتقال اطلاعات فضایی به اطلاعات صوتی است. در فضا با چه چیزی مطابقت داشت - فقط در تمام مدت اجزای صوتی تقریباً به طور تصادفی در حال حرکت ، برخی از "سر و صدای فضایی" که در گرامافون اصلی وجود نداشت (می تواند حداقل یک انتقال کامل اطلاعات فضایی به اطلاعات صوتی را بدون ظاهر موارد جانبی تحمل کند. اثرات). مشخص است که این نوع اعوجاج هنگام رمزگذاری در جریانهای کم اغلب غالباً بدون هیچ گونه تغییری ظاهر می شود درمان های اضافی... فقط این است که اعوجاج مستقیم صدا (که تقریباً همیشه وجود ندارد) آگاهانه و بلافاصله درک می شود ، در حالی که اعوجاج های کلیشه ای (که با استریوی مشترک ، همیشه در تعداد زیادی) - فقط ناخودآگاه و مدتی در حال گوش دادن است.

این دلیل اصلی این است که چرا صدای Layer3 با کیفیت 128 کیلوبیت بر ثانیه با کیفیت کامل CD در نظر گرفته نمی شود. واقعیت این است که تبدیل صدای استریو به مونو به خودی خود جلوه های منفی شدیدی را ایجاد می کند - اغلب یک صدا در کانال های مختلف با کمی تاخیر تکرار می شود ، که در صورت مخلوط شدن ، صدایی را ایجاد می کند که به سادگی در زمان تار می شود. صدای مونو ساخته شده از صدای استریو بسیار ضعیف تر از ضبط اصلی تک صدایی است. کانال تفاوت ، علاوه بر مرکز (کانال تک مخلوط) ، یک تفکیک معکوس کامل به راست و چپ می دهد ، اما عدم وجود جزئی کانال تفاوت (کد ناکافی آن) نه تنها یک تصویر فضایی ناکافی ، بلکه این ناخوشایند را نیز به ارمغان می آورد. اثرات مخلوط کردن صدای استریو در یک کانال مونو

وقتی همه موانع دیگر برداشته شوند - تجهیزات خوب است ، رنگ و پویایی تونال تغییر نمی کند (جریان برای رمزگذاری کانال مرکزی کافی است) - هنوز باقی می ماند. اما واج نگاری هایی وجود دارد که به گونه ای ضبط شده اند که اثرات منفی فشرده سازی بر اساس استریوی میانی / جانبی ظاهر نمی شود - و سپس 128 کیلوبیت بر ثانیه همان کیفیت کامل 256 کیلوبیت بر ثانیه را ارائه می دهد. یک مورد خاص- واجی ، شاید غنی از نظر اطلاعات استریو ، اما از نظر صدا ضعیف است - به عنوان مثال ، آهسته نواختن پیانو. در این حالت ، برای کدگذاری کانال تفاوت ، جریانی اختصاص داده می شود که برای انتقال اطلاعات مکانی دقیق کافی است. توضیح موارد نیز دشوارتر است - یک تنظیم فعال پر از ابزارهای مختلف ، با این وجود ، با 128 کیلوبیت بر ثانیه بسیار خوب به نظر می رسد - اما این نادر است ، شاید در یک مورد از پنج تا ده مورد. با این حال ، اتفاق می افتد.

در واقع به صدا. جداسازی عیوب مستقیم در صدای کانال مرکزی در Layer3 128 kbps دشوار است. عدم انتقال فرکانسهای بالاتر از 16 کیلوهرتز (به هر حال ، آنها بسیار نادر هستند ، اما هنوز هم منتقل می شوند) و کاهش مشخصی در دامنه فرکانسهای بسیار بالا - به طور دقیق به خودی خود - فقط مزخرف است. در عرض چند دقیقه ، فرد کاملاً به چنین تحریف های تنهایی عادت می کند ، به سادگی نمی توان آن را عوامل منفی قوی در نظر گرفت. بله ، اینها تحریف هستند ، اما برای درک "کیفیت کامل" آنها از درجه دوم فاصله دارند. از طرف کانال مرکزی ، مستقیماً صوتی ، مشکلات مختلف ممکن است - محدودیت شدید جریان موجود برای رمزگذاری این کانال ، که به سادگی توسط یک تصادف ایجاد شده است - اطلاعات فضایی بسیار فراوان ، لحظه ای پر از صداهای مختلف ، بلوک های کوتاه مکرر غیر مctiveثر و در نتیجه همه اینها ، یک بافر جریان پشتیبان به طور کامل خرج شده است. این اتفاق می افتد ، اما نسبتاً به ندرت ، و سپس - اگر چنین واقعیتی رخ دهد ، معمولاً روی قطعات بزرگ به طور مداوم قابل توجه است.

بسیار دشوار است که چنین نقایصی را به صورت صریح نشان دهیم تا هر شخصی متوجه آن شود. آنها می توانند به راحتی حتی بدون پردازش توسط فردی که عادت دارد با صدا برخورد کند ، متوجه شوند ، اما برای یک شنونده غیر منتقد معمولی ممکن است این امر با صدای اصلی و نوعی چکیده انتزاعی در آنچه واقعاً وجود ندارد قابل تشخیص نباشد. به یک مثال نگاه کنید برای جداسازی آن ، ما باید از پردازش قوی استفاده می کردیم - تا میزان فراوانی فرکانس های متوسط و زیاد را پس از رمزگشایی تا حد زیادی کاهش دهیم. البته با حذف فرکانس هایی که در شنیدن این تفاوت های ظریف اختلال ایجاد می کند ، ما مدل کدگذاری را مختل می کنیم ، اما این به درک بهتر آنچه از دست می دهیم کمک می کند. بنابراین - چگونه باید به نظر برسد (256_bass.mp3 ، 172 کیلوبایت) ، و پس از رمزگشایی و پردازش جریان 128 کیلوبیت بر ثانیه (128_bass.mp3 ، 172 کیلوبایت) چه اتفاقی می افتد. به از دست دادن قابل ملاحظه پیوستگی ، صاف بودن صدای بیس و برخی ناهنجاری های دیگر توجه کنید. انتقال فرکانس های پاییندر این مورد به نفع فرکانس های بالاتر و اطلاعات فضایی قربانی شد.

لازم به ذکر است که در صورت استفاده از اکولایزر کم و بیش قوی ، عملکرد مدل فشرده سازی آکوستیک (با مطالعه دقیق و با تجربه در زمینه صدا) و با سرعت 256 کیلوبیت بر ثانیه قابل مشاهده است. اگر این کار را انجام دهید و سپس گوش دهید ، گاهی اوقات (اغلب) می توانید متوجه اثرات ناخوشایند (زنگ زدن / غرغره) شوید. مهمتر از همه ، صدا پس از چنین روشی دارای یک شخصیت ناخوشایند و ناهموار خواهد بود که توجه به آن بسیار دشوار است ، اما با گوش دادن طولانی مدت قابل توجه خواهد بود. تنها تفاوت بین 128 و 256 این است که در جریان 128 کیلوبیت بر ثانیه ، این جلوه ها اغلب بدون هیچ گونه پردازشی وجود دارد. همچنین تشخیص آنها بلافاصله دشوار است ، اما آنها وجود دارند - مثال بیس به شما این ایده را می دهد که کجا باید آنها را جستجو کرد. به سادگی امکان شنیدن این موضوع در جریانهای بالا (بالای 256 کیلوبیت بر ثانیه) بدون پردازش وجود ندارد. این مشکل در مورد جریانهای بالا صدق نمی کند ، اما چیزی وجود دارد که گاهی اوقات (بسیار نادر) حتی اجازه نمی دهد لایه 3 - 256 کیلوبیت بر ثانیه به عنوان اصلی در نظر گرفته شود - اینها پارامترهای موقتی هستند (جزئیات بیشتر بعداً در مقاله ای جداگانه توضیح داده می شود) : MPEG Layer3 - 256 را ببینید / پیوند به مقاله دیگر /).

واج نگاری هایی وجود دارد که تحت تأثیر این مشکل نیز قرار نمی گیرد. ساده ترین راه این است که عواملی را که برعکس منجر به ظاهر شدن تحریفات فوق می شوند ، لیست کنید. اگر هیچ یک از آنها برآورده نشود ، یک شانس بزرگ برای رمزگذاری کاملاً موفق ، در این زمینه ، در لایه 3 - 128 کیلوبیت بر ثانیه وجود دارد. اما همه چیز بستگی به مواد خاص دارد ...

اول از همه - نویز ، فرض می کنیم ، سخت افزار. اگر گرامافون به طور قابل توجهی پر سر و صدا است ، رمزگذاری آن در جریانهای کوچک بسیار نامطلوب است ، زیرا مقدار زیادی از جریان به رمزگذاری اطلاعات غیر ضروری می رسد ، که علاوه بر این ، برای کدگذاری منطقی با استفاده از یک مدل آکوستیک ، چندان مناسب نیست.

فقط سر و صدا - همه جور صداهای عجیب و غریب... سر و صدای یکنواخت شهر ، خیابان ، رستوران و غیره که در پس زمینه آنها اصلی ترین اقدام صورت می گیرد. صداهایی از این نوع جریان بسیار زیادی از اطلاعات را فراهم می کند که باید کد شوند ، و الگوریتم باید چیزی را در مواد اصلی قربانی کند.
جلوه های استریو غیر طبیعی قوی. اما ، این به نکته قبلی اشاره دارد ، اما در هر صورت - مقدار زیادی از جریان به کانال تفاوت می رود ، و کدگذاری کانال مرکزی بسیار تخریب می شود.
اعوجاج فاز قوی ، متفاوت برای کانال های مختلف. در اصل ، این بیشتر به کاستی های الگوریتم های رمزگذاری رایج در حال حاضر اشاره دارد تا به استاندارد ، اما هنوز. وحشی ترین تحریف ها به دلیل اختلال کامل در کل فرایند شروع می شود. در بیشتر موارد ، چنین اعوجاج هایی از فونوگرام اصلی به دلیل ضبط بر روی تجهیزات کاست و دیجیتالی شدن بعدی ایجاد می شود ، به ویژه هنگام بازی با ضبط صوت ارزان قیمت با معکوس با کیفیت پایین. سرها کج هستند ، نوار به صورت مایل زخمی شده و کانال ها نسبت به دیگری کمی تاخیر دارند.
این فقط ضبط بیش از حد بار است. به طور کلی ، یک ارکستر سمفونیک بزرگ به طور همزمان می نوازد :). معمولاً ، در نتیجه فشرده سازی با سرعت 128 کیلوبیت بر ثانیه ، چیزی کاملاً شماتیک به دست می آید - محفظه ، مس ، سازهای کوبه ای ، تکنواز. البته نه تنها در آثار کلاسیک.

قطب دیگر چیزی است که معمولاً بسیار خوب فشرده می شود:

ساز تکنوازی با نسبتا صدای ساده- گیتار ، پیانو. به عنوان مثال ، یک ویولن طیف کاملی دارد و معمولاً صدای خیلی خوبی ندارد. خود کار در واقع به ویولونیست بستگی دارد. چندین ساز معمولاً کاملاً فشرده می شوند - برای مثال ، برد یا PCB (ساز + صدا).
تولید موسیقی مدرن با کیفیت بالا. این به معنای کیفیت موسیقی نیست ، بلکه کیفیت صدا است - میکس ، تنظیم سازها ، عدم وجود مطلق جلوه های پیچیده جهانی که صداها را تزئین می کند و به طور کلی هر چیز اضافی. به عنوان مثال ، همه موسیقی پاپ مدرن به راحتی در این دسته قرار می گیرند ، و برخی از راک ها و به طور کلی خیلی چیزها.
موسیقی تهاجمی ، "گیتار الکتریک". خوب ، برای مثال - متالیکای اولیه (و به طور کلی مدرن نیز). [به یاد داشته باشید ، این در مورد سبک های موسیقی نیست! فقط یک مثال.]

شایان ذکر است که فشرده سازی لایه 3 تقریبا تحت تأثیر پارامترهایی مانند وجود / عدم وجود فرکانس های بالا ، باس ، رنگ کسل کننده / صوتی و غیره قرار نمی گیرد. وابستگی وجود دارد ، اما آنقدر ضعیف است که نمی توانید آن را در نظر بگیرید.

متأسفانه (یا خوشبختانه؟) ، موضوع بر عهده خود شخص است. بسیاری از افراد ، بدون آماده سازی و تخصیص اولیه ، تفاوت بین جریانهای حدود 128 کیلوبیت بر ثانیه و نسخه اصلی را می شنوند ، اما بسیاری از نمونه های مصنوعی ، آن را به عنوان تفاوت نمی شناسند. اولی نیازی به قانع شدن در هیچ چیزی ندارد ، دومی با چنین نمونه هایی نمی توان قانع شد ... به سادگی می توان گفت که کسی تفاوت دارد ، و کسی ، اگر نه برای یک چیز: در روند گوش دادن به موسیقی ، با گذشت زمان ، تصور ما این است که همه چیز زمان بهتر می شود. آنچه به نظر می رسید کیفیت خوبدیروز ، فردا ممکن است اینطور به نظر نرسد - همیشه اتفاق می افتد. و اگر فشرده سازی با سرعت 320 کیلوبیت بر ثانیه در مقایسه با 256 کیلوبیت بر ثانیه بیهوده است (حداقل به نظر من) - افزایش دیگر بسیار مهم نیست ، اگرچه قابل درک است ، اما ذخیره موسیقی با حداقل 256 کیلوبیت بر ثانیه هنوز هم ارزش آن را دارد.

در این مقاله ، ما در مورد تنظیمات کدگذاری صدا که بر کیفیت صدا تأثیر می گذارد صحبت می کنیم. درک تنظیمات تبدیل به شما کمک می کند مناسب ترین گزینه رمزگذاری صدا را از نظر نسبت اندازه فایل به کیفیت صدا انتخاب کنید.

بیت ریت چیست؟

نرخ بیت مقدار داده در واحد زمان است که برای انتقال جریان صوتی استفاده می شود. به عنوان مثال ، نرخ بیت 128 کیلوبیت بر ثانیه معادل 128 کیلوبیت بر ثانیه است و به این معنی است که 128 هزار بیت برای رمزگذاری یک ثانیه صدا (1 بایت = 8 بیت) استفاده می شود. اگر این مقدار را به کیلوبایت ترجمه کنیم ، معلوم می شود که یک ثانیه صدا حدود 16 کیلوبایت طول می کشد.

بنابراین ، هرچه نرخ بیت آهنگ بیشتر باشد ، فضای بیشتری در رایانه شما اشغال می شود. اما در عین حال ، در چارچوب یک فرمت ، نرخ بیت بالاتر به شما امکان می دهد صدا را با کیفیت بالاتر ضبط کنید. به عنوان مثال ، اگر صوت-سی دی را به mp3 تبدیل کنید ، در نرخ بیت 256 کیلوبیت بر ثانیه ، کیفیت صدا بسیار بالاتر از نرخ بیت 64 کیلوبیت بر ثانیه خواهد بود.

از آنجا که در حال حاضر فضای دیسک بسیار ارزان شده است ، توصیه می کنیم تبدیل به mp3 را با نرخ بیت حداقل 192 کیلوبیت بر ثانیه انجام دهید.

همچنین بین نرخ بیت ثابت و متغیر تفاوت قائل شوید.

تفاوت نرخ بیت ثابت (CBR) از متغیر (VBR)

با نرخ بیت ثابت ، از تعداد واحد بیت برای کدگذاری تمام بخش های صدا استفاده می شود. اما ساختار صدا معمولاً متفاوت است و به عنوان مثال ، رمزگذاری سکوت به میزان قابل توجهی بیت های بیشتری نسبت به رمزگذاری صدای غنی نیاز دارد. نرخ بیت متغیر ، بر خلاف ثابت ، بسته به پیچیدگی صدا در فواصل معین ، کیفیت رمزگذاری را به طور خودکار تنظیم می کند. یعنی برای بخشهایی که از نظر کد نویسی ساده هستند ، از نرخ بیت پایین تری استفاده می شود و برای بخشهای پیچیده از مقدار بالاتری استفاده می شود. استفاده از نرخ بیت متغیر به شما امکان می دهد با حجم فایل کوچکتر به کیفیت صدای بالاتری برسید.

نرخ نمونه گیری چیست؟

این مفهوم هنگام تغییر شکل می گیرد سیگنال آنالوگدر دیجیتال و به معنی تعداد نمونه (اندازه گیری سطح سیگنال) در ثانیه است که برای تبدیل سیگنال انجام می شود.

تعداد کانالهای مسئول چیست؟

یک کانال برای کدگذاری صدا یک جریان صوتی مستقل است. مونو - یک جریان ، استریو - دو جریان. مخفف n.m اغلب برای نشان دادن تعداد کانالها استفاده می شود ، جایی که n تعداد کانالهای صوتی کامل است و m تعداد کانالهای فرکانس پایین است (به عنوان مثال ، 5.1).

آیا تا به حال به این فکر کرده اید که وقتی از حالت فشرده سازی بدون ضبط به mp3 128 کیلوبیت بر ثانیه یا 320 کیلوبیت بر ثانیه فشرده می شود دقیقاً چه چیزی از بین می رود؟
من بررسی کردم و نتیجه جالب به نظر می رسید. اول از همه ، من پیشنهاد می کنم یک نظرسنجی انجام دهید تا خودتان بفهمید که آیا اصلا تفاوت را می شنوید. اگر از آنچه می شنوید مطمئن نیستید یا مطمئن هستید که نمی شنوید ، من یک ایده ساده و زیبا را به شما توجه می کنم: شما باید دو موج صوتی را بگیرید که یکی از آنها در مرحله اول است ، با پیشانی خود برخورد کنید. به ترتیب ، هنگامی که دو آهنگ را مخلوط می کنید ، عمدتا چیزی را می شنوید که خاموش نشده است. من هنوز گرافیک جالبی قول نمی دهم ، اما در سیستم خود شما قادر خواهید بود بشنوید که دقیقا چه صداهایی هنگام فشرده سازی از flac به mp3 128 \ 320 kbps از بین رفته اند ، بایگانی با مثال هایی در انتهای مقاله.