كيفية تحويل 320 كيلوبت إلى 192. ما هي معدلات البت؟ كيف تؤثر على جودة الموسيقى والفيديو؟ معدل البت الأمثل لأنماط الموسيقى المختلفة

08.03.2019
هل سبق لك أن تساءلت ما الذي يتم فقده بالضبط عند الضغط من صيغة mp3 بدون فقدان البيانات بسرعة 128 كيلوبت في الثانية أو 320 كيلوبت في الثانية؟
لقد راجعت وبدت النتيجة مثيرة للاهتمام. أولاً، أقترح عليك إجراء استطلاع لتفهم بنفسك ما إذا كنت تسمع فرقًا على الإطلاق. إذا لم تكن متأكدًا مما تسمعه أو كنت متأكدًا من أنك لا تسمعه، فأنا أوجه انتباهك إلى فكرة بسيطة وأنيقة: عليك أن تأخذ اثنتين موجات صوتيةأحدهما سيكون في الطور المضاد، على التوالي، عند مزج مقطعين، ما سيتم سماعه في الغالب هو ما لا ينطفئ. لا أعدك برسوم بيانية مثيرة للاهتمام حتى الآن، ولكن يمكنك أن تسمع بنفسك على نظامك الأصوات التي فقدت أثناء الضغط من flac إلى mp3 بسرعة 128\320 كيلوبت في الثانية، وأرشفتها مع الأمثلة في نهاية المقالة.
استطلاع
تحتاج إلى تنزيل والاستماع إلى 12 مسارًا مدة كل منها 30 ثانية. ثم قم بالإشارة لكل أغنية من الأغاني الأربع إلى واحد من الخيارات الثلاثة (128 كيلو بايت في الثانية، 320 كيلو بايت في الثانية أو بدون خسارة).
الاستطلاع مجهول، ولكن يمكنك تحديد تجزئة فريدة وإخباري بها، أو، كملاذ أخير، نشر رأيك هنا، ولكن تأكد من استخدام المفسد. سيستمر الاستطلاع حتى 25 فبراير، وبعد ذلك سأقوم بنشر المفتاح والإحصائيات.
الملفات الموجودة على قرص Yandex، والنسخة المتطابقة على Dropbox (~80 ميجابايت).
البيانات الأولية
The Black Keys - Everlasting Light (flac، 44100 هرتز، 24 بت، 1613 كيلوبت في الثانية)، متاح على موقع YouTube.
Ludovico Einaudi - Drop (flac، 96000 هرتز، 24 بت، 2354 كيلوبت في الثانية)، متاح على Yandex Music.
سي سي كوليتي - روك ولفة(flac، 192000 هرتز، 24 بت، 4845 كيلوبت في الثانية)، متاح على موقع YouTube.
Annihilator - حركة فائقة (flac، 44100 هرتز، 16 بت، 1022 كيلوبت في الثانية)، متاحة في موقع YouTube.
خيارات تحويل mp3
44.1 كيلو هرتز، استريو، 128 كيلو بايت في الثانية أو 320 كيلو بايت في الثانية
وصف التجربة
يتم تقطيع الملفات المصدر إلى أجزاء مدة كل منها 10 ثوانٍ، ويتم تصدير كل قطعة إلى ملف wav. بعد استيراد المسارات الناتجة، تتم إضافة ثانيتين من الصمت وإشارة نغمة ثانية إلى بداية كل منهما، ثم يتم تحويلها إلى mp3. بعد استيراد ملفات mp3، اتضح أنه بالنسبة للملف الأصلي، فإن الملف الناتج قد "تم تقديمه". هذا ليس خطأ، إنه . نقوم بالمزامنة فيما يتعلق بإشارة نغمة معينة من الأصل (لقد جربت عدة قيم لكل ملف mp3، والتي قمت بعد ذلك بتحسينها أفضل نتيجة) ، نتخلص من إشارة النغمة ونصمت ونصدر المسارات الناتجة إلى wav. الآن كل ما تبقى هو عكس المسارات للحصول على قمم متعددة الاتجاهات ومزجها مع الأصل.
نتيجة
لن أكتشف أمريكا.. نعم هناك فرق. نعم، خاصة عند ضغطها إلى 128 كيلو بايت في الثانية. نعم، ذلك يعتمد على الموسيقى. نعم، حتى أكثر من مسار الصوت.
يمكنك استخلاص استنتاجك الخاص وسماع الفرق عن طريق تنزيل الملفات على

يشار إلى معدل البت كأحد الخصائص الرئيسية لتسجيلات الفيديو والصوت. اعتاد معظم المستخدمين على الاعتقاد بأن جودة الملف الذي تم تنزيله تحدده. ولكن ما هي معدلات البت وكيف تتميز في الواقع؟ ملفات الموسيقىومقاطع الفيديو؟ دعونا ننظر إلى هذا بمزيد من التفصيل.

ما هي معدلات البت؟

معدل البت هو قيمة تعرض عدد وحدات المعلومات (ميغابت أو كيلوبت) الموجودة في ثانية واحدة من تشغيل الملف. وفقًا لذلك، يتم قياسها بالميغابت في الثانية (Mbps) أو بالكيلوبت في الثانية (Kbps). وبخلاف ذلك، يمكن وصف معدل البت بأنه عرض النطاق الترددي. تعتبر هذه الخاصية مهمة بالنسبة لأولئك الذين يرغبون في تحويل الملفات، لأنه، في نفس المدة، سيؤدي معدل البت الأعلى إلى ملف أكبر. بالإضافة إلى الحجم، تتغير جودة الصوت أيضًا. يُطلق على تقليل الحجم مع انخفاض معدل البت اسم الضغط.

ملف الموسيقى الشائع هو ملف صوتي تم ضغطه إلى الحد الذي يمكن معه القرص القياسييحمل ما يصل إلى 12 ساعة من الموسيقى. في الوقت نفسه، تظل الجودة عالية جدًا بفضل الضغط النفسي الصوتي: تتم إزالة الأصوات ذات الترددات ومستويات الصوت التي لا تلتقطها الأذن البشرية من النطاق بأكمله. يتم تشكيل الأصوات المحددة في كتل منفصلة تسمى الإطارات. الإطارات لها نفس مدة الصوت ويتم ضغطها وفقًا لـ خوارزمية معينة. عند تشغيل الموسيقى، يتم إعادة إنشاء الإشارة من الكتل التي تم فك تشفيرها بتسلسل محدد.

ما هو الضغط الشائع الاستخدام؟

غالبًا ما يكون معدل البت الصوتي 256 كيلوبت في الثانية. عند هذه القيمة، يتم ضغط التسجيل الصوتي بحوالي 6 أضعاف الحجم، مما يسمح لك بتسجيل موسيقى أكثر بـ 6 مرات على قرص واحد مما كان عليه قبل الضغط. إذا تم تخفيض معدل البت إلى 128 كيلوبت في الثانية، فسيتسع قرص واحد لموسيقى أكثر 12 مرة، ولكن جودة الصوت ستكون أقل بشكل ملحوظ. غالبًا ما يتم عرض الموسيقى المسجلة بجودة 128 كيلوبت في الثانية للاستماع إليها على الإنترنت، لأنه في السعي لزيادة سرعة تحميل الصفحة، يقدم أصحاب الموارد أي تضحيات. يلاحظ العديد من المستخدمين أن جودته بعيدة عن المثالية.

الآن وقد أصبح من الواضح ما هي معدلات البت، فقد حان الوقت لتحديد مستواها الأمثل. يناقش كل من الهواة والمحترفين إلى ما لا نهاية كيفية تأثير معدل البت على جودة الصوت، هذا إن كان يؤثر على الإطلاق. على ألبومات الموسيقىكقاعدة عامة، يشار إلى معدل البت. نفس القرص المسجل بسرعة 128 كيلوبت/ثانية و256 كيلوبت/ثانية سيكون مكلفًا مرتين.

معدل البت الأمثل في ظل ظروف الاستماع المختلفة

بالنسبة للعديد من الأشخاص، لا يشكل الضغط بمعدل 12x أي ضرر، بينما يدعي آخرون أنهم لا يستطيعون الاستماع إلى الموسيقى بمعدل بت أقل من 320 كيلوبت في الثانية. ومن المفارقة أن كلاهما على حق. الحقيقة هي أن جودة التشغيل في النهاية لا تعتمد على ظروف التشغيل بل على نوع الموسيقى.

على سبيل المثال، يتم تشغيل أغنية على جهاز تسجيل مثبت في سيارة محلية. في هذه الحالة، ستكون الجودة بسرعة 192 كيلوبت في الثانية كافية تمامًا. سيؤدي معدل البت الأعلى إلى تحسين جودة الصوت، لكن الفرق لن يكون ملحوظًا بسبب ارتفاع مستوى الضوضاء أثناء الرحلة. إذا تم تشغيل الموسيقى الكمبيوتر المنزليأو لاعب محمول، ثم يلزم وجود 256 كيلوبت في الثانية على الأقل. إذا لم تخضع الإشارة للتغييرات، يتم إرسالها إلى الأجهزة الخارجيةويتم إخراجه إلى مكبرات صوت مستوردة باهظة الثمن، فيجب عليك اللجوء إلى الحد الأدنى من الضغط كلما أمكن ذلك. من الممكن بمعدل بت يبلغ 320 كيلوبت في الثانية.

معدل البت الأمثل لأنماط الموسيقى المختلفة

ليست هناك حاجة دائمًا إلى الموسيقى ذات معدل البت العالي. عادةً ما تبدو الموسيقى الشعبية جيدة جدًا بمعدل بت يتراوح بين 192 و256 كيلوبت في الثانية. أكثر جودة عاليةيمكنك تثبيته، ولكن لا فائدة من القيام بذلك: أغاني البوب ​​لا تدوم طويلا، لذا يجب أن يكون توفير مساحة القرص أولوية. بالإضافة إلى ذلك، فإن جودة التسجيلات المصدر هي أيضًا متواضعة، لذا فإن زيادة معدل البت قد لا يؤثر على جودة الملف الذي يتم تشغيله. للاستماع في وسائل النقل وفي الحفلات غير الرسمية، فإن الجودة المتوسطة كافية تمامًا.

لو نحن نتحدث عنحول الموسيقى الكلاسيكية أو أعمال فرق الروك الأسطورية أو الأغاني الأصلية النادرة، فيجب أن تكون الجودة قبل كل شيء. عند شراء مثل هذه الموسيقى، يجب عليك إلقاء نظرة على معدل البت الموضح على عبوة القرص. إذا تم تنزيل الأغنية من الإنترنت، فيجب أن تكون هذه المعلومات موجودة على صفحة التنزيل. بالإضافة إلى ذلك، يتم عرض معدل البت في المشغل أثناء التشغيل.

معدلات البت لملفات الفيديو

لقد ناقشنا أعلاه ما هي معدلات البت للتسجيلات الصوتية. ولكن ما هو معدل البت للفيديو؟ وبالنظر إلى أنه يتم تشغيل الفيديو كسلسلة من الأصوات والصور، فإن تعريف معدل البت سيكون مشابهًا. إن وجود الفيديو يجعل الملف أثقل، لكن الصور الخاصة بالمعالج في النهاية هي نفس الأصفار والواحدات مثل الأصوات. مبدأ تشفير المعلومات هو نفسه لجميع أنواع الملفات.

فضح الأساطير الشعبية حول الصوت الرقمي.

2017-10-01T15:27

2017-10-01T15:27

برامج عشاق الموسيقى

ملحوظة: لفهم النص أدناه بشكل أفضل، أوصي بشدة بالتعرف على أساسيات الصوت الرقمي.

كما أن العديد من النقاط المثارة أدناه تمت تغطيتها في منشوري "مرة أخرى عن الحقيقة المحزنة: من أين يأتي الصوت الجيد في الواقع؟" .

كلما زاد معدل البت، كانت جودة المسار أفضل.

هذا ليس هو الحال دائما. أولاً، دعني أذكرك ما هو bitray ت(معدل البت، وليس bitraid). هذا هو في الواقع معدل البيانات بالكيلوبت في الثانية أثناء التشغيل. وهذا يعني أننا إذا أخذنا حجم المسار بالكيلوبت وقسمناه على مدته بالثواني، فسنحصل على معدل البت الخاص به - ما يسمى. معدل البت المستند إلى الملف (FBR)، عادةً لا يختلف كثيرًا عن معدل البت الخاص بدفق الصوت (سبب الاختلافات هو وجود بيانات التعريف في المسار - العلامات والصور "المضمنة" وما إلى ذلك).

لنأخذ الآن مثالاً: يتم حساب معدل البت لصوت PCM غير المضغوط المسجل على قرص صوتي مضغوط عادي بالطريقة الآتية: 2 (قنوات) × 16 (بت لكل عينة) × 44100 (عينات في الثانية) = 1411200 (بت في الثانية) = 1411.2 كيلوبت في الثانية. لنأخذ الآن المسار ونضغطه باستخدام أي برنامج ترميز بدون فقدان البيانات ("بدون فقدان البيانات" - "بدون فقدان البيانات"، أي برنامج لا يؤدي إلى فقدان أي معلومات)، على سبيل المثال برنامج الترميز FLAC. نتيجة لذلك، سنحصل على معدل بت أقل من الأصل، لكن الجودة ستبقى دون تغيير - هنا هو دحضك الأول.

هناك شيء آخر يستحق الإضافة هنا. يمكن أن يكون معدل البت الناتج مع الضغط بدون فقدان مختلفًا تمامًا (ولكنه، كقاعدة عامة، يكون أقل من صوت غير مضغوط) - يعتمد هذا على مدى تعقيد الإشارة المضغوطة، أو بشكل أكثر دقة على تكرار البيانات. وهكذا أكثر إشارات بسيطةسيتم ضغطها بشكل أفضل (أي لدينا حجم ملف أصغر وبنفس المدة => معدل بت أقل)، وستكون الملفات الأكثر تعقيدًا أسوأ. هذا هو السبب في أن الموسيقى الكلاسيكية غير المفقودة لديها معدل بت أقل من موسيقى الروك على سبيل المثال. ولكن يجب التأكيد على أن معدل البت هنا ليس بأي حال من الأحوال مؤشراً على جودة المادة الصوتية.

الآن دعونا نتحدث عن الضغط مع فقدان البيانات (مع الخسائر). بادئ ذي بدء، عليك أن تفهم أن هناك العديد من برامج التشفير والتنسيقات المختلفة، وحتى ضمن نفس التنسيق، قد تختلف جودة الترميز لأجهزة التشفير المختلفة (على سبيل المثال، يقوم QuickTime AAC بترميز FAAC القديم بشكل أفضل بكثير)، ناهيك عن ذلك تفوق التنسيقات الحديثة (OGG Vorbis، AAC، Opus) على MP3. ببساطة، من بين مسارين متطابقين تم تشفيرهما بواسطة برامج تشفير مختلفة بنفس معدل البت، سيبدو أحدهما أفضل والآخر سيبدو أسوأ.

وبالإضافة إلى ذلك، هناك شيء من هذا القبيل مغلف. أي أنه يمكنك أخذ مسار بتنسيق MP3 بمعدل بت يبلغ 96 كيلوبت في الثانية وتحويله إلى MP3 بمعدل 320 كيلوبت في الثانية. لن تتحسن الجودة فحسب (بعد كل شيء، لا يمكن إرجاع البيانات المفقودة خلال ترميز 96 كيلوبت/ثانية السابق)، بل ستزداد سوءًا. تجدر الإشارة هنا إلى أنه في كل مرحلة من مراحل التشفير المفقود (مع أي معدل بت وأي برنامج تشفير)، يتم إدخال قدر معين من التشويه في الصوت.

وحتى اكثر. هناك فارق بسيط آخر. على سبيل المثال، إذا كان معدل البت لتدفق صوتي يبلغ 320 كيلوبت في الثانية، فهذا لا يعني أنه تم إنفاق الـ 320 كيلوبت في الثانية بأكملها على تشفير تلك الثانية بالذات. يعد هذا أمرًا نموذجيًا للتشفير بمعدل بت ثابت وللحالات التي يأمل فيها الشخص في الحصول عليها أقصى قدر من الجودة، يفرض معدل بت ثابتًا مرتفعًا جدًا (على سبيل المثال، تعيين 512 كيلوبت في الثانية CBR لـ Nero AAC). وكما هو معروف، يتم تنظيم عدد البتات المخصصة لإطار معين بواسطة نموذج صوتي نفسي. ولكن في الحالة عندما تكون الكمية المخصصة أقل بكثير من معدل البت المحدد، حتى خزان البت لا يحفظ (اقرأ عن المصطلحات الواردة في المقالة "ما هي CBR، ABR، VBR؟") - ونتيجة لذلك، أصبحنا عديمي الفائدة "صفر بتات" والتي ببساطة "تنهي" » حجم الإطار إلى الحجم المطلوب (أي زيادة حجم التدفق إلى الحجم المحدد). بالمناسبة، من السهل التحقق من ذلك - ضغط الملف الناتج باستخدام أرشيفي (يفضل 7Z) وإلقاء نظرة على نسبة الضغط - كلما زاد عدد البتات الصفرية (لأنها تؤدي إلى التكرار)، زادت المساحة المهدرة.

برامج الترميز المفقودة (MP3 وغيرها) قادرة على التعامل مع الموسيقى الإلكترونية الحديثة، ولكنها غير قادرة على تشفير عالي الجودة للموسيقى الكلاسيكية (الأكاديمية)، والموسيقى الحية، والآلات

"سخرية القدر" هنا هي أن كل شيء في الواقع هو عكس ذلك تمامًا. كما هو معروف، تتبع الموسيقى الأكاديمية في الغالبية العظمى من الحالات المبادئ اللحنية والتوافقية، بالإضافة إلى التأليف الآلي. من وجهة نظر رياضية، يؤدي هذا إلى تكوين توافقي بسيط نسبيًا للموسيقى. وبالتالي، فإن هيمنة الحروف الساكنة تنتج عددًا أقل من التوافقيات الثانوية: على سبيل المثال، بالنسبة للخمسة (الفاصل الزمني الذي يختلف فيه الترددات الأساسية للصوتين بمقدار مرة ونصف)، فإن كل توافقية ثانية ستكون مشتركة بين الصوتين ، للرابعة، حيث تختلف الترددات بمقدار الثلث - كل ثلث، وما إلى ذلك. بالإضافة إلى ذلك، فإن وجود نسب تردد ثابتة، بسبب استخدام مزاج متساو، يبسط أيضًا التركيب الطيفي موسيقى كلاسيكية. يحدد التكوين الآلي المفعم بالحيوية للكلاسيكيات غياب الضوضاء المميزة لها موسيقى الكترونيةوالتشويه والقفزات الحادة في السعة وكذلك عدم وجود مكونات زائدة عالية التردد.

تؤدي العوامل المذكورة أعلاه إلى حقيقة أن ضغط الموسيقى الكلاسيكية أسهل بكثير، أولاً وقبل كل شيء، من الناحية الرياضية البحتة. إذا كنت تتذكر، فإن الضغط الرياضي يعمل عن طريق القضاء على التكرار (وصف أجزاء مماثلة من المعلومات باستخدام عدد أقل من البتات) وأيضًا عن طريق إجراء تنبؤات (ويعرف أيضًا باسم. تنبؤاتالتنبؤ بسلوك الإشارة ومن ثم يتم تشفير الانحراف فقط إشارة حقيقيةمن المتوقع - كلما كانت المطابقة أكثر دقة، قل عدد البتات المطلوبة للتشفير). في في هذه الحالةيحدد التركيب والانسجام الطيفي البسيط نسبيًا التكرار العالي، الذي يوفر التخلص منه درجة كبيرة من الضغط، ويحدد العدد الصغير من مكونات الدفقات والضوضاء (وهي إشارات عشوائية وغير متوقعة) القدرة على التنبؤ الرياضي الجيد للغالبية العظمى من المعلومات. وأنا لا أتحدث حتى عن متوسط ​​\u200b\u200bالحجم المنخفض نسبيًا للمسارات الكلاسيكية وفترات الصمت المتكررة التي لا تتطلب أي معلومات تقريبًا لتشفيرها. نتيجة لذلك، يمكننا ضغط بعض موسيقى الآلات المنفردة دون فقدان البيانات، على سبيل المثال، بمعدلات بت أقل من 320 كيلوبت في الثانية (أجهزة التشفير TAK وOFR قادرة تمامًا على ذلك).

لذا، أولاً، الحقيقة هي أن الضغط الرياضي الكامن وراء التشفير غير المفقود هو أيضًا إحدى مراحل التشفير المفقود (اقرأ فهم تشفير MP3). وثانيًا، نظرًا لأن الفقد يستخدم تحويل فورييه (تحليل الإشارة إلى توافقيات)، فإن بساطة التركيب الطيفي تجعل عمل المشفر أسهل بشكل مضاعف. ونتيجة لذلك، عند مقارنة عينات الموسيقى الكلاسيكية الأصلية والمشفرة في اختبار أعمى، نتفاجأ عندما نجد أنه لا يمكننا العثور على أي اختلافات، حتى عند معدل بت منخفض نسبيًا. والشيء المضحك هو أنه عندما نبدأ في تقليل معدل البت للتشفير تمامًا، فإن أول ما يكشف عن الاختلافات هو ضجيج في الخلفيةفي التسجيل.

أما بالنسبة للموسيقى الإلكترونية، فإن المبرمجين يواجهون صعوبة بالغة في التعامل معها: فمكونات الضوضاء لديها الحد الأدنى من التكرار، ومع القفزات الحادة (نوع من نبضات مسننة) فهي إشارات لا يمكن التنبؤ بها على الإطلاق (بالنسبة للمبرمجين "المصممين" للأصوات الطبيعية التي تتصرف بخلاف ذلك تمامًا)، يؤدي تحويل فورييه المباشر والعكسي مع رفض التوافقيات الفردية بواسطة النموذج الصوتي النفسي إلى إنتاج تأثيرات ما قبل وما بعد الصدى، والتي ليس من السهل دائمًا على المشفر تقييم سماعها... أضف إلى هذا مستوى عالمكونات التردد العالي - وتحصل عليه عدد كبير منعينات قاتلة، والتي حتى أجهزة التشفير الأكثر تقدمًا لا يمكنها التعامل معها بمعدلات بت متوسطة إلى منخفضة، بشكل غريب بما فيه الكفاية، خاصة بين الموسيقى الإلكترونية.

من الممتع أيضًا آراء "المستمعين ذوي الخبرة" والموسيقيين الذين، مع الافتقار التام لفهم مبادئ التشفير الفقداني، بدأوا في الادعاء بأنهم يسمعون كيف تبدأ الآلات الموسيقية في الموسيقى بعد الترميز في الخروج عن النغمة، وتطفو الترددات ، وما إلى ذلك. ربما لا يزال هذا صحيحًا بالنسبة لمشغلات الكاسيت التي تعود إلى ما قبل الطوفان والمزودة بميزة التفجير، ولكن في صوت رقميكل شيء دقيق: يبقى مكون التردد أو يتم التخلص منه؛ ببساطة ليست هناك حاجة لتغيير النغمة هنا. علاوة على ذلك: إن وجود أذن موسيقية لدى الشخص لا يعني على الإطلاق أنه يتمتع بسماع ترددي جيد (على سبيل المثال، القدرة على إدراك الترددات > 16 كيلو هرتز، والتي تختفي مع تقدم العمر) ولا يسهل عليه على الإطلاق سماع الموسيقى. ابحث عن عناصر الترميز المفقودة، نظرًا لأن التشويه لها طابع محدد للغاية وتتطلب تجربة المقارنة العمياء للصوت المفقود - فأنت بحاجة إلى معرفة ماذا وأين تبحث.

يبدو DVD-Audio أفضل من الصوت المضغوط (24 بت مقابل 16، 96 كيلو هرتز مقابل 44.1، إلخ.)

لسوء الحظ، عادة ما ينظر الناس فقط إلى الأرقام ونادرا ما يفكرون في تأثير معلمة معينة على الجودة الموضوعية.

دعونا نفكر أولاً في عمق البت. هذه المعلمة ليست مسؤولة عن أكثر من النطاق الديناميكي، أي للفرق بين الأصوات الأكثر هدوءًا وأعلى (بالديسيبل). في الصوت الرقمي أعلى مستوى ممكن- هذا هو 0 dBFS (FS - النطاق الكامل)، والحد الأدنى يقتصر على مستوى الضوضاء، أي، في الواقع، النطاق الديناميكي في القيمة المطلقة يساوي مستوى الضوضاء. بالنسبة للصوت 16 بت، يتم حساب النطاق الديناميكي على أنه 20 × log 10 2 16، وهو ما يساوي 96.33 vB. في الوقت نفسه، يصل النطاق الديناميكي لأوركسترا السمفونية إلى 75 ديسيبل (معظمه حوالي 40-50 ديسيبل).

الآن دعونا نتخيل ظروف حقيقية. يبلغ مستوى الضوضاء في الغرفة حوالي 40 ديسيبل (لا تنس أن ديسيبل هي قيمة نسبية. وفي هذه الحالة، يتم اعتبار عتبة السمع 0 ديسيبل)، الحد الأقصى للحجمتصل الموسيقى إلى 110 ديسيبل (حتى لا يكون هناك أي إزعاج) - نحصل على فرق قدره 70 ديسيبل. وبالتالي، اتضح أن النطاق الديناميكي الذي يزيد عن 70 ديسيبل في هذه الحالة هو ببساطة عديم الفائدة. وهذا هو، مع نطاق أعلى أو الأصوات العاليةسوف تصل إلى عتبة الألم، أو أصوات هادئةسيتم امتصاصها من خلال الضوضاء المحيطة. من الصعب جدًا تحقيق مستوى ضوضاء محيطة أقل من 15 ديسيبل (نظرًا لأن حجم التنفس البشري والضوضاء الأخرى الناجمة عن فسيولوجيا الإنسان تقع عند هذا المستوى)، ونتيجة لذلك، يتم الحصول على نطاق 95 ديسيبل للاستماع إلى الموسيقى أن تكون كافية تماما.

الآن عن تردد أخذ العينات (تكرار أخذ العينات، معدل العينة). تتحكم هذه المعلمة في تردد أخذ العينات الزمني وتؤثر بشكل مباشر على الحد الأقصى لتردد الإشارة الذي يمكن وصفه بواسطة تمثيل صوتي معين. ووفقا لنظرية كوتيلنيكوف، فإنه يساوي نصف تردد أخذ العينات. أي لتردد أخذ العينات الطبيعي 44100 هرتز الحد الأقصى للترددمكونات الإشارة - 22050 هرتز. الحد الأقصى للتردد. الذي تدركه الأذن البشرية أعلى بقليل من 20.000 هرتز (ثم عند الولادة، ومع تقدمنا ​​في السن، تنخفض العتبة إلى 16.000 هرتز).

أفضل شيء هذا الموضوعتمت تغطيته في تنزيلات المادة 24/192 - لماذا لا معنى لها.

تبدو مشغلات البرامج المختلفة مختلفة (على سبيل المثال، foobar2000 أفضل من Winamp، وما إلى ذلك)

لكي نفهم لماذا ليس الأمر كذلك، علينا أن نفهم ما هو عليه لاعب البرمجيات. في الأساس، هذا عبارة عن وحدة فك ترميز، ومعالجات (اختيارية)، ومكون إضافي للإخراج (لإحدى الواجهات: ASIO، وDirectSound، وWASAPI، وما إلى ذلك)، وبالطبع واجهة المستخدم الرسومية (واجهة المستخدم الرسومية). لأنه في 99.9% من الحالات يعمل جهاز فك التشفير وفقًا لذلك خوارزمية قياسية، والمكون الإضافي للإخراج هو مجرد جزء من البرنامج الذي ينقل الدفق إلى بطاقة الصوت من خلال إحدى الواجهات، وعندها فقط يمكن للمعالجات أن تسبب الاختلافات. ولكن الحقيقة هي أن المعالجات يتم تعطيلها عادةً بشكل افتراضي (أو يجب تعطيلها، نظرًا لأن الشيء الرئيسي لـ لاعب جيد- تكون قادرة على نقل الصوت في شكله "الأصلي"). ونتيجة لذلك، فإن الموضوع الوحيد للمقارنة هنا يمكن أن يكون الاحتمالاتالمعالجة والإخراج، والتي، بالمناسبة، في كثير من الأحيان ليست ضرورية على الإطلاق. ولكن حتى لو كانت هناك مثل هذه الحاجة، فهذه مقارنة بين المعالجات، وليس اللاعبين.

إصدارات برامج التشغيل المختلفة تبدو مختلفة

يعتمد هذا البيان على الجهل العادي بمبادئ تشغيل بطاقة الصوت. السائق هو برمجةمطلوب ل التفاعل الفعالالأجهزة ذات نظام التشغيل، والذي يوفر أيضًا عادةً واجهة مستخدم رسومية للسماح لك بإدارة الجهاز وإعداداته وما إلى ذلك. ويضمن برنامج تشغيل بطاقة الصوت التعرف على بطاقة الصوت كبطاقة صوت أجهزة ويندوز، يُعلم نظام التشغيل بالتنسيقات التي تدعمها البطاقة، ويضمن نقل دفق PCM غير مضغوط (في معظم الحالات) إلى البطاقة، كما يتيح الوصول إلى الإعدادات. بالإضافة إلى ذلك، إذا كانت هناك معالجة برمجية (باستخدام أدوات وحدة المعالجة المركزية)، فقد يحتوي برنامج التشغيل على DSPs (معالجات) مختلفة. لذلك، أولاً، مع تعطيل التأثيرات والمعالجة، إذا لم يوفر برنامج التشغيل إرسال PCM دقيقًا إلى البطاقة، فهذا يعتبر خطأً فادحًا، علة حرجة. وهذا يحدث نادرًا. من ناحية أخرى، قد تكون الاختلافات بين برامج التشغيل في تحديث خوارزميات المعالجة (أجهزة إعادة التشكيل، والتأثيرات)، على الرغم من أن هذا لا يحدث كثيرًا أيضًا. علاوة على ذلك، لتحقيق اعلى جودةيجب استبعاد التأثيرات وأي معالجة لبرنامج التشغيل.

وبالتالي، تركز تحديثات برنامج التشغيل بشكل أساسي على تحسين الاستقرار والقضاء على أخطاء المعالجة. لا يؤثر أي منهما ولا الآخر في حالتنا على جودة التشغيل، لذلك في 999 حالة من أصل 1000، لا يؤثر برنامج التشغيل على الصوت.

تبدو الأقراص الصوتية المضغوطة المرخصة أفضل من نسخها

إذا لم تحدث أخطاء (فادحة) في القراءة/الكتابة أثناء النسخ و محرك الأقراص الضوئيةالجهاز الذي سيتم تشغيل قرص النسخ عليه، فلا توجد مشاكل في قراءته، فمثل هذا البيان خاطئ ويمكن دحضه بسهولة.

يوفر وضع تشفير الاستريو جودة أفضل من وضع Joint Stereo

يتعلق هذا المفهوم الخاطئ بشكل رئيسي بملفات LAME MP3، نظرًا لأن جميع برامج التشفير الحديثة (AAC، Vorbis، Musepack) تستخدم فقطوضع الاستريو المشترك (وهذا يقول شيئًا بالفعل)

في البداية، تجدر الإشارة إلى أنه تم استخدام وضع الاستريو المشترك بنجاح مع الضغط بدون فقدان. يكمن جوهرها في حقيقة أنه قبل تشفير الإشارة تتحلل إلى مجموع القنوات اليمنى واليسرى (منتصف) والفرق بينهما (جانبي)، ثم ترميز منفصلهذه الإشارات. في الحد (لنفس المعلومات في القنوات اليمنى واليسرى)، يتم الحصول على وفورات بيانات مزدوجة. وبما أن المعلومات الموجودة في القنوات اليمنى واليسرى متشابهة تمامًا في معظم الموسيقى، فقد تبين أن هذه الطريقة فعالة للغاية وتتيح لك زيادة نسبة الضغط بشكل كبير.

في الخسارة المبدأ هو نفسه. ولكن هنا، في وضع معدل البت الثابت، ستزداد جودة الأجزاء التي تحتوي على معلومات مماثلة في قناتين (في الحد المزدوج)، وبالنسبة لوضع VBR في مثل هذه الأماكن، سينخفض ​​معدل البت ببساطة (لا تنس ذلك المهمة الرئيسيةوضع VBR - يحافظ بشكل ثابت على جودة ترميز معينة باستخدام أقل معدل بت ممكن). نظرًا لأنه أثناء التشفير المنقوص، تُعطى الأولوية (عند توزيع البتات) لمجموع القنوات، لتجنب تدهور بانوراما الاستريو، والتبديل الديناميكي بين الاستريو المشترك (منتصف/جانبي) والاستريو العادي (يسار/يمين) القائم على الإطار يتم استخدام الأوضاع. بالمناسبة، كان سبب هذا الاعتقاد الخاطئ هو عدم وجود خوارزمية التبديل في الإصدارات القديمة من LAME، وكذلك وجود وضع Forced Joint، حيث لا يوجد تبديل تلقائي. في أحدث الإصداراتيتم تمكين وضع LAME Joint بشكل افتراضي ولا يوصى بتغييره.

كلما كان الطيف أوسع، كانت جودة التسجيل أفضل (فيما يتعلق بالمخططات الطيفية وauCDtect ونطاق التردد)

في الوقت الحاضر، لسوء الحظ، أصبح من الشائع جدًا في المنتديات قياس جودة المسار "باستخدام المسطرة باستخدام المخطط الطيفي". ومن الواضح، وذلك بسبب بساطة هذه الطريقة. ولكن، كما تظهر الممارسة، في الواقع كل شيء أكثر تعقيدا.

وهذا هو الأمر. يوضح المخطط الطيفي بصريًا توزيع قوة الإشارة على الترددات، لكنه لا يستطيع إعطاء صورة كاملة عن صوت التسجيل، ووجود التشوهات والتأثيرات المضغوطة فيه. وهذا يعني أن كل ما يمكن تحديده من خلال المخطط الطيفي هو في الأساس نطاق الترددات(وجزئيًا - كثافة الطيف في منطقة التردد العالي). التي هي في أفضل سيناريو، من خلال تحليل الطيفي، يمكن تحديد المظروف العلوي. إن مقارنة المخططات الطيفية للمسارات التي تم الحصول عليها عن طريق التشفير باستخدام أجهزة تشفير مختلفة مع النسخة الأصلية هو أمر سخيف تمامًا. نعم، يمكنك تحديد الاختلافات في الطيف، ولكن تحديد ما إذا كانت الأذن البشرية ستدركها (وإلى أي مدى) يكاد يكون مستحيلاً. يجب ألا ننسى أن مهمة الترميز المفقود هي ضمان نتيجة لا يمكن تمييزها الأذن البشريةمن الأصل (وليس بالعين).

وينطبق الشيء نفسه على تقييم جودة التشفير من خلال تحليل مسارات الإخراج باستخدام برنامج auCDtect (Audiochecker، auCDtect مدير المهام، Tau Analyzer، fooCDtect هي مجرد أغلفة لبرنامج وحدة التحكم الفريد من نوعه auCDtect). تقوم خوارزمية auCDtect أيضًا بتحليل نطاق التردد وتسمح لك فقط بتحديد (بدرجة معينة من الاحتمال) ما إذا كان ضغط MPEG قد تم تطبيقه في أي من مراحل التشفير. تم تصميم الخوارزمية خصيصًا لملفات MP3، لذلك من السهل "خداعها" بمساعدة برامج الترميز Vorbis وAAC وMusepack، لذلك حتى لو كتب البرنامج "100% CDDA"، فهذا لا يعني أن الصوت المشفر هو 100%. مطابق للأصل.

والعودة مباشرة إلى الأطياف. هناك أيضًا رغبة شائعة بين بعض "المتحمسين" لتعطيل مرشح التردد المنخفض في جهاز التشفير LAME بأي ثمن. هناك نقص واضح في فهم مبادئ الترميز وعلم الصوت النفسي. أولا، الديكورات التشفير ترددات عاليةلغرض واحد فقط - حفظ البيانات واستخدامها لتشفير نطاق التردد الأكثر سماعًا. يمكن أن يكون لنطاق التردد الممتد تأثير فادح على جودة الصوت الإجمالية ويؤدي إلى تشويشات مسموعة في التشفير. علاوة على ذلك، فإن إيقاف تشغيل القطع عند 20 كيلو هرتز غير مبرر على الإطلاق، لأن الشخص ببساطة لا يستطيع سماع الترددات الأعلى.

يوجد إعداد مسبق معين لمعادل الصوت "السحري" يمكنه تحسين الصوت بشكل كبير

هذا ليس صحيحًا تمامًا، أولاً، لأن كل تكوين فردي (سماعات الرأس، الصوتيات، كارت الصوت) له معلماته الخاصة (على وجه الخصوص، خاصية تردد السعة). وبالتالي، يجب أن يكون لكل تكوين نهج فريد خاص به. ببساطة، يوجد مثل هذا الإعداد المسبق للمعادل، لكنه يختلف باختلاف التكوينات. ويكمن جوهرها في ضبط استجابة التردد للمسير، أي في "تسوية" الانخفاضات والارتفاعات غير المرغوب فيها.

أيضًا ، بين الأشخاص البعيدين عن العمل المباشر مع الصوت ، يعد ضبط المعادل الرسومي بـ "علامة التجزئة" أمرًا شائعًا للغاية ، وهو ما يمثل في الواقع زيادة في مستوى المكونات المنخفضة التردد والعالية التردد ، ولكنه يؤدي في نفس الوقت إلى كتم الصوت من الغناء والآلات التي يقع طيفها الصوتي في منطقة التردد المتوسط.

قبل تحويل الموسيقى إلى تنسيق آخر، يجب عليك فك ضغطها إلى WAV

اسمحوا لي أن أشير على الفور إلى أن WAV تعني بيانات PCM (تعديل رمز النبض) في حاوية WAVE (ملف بامتداد *.wav). هذه البيانات ليست أكثر من سلسلة من البتات (الأصفار والآحاد) في مجموعات مكونة من 16 أو 24 أو 32 (اعتمادًا على عمق البت)، يمثل كل منها الكود الثنائيسعة العينة المقابلة (على سبيل المثال، بالنسبة لـ 16 بت بالتدوين العشري، تكون هذه القيم من -32768 إلى +32768).

لذا، فالحقيقة هي أن أي معالج صوت - سواء كان مرشحًا أو برنامج تشفير - يعمل عادةً فقطمع هذه القيم، وهذا هو فقطمع البيانات غير المضغوطة. وهذا يعني أنه يمكنك ببساطة تحويل الصوت من FLAC إلى APE على سبيل المثال ضروريقم أولاً بفك تشفير FLAC إلى PCM، ثم قم بتشفير PCM إلى APE. إنه مثل إعادة حزم الملفات من ZIP إلى RAR، يجب عليك أولاً فك ضغط ZIP.

ومع ذلك، إذا كنت تستخدم محولًا أو مجرد برنامج تشفير متقدم لوحدة التحكم، فإن التحويل الوسيط إلى PCM يحدث سريعًا، وأحيانًا حتى بدون الكتابة إلى مؤقت ملف واف. وهذا ما يضلل الناس: يبدو أن التنسيقات يتم تحويلها مباشرة من واحد إلى آخر، ولكن في الواقع يجب أن يحتوي مثل هذا البرنامج على وحدة فك ترميز تنسيق الإدخال التي تقوم بإجراء تحويل وسيط إلى PCM.

وبالتالي، فإن التحويل يدويًا إلى WAV لن يمنحك شيئًا على الإطلاق سوى مضيعة للوقت.