مایک تورنتون ترمیم و تمیز کردن فایل های صوتی. بازیابی صداهای ضبط شده در منزل. کیفیت صدا بهبود یافته است

فصل 3 بازسازی ضبط های قدیمی

سیستم های کاهش نویز کامپیوتری با کیفیت بالا، ظهور بسیاری از برنامه ها را برای بازیابی صداهای ضبط شده قدیمی امکان پذیر کرده است. سیستم ترمیم فقط کاهش نویز نیست. این مجموعه ای کامل از توابع مکمل است، مانند دکلیکر (حذف کلیک)، سیستمی برای تشخیص و حذف صدای خش خش مشخصه یک رکورد و غیره. یکی از دشوارترین کارها در بازیابی ضبط صدا، حذف غیرخطی است. تحریفات

همانطور که می دانید، ضبط های آرشیوی ذخیره شده بر روی نوارها و صفحات وینیل به مرور زمان کیفیت صدای اصلی خود را از دست می دهند. صداها و تداخل‌های مختلفی روی آن‌ها ظاهر می‌شود که در گوش دادن عادی اختلال ایجاد می‌کند و تصور کلی ضبط را خراب می‌کند. رایج‌ترین نقص‌ها نویز ضربه‌ای (کلیک‌ها) و نویز پس‌زمینه (خش‌خش نوار، نویز هنگام پخش از دیسک وینیل) است که به دلیل شرایط ذخیره‌سازی ضعیف یا کیفیت ناکافی ضبط اصلی ایجاد می‌شود.

با افزایش قدرت رایانه‌های مدرن و ظهور الگوریتم‌های پیچیده‌تر برای پردازش سیگنال‌های صوتی، فرصت بازیابی فونوگرام‌های آرشیوی از طریق پردازش محاسباتی پیچیده سیگنال اصلی با استفاده از رایانه باز شده است. این روش بازیابی صدا بسیار کارآمد و انعطاف پذیر است و به شما امکان می دهد تداخل، کلیک، نویز پس زمینه و سایر نقص های ضبط را از بین ببرید. بدون شک این یکی از مهمترین دستاوردها در زمینه پردازش صوتی کامپیوتری است. مزیت اصلی این روش این است که بر خلاف سیستم های کاهش نویز معمولی که بر اساس اصل فیلتر فرکانس کار می کنند، بازیابی رایانه، طبق گفته توسعه دهندگان برنامه، عملاً هیچ تأثیر منفی بر سیگنال اصلی ندارد (اما این بیانیه توسط بسیاری از کارشناسان مورد مناقشه است. و موسیقی آماتور).

ابزارهایی برای حذف نویز از فونوگرام ها در ویرایشگرهای حرفه ای صدا، معمولاً به صورت ماژول های نرم افزاری اضافی، گنجانده شده است. علاوه بر این، برنامه هایی به طور خاص برای بازیابی ضبط های صوتی ایجاد شده است. یکی از آنها توسط ZH Computer, Inc. برنامه DART Pro 32 که شامل مجموعه کاملی از ابزارها است که به شما امکان می دهد به طور موثر تداخل ضربه و نویز پس زمینه را از ضبط حذف کنید. علاوه بر این، با کمک آن کاربر می تواند موسیقی متن بازیابی شده را ویرایش کند. بنابراین، DART Pro 32 به شما این امکان را می دهد که هنگام بازیابی هر فونوگرام به نتایج عالی برسید.

Sonic Foundry یک ماژول اضافی برای ویرایشگر صوتی Sound Forge منتشر می کند کاهش سر و صدا،حذف صدای خش خش نوار مغناطیسی، تداخل ناشی از تداخل الکترومغناطیسی از شبکه های الکتریکی و سایر نویزها.

برنامه بازسازی WaveLab از دو ماژول اضافی استفاده می کند: DeNoiserو دکلیکر.

علاوه بر این، بسته اصلی WaveLab شامل یک ماژول اثرات است گرانگلیزرکه عملکردهایی را دقیقاً برخلاف آنچه در بالا توضیح داده شد انجام می دهد. برای شبیه‌سازی ضبط‌های قدیمی «پر سر و صدا» با افزودن نویز خاص به سیگنال اصلی، مانند پس‌زمینه ایجاد شده توسط تداخل ولتاژ متناوب، کلیک‌ها و ترقه‌های مشخصه حامل‌های صوتی وینیل، و صدای خش‌خش فرکانس بالا، که هنگام پخش صدا مشاهده می‌شود، استفاده می‌شود. با استفاده از ضبط صوت آنالوگ علاوه بر تمام موارد فوق، با استفاده از ماژول مورد نظر، می توانید محدوده فرکانس سیگنال را محدود کرده و اضافه بار تقویت کننده را شبیه سازی کنید.

از کتاب بیایید یک کامپایلر بسازیم! توسط کرنشاو جک

برگرفته از کتاب رایت سی دی و دی وی دی: یک رویکرد حرفه ای نویسنده باخور ویکتور

بازیابی ضبط برنامه Adobe Audition 1.5 دارای تعداد زیادی ابزار است که به شما امکان می دهد صدای ضبط شده روی رایانه را از نوارهای وینیل، نوار کاست و ضبط صوت حلقه به حلقه بازیابی کنید، همچنین صدای خش خش، کلیک، اضافه بار و سایر موارد ناخواسته را حذف کنید.

از کتاب ویندوز ویستا بدون استرس نویسنده ژوالفسکی آندری والنتینوویچ

سازگاری برنامه های قدیمی با ویندوز ویستا اکثر برنامه های ایجاد شده برای نسخه های قبلی ویندوز با موفقیت در ویندوز ویستا اجرا می شوند، اما برخی از برنامه ها دچار خرابی می شوند یا حتی از راه اندازی کامل خودداری می کنند. همه به این دلیل است که سیستم از شروع به کار خودداری می کند

از کتاب ویندوز ویستا نویسنده واویلف سرگئی

سازگاری برنامه های قدیمی با ویندوز ویستا اکثر برنامه هایی که برای نسخه های قبلی ویندوز ساخته شده اند در ویندوز ویستا با موفقیت کار می کنند، اما برخی از آنها مشکل دارند. گاهی اوقات به دلیل ناسازگاری برنامه با راه اندازی، امتناع کامل وجود دارد

برگرفته از کتاب Database Processing in Visual Basic®.NET نویسنده مک مانوس جفری پی

برگرفته از کتاب یونیکس: ارتباطات فرآیندی نویسنده استفنس ویلیام ریچارد

فصل 9 مسدود کردن سوابق

از کتاب Scrum and XP: Notes from the Front Lines نویسنده Kniberg Henrik

رویکرد شماره 2: "داستان های جدید را شروع کنید، اما قدیمی ها را در اولویت قرار دهید." ما این رویکرد را ترجیح می دهیم. حداقل تا الان اینطور بوده است، اساساً این است: وقتی یک اسپرینت را تمام می کنیم، به مرحله بعدی می رویم، اما

برگرفته از کتاب مدیریت زمان برای مدیران سیستم نویسنده لیمونچلی توماس

حذف رویه های قدیمی گاهی اوقات لازم است رویه ها را به روز کنید.در داستان سوخت گیری خودرو در اوایل این فصل، اشاره کردم که در مقطعی فراموش کردم که این رویه از کجا شروع شد، اما به انجام آن ادامه دادم. این باعث نگرانی است. آیا این درست است

از کتاب راه اندازی ویندوز 7 با دستان خود. چگونه کار را آسان و راحت کنیم نویسنده گلادکی الکسی آناتولیویچ

فصل 5 راه اندازی و استفاده از حساب های کاربری در سیستم عامل ویندوز 7، حساب کاربری مجموعه ای از اطلاعات است که مشخص می کند کاربر می تواند به چه پوشه ها و فایل هایی دسترسی داشته باشد و کاربر می تواند چه تغییراتی در کار خود ایجاد کند.

برگرفته از کتاب توسعه اپلیکیشن در محیط لینوکس. چاپ دوم نویسنده جانسون مایکل ک.

25.4.1. افزودن رکوردها رکوردهای جدید و به روز شده با استفاده از dpput()function.int dpput به پایگاه داده اضافه می شوند. کلید مقدار شاخص است ، که متعاقباً می توان از آن برای به دست آوردن اطلاعات استفاده کرد،

برگرفته از کتاب Linux: The Complete Guide نویسنده کولیسنیچنکو دنیس نیکولاویچ

25.4.2. حذف رکوردها حذف رکوردها از پایگاه داده با فراخوانی تابع dpout() و ارسال کلیدی که داده‌های آن باید حذف شود، انجام می‌شود.int داده ها از پایگاه داده حذف می شوند و پس از آن باز می گردند

برگرفته از کتاب لینوکس و یونیکس: برنامه نویسی پوسته. راهنمای توسعه دهنده. توسط Tainsley David

6.2.5. راه‌اندازی شبکه در توزیع‌های قدیمی‌تر اگر پیکربندی‌کننده‌های گرافیکی در دسترس شما نیستند، می‌توانید رابط شبکه را از خط فرمان پیکربندی کنید. اطلاعات مربوط به شبکه خود را به فایل تجهیزات نصب شده اضافه کنید (به احتمال زیاد آن را /etc/conf.modules /etc/conf.modules نامیده می‌شود. ).

برگرفته از کتاب چگونه در اینترنت کسب درآمد کنیم. 35 سریع ترین راه نویسنده فومینا اولگا

برگرفته از کتاب نصب، پیکربندی و بازیابی ویندوز 7 100% نویسنده واتامانیوک الکساندر ایوانوویچ

1. کسب درآمد از چیزهای قدیمی: سایت های حراج آنلاین، نحوه کسب درآمد از آنها حراج اینترنتی (معروف به "حراج آنلاین") تجارتی است که از طریق اینترنت انجام می شود. آنها با حراج های معمولی تفاوت دارند زیرا از راه دور (از راه دور) برگزار می شوند و در آنها می توانید

برگرفته از کتاب عکاسی دیجیتال. ترفندها و افکت ها نویسنده گورسکی یوری آناتولیویچ

فصل 11 تنظیم کنترل حساب کاربری کسانی که در ویندوز ویستا کار کرده اند قبلاً با مکانیسم کنترل حساب کاربری آشنا شده اند. همانند ویستا، در ویندوز 7 نیز این مکانیسم برای محافظت از سیستم عامل در برابر راه اندازی های مختلف طراحی شده است

از کتاب نویسنده

17.12. رنگ آمیزی عکس های قدیمی افراد بیشتر عکس های قدیمی تک رنگ هستند. این به عکس جذابیت می بخشد و بر سن ارجمند آن تأکید می کند. از طرف دیگر، هنگام تماشای چنین عکسی، این احساس را به شما دست می دهد که برخی از اطلاعات از بین رفته است

بازیابی صداهای ضبط شده در منزلمطالبی هست که خواننده مثل هوا به آنها نیاز دارد. صادقانه بگویم، من ده ها نامه با سؤالات در مورد این موضوع دریافت کرده ام، و مجموع مبلغ قبلاً از صد نفر فراتر رفته است. خب بیایید بفهمیم...

صادقانه بگویم، بازگرداندن صدای ضبط شده از یک منبع با کیفیت پایین عملاً غیرممکن است. می توان آن را با کاهش نویز پردازش کرد، چند هارمونیک اضافه/تحریک کرد، اما با انجام این کارها بیشتر و بیشتر از نسخه اصلی حرکت می کنیم. یعنی ما کارهایی را انجام می دهیم که در سن بالزاک گاهی اوقات برای زیباتر شدن انجام می دهند - آرایش کنید و عیوب را پنهان کنید. و گاهی اوقات، باید اعتراف کنید، آنها این کار را به سادگی انجام می دهند. پس بیایید به منابعی که خوانندگان استفاده می کنند نگاه کنیم. سه مورد اصلی وجود دارد: ضبط صوت، تلویزیون و پخش کننده دیسک LP. افت کیفیت ضبط از چنین منابعی آشکار است. اما هر روشی رویکرد خاص خود را می طلبد.

ضبط صوت: نویز، پس زمینه، اعوجاج هارمونیک، اعوجاج میان مدولاسیون، طیف شناسی خاص مسیر صوتی بازتولید کننده.

تلویزیون: در برخی موارد، صدای "تقطی" (تصحیح شده با کمپرسور)، نویز، مشکلات ناشی از تبدیل آثار مدرن از مونو به استریو، اعوجاج تصویر به دلیل استفاده در برخی مدل های مدرن از تاخیر بین دو کانال. برای ایجاد جلوه‌های فراگیر، یک طیف‌نگار خاص از مسیر صوتی پخش.

پخش کننده های LP ترقه، کلیک، نویز، قطع برخی از باندهای فرکانسی. اگر با وینیل های قدیمی شرکت Melodiya سروکار داریم، در برخی موارد محدوده فرکانس بسیار باریک است، اما این حداکثر شنیدن را تضمین می کند. بیایید توافق کنیم که در مورد نمایندگان با تکنولوژی بالا دستگاه های پیشرفته صحبت نخواهیم کرد. ما در مورد سیستم های صوتی معمولی صحبت می کنیم.

صداها

تقریباً همه دستگاه هایی که ما در نظر می گیریم یک اشکال دارند - نویز. این جدی ترین نقطه کار مرمت است. نویز صدایی است که از هارمونیک های مختلف (Overtones) تشکیل شده است و در برخی موارد در کل محدوده فرکانس گسترش می یابد. در واقع، من با تنها الگوریتم برای پردازش با کیفیت بالا باندهای فرکانس - هنگام رمزگذاری به MP3 مواجه شده ام. ما به خود الگوریتم‌ها اشاره نمی‌کنیم، اما می‌خواهم توجه داشته باشم که هر فایلی که در MP3 کدگذاری می‌شود، صدای "طرح کلی" بیشتری دارد. به یاد دارم که آزمایشی را با کدگذاری/رمزگشایی چندگانه از یک فایل انجام دادم. همانطور که به یاد دارم، خود فایل از آهنگ آواز سوزان وگا گرفته شده است. نتیجه تحقیق فایل whisper به دست آمده از آواز بود. علاوه بر این، مقداری نویز اضافی ایجاد شد که از یک لحظه مشخص شد. بنابراین، رمزگذاری MP3 باید با دقت بسیار مورد استفاده قرار گیرد. ممکن است برای هر مورد خاص مناسب باشد یا نباشد.

استفاده از Compressor/Gate/Limiter قبلا یک روش موثر در نظر گرفته می شد. شخصاً این استفاده را صحیح نمی‌دانم، زیرا تقریباً تمام اطلاعاتی که از دستگاه‌های فوق در دسترس ما است، قبلاً در حین مسترینگ یا پیش مسترینگ توسط این ترکیب پردازش شده است. در این مورد، ما به سادگی برخی هارمونیک ها را "کشتیم"، که راه حلی نیست.

پیشرفته ترین راه حل، ایجاد یک نمونه نویز و پوشاندن آن خارج از فاز با فایل اصلی بود. این روش است که محبوب شده است ، زیرا در برخی موارد برای سیگنال مفید کاملاً بی ضرر است. می توانیم اجرای آن را در Cool Edit و Sonic Foundry Sound Forge ببینیم.

شما همچنین می توانید نمونه های نویز را خودتان ایجاد کنید. به عنوان مثال، اگر ما با یک ضبط از یک نوار سروکار داریم، پس ما به قطعه "سکوت" بین آهنگ ها علاقه مندیم. پس از ضبط این قطعه، آن را تحت پردازش زیر قرار می دهیم: با نگاه کردن به تصویر موج، قسمت چرخه ای خاصی را انتخاب می کنیم. پس از آن در همان ابتدا آن را قطع می کنیم و در نقطه تلاقی سینوسی با صفر به پایان می رسیم. سپس برای این قطعه عملیات "Invert" را اعمال می کنیم (تقریباً در همه ویرایشگرهای صدا وجود دارد). و بس، یک نمونه نویز در آنتی فاز ایجاد شده است. پس از این، در برنامه سطح AudioMulch نمونه آماده شده را در حالت پخش چرخه ای راه اندازی می کنیم. در همان زمان، کاست را روشن کرده و تاخیر نمونه را تنظیم کنید. با یک مسابقه معمولی، بخش قابل توجهی از نویز باید ناپدید شود. بسیاری خواهند پرسید: چرا چنین طرح دست و پا گیر؟ پاسخ من: تصور کنید که باید 90 دقیقه مطلب را ضبط کنید. اگر هر فایل، پس از ضبط، در ویرایش سرد پردازش شود، این 90 دقیقه مطالب منجر به چند روز کار می شود. مهمترین چیز در این روش این است که کنترل های سطح پخش و ضبط را لمس نکنید، زیرا همه چیز به هدر می رود.

نویز کوانتیزاسیون

یکی از منابع نویز و اعوجاج را باید مسیر صدای ضبط یعنی کارت صدای شما دانست. برای اطمینان از حداقل تلفات در این سمت، باید سطح ضبط را به درستی تنظیم کنید. حداکثر دامنه باید در حداکثر سطح ممکن باشد، اما "برش" از این حداکثر حذف می شود. اگر سطح ضبط پایین باشد، نویز کوانتیزاسیون بیشتر در سیگنال وجود خواهد داشت. برای حذف نویز کوانتیزاسیون، یک عملیات دیترینگ ارائه می شود - ایجاد و اضافه کردن نویز که نویز کوانتیزاسیون را حذف می کند.

اعوجاج بین مدولاسیون

این نوع اعوجاج مخصوص ضبط صوت های آنالوگ است. هنگام پخش صدا، سرعت نوار دستخوش تغییرات کوتاه مدت می شود (دستگاه یک دستگاه واحد مسئول همگام سازی ندارد). در نتیجه، طیف فرکانس کمی تار می شود، زیرا مشخص است که وقتی سرعت آن کاهش می یابد، صدا کمتر می شود و زمانی که سرعت آن افزایش می یابد، بیشتر می شود. مثبت ترین راه MP3 -> WAV encoding/decoding است. ضبط صدای "دیجیتال" تری به خود می گیرد.

حذف کلیک ها و کلیک ها

هر چقدر هم که در زندگی ام با ماژول های نرم افزاری DeClicker مواجه شده ام، از نتیجه عمل آنها راضی نبوده ام. در بیشتر موارد، محدوده فرکانس آسیب می بیند. زندگی حتی در یک زمان به من درس بسیار خوبی داد: مطالب آلبوم یک گروه با ADAT در Lexicon ضبط شده بود، اما مشکلات آشکاری در هماهنگ سازی وجود داشت و کلیک ها وجود داشت. و همیشه. کیفیت مطالب ضبط شده نیز بهترین نبود. من متوجه شدم که با استفاده از DeClickers، کیفیت مواد خروجی را که با ایده های من در مورد کیفیت مطابقت دارد، دریافت نمی کنم. باید پردازش را به صورت دستی انجام می دادم. و می دانید، نتیجه غیر منتظره ای گرفتم. چه کار کردم؟

در Sound Forge، در حداکثر زوم (مقیاس تصویر موج)، هر کلیک را با استفاده از عملیات Normalize، Fade In، Fade Out پردازش کردم. برای تصویر کلی، این "ناپدید شدن" های کوتاه مدت قابل توجه نبودند، اما کلیک ها ناپدید شدند.

اگر می‌خواهید در سطح بالایی با بازیابی ضبط‌های صوتی کار کنید، بهتر است از تماس تلفنی با دستگاه‌ها خودداری کنید. از پیشوندها استفاده کنید نه کمپلکس. این را به عنوان یک واقعیت در نظر بگیرید که هر ماژولی که در مسیر حامل به ADC ایستاده است "اضافات" خود را به سیگنال مفید اضافه می کند. من برای مدت طولانی با صدای گیتار کار کرده ام تا بدانم چگونه گاهی اوقات مبارزه با پس زمینه از تداخل و ابزارهای ارزان قیمت بی فایده است. برای حذف پس‌زمینه، می‌توانید با اتصال سیگنالی که در آنتی‌فاز تولید می‌کنند با سیگنال اصلی از مولدهای صدا استفاده کنید.

بسیاری از الگوریتم های تخریب پس زمینه به تخریب نویز نزدیک می شوند. یعنی همون فایل نمونه و همون آنتی فاز.

در برخی موارد، زمزمه در فرکانس های پایین به سادگی توسط یک اکولایزر حذف می شود.

کیفیت صدا بهبود یافته است

در واقع، کمی اختراع شده است.

1. تقویت کننده ها.

2. فراگیر.

3. هارمونیک های هیجان انگیز و اضافه کردن اعوجاج.

4. تولید هارمونیک های اضافی و افزودن آنها به سیگنال اصلی.

5. سیستم MaxxBass یا مشابه.

6. Hi Cutoff و Hi Boost.

8. فشرده سازی.

نحوه کار همه اینها را می توان در برنامه های DFX (پلاگین WinAmp)، Ray Gun، Restoration-NR، T-RackS و غیره مشاهده کرد.

روی دسکتاپ "بازیابی" چه چیزی باید باشد؟

دارت پرو 32; Cool Edit Pro 1.2

Arboretum Systems Restoration-NR

Arboretum Systems Ray Gun

Blade MP3 Enc (یا هر رمزگذار دیگری)

آهنگ های؛ AudioMulch 0.9 b4

PAS Analysis&EQ 2.0

نتیجه گیری

سطح تکنولوژی در تولید موسیقی روز به روز در حال افزایش است. بنابراین، ترمیم ضبط ها حوزه متخصصان و استودیوهای بسیار ماهر با تجهیزات گران قیمت است. در واقع، برای ساختن یک "شفیره" از یک محصول، اول از همه، تجربه لازم است. بنابراین، در این مطالب نشان دادم که چگونه این مشکلات را حل می کنم، اما این یک واقعیت نیست که اینها راه حل های کاملی در این زمینه هستند. نکته اصلی که می خواهم بگویم این است که راه حل این مشکل هرگز به ایده آل نزدیک نمی شود. صدای ایده آل تمیز صدای یک سینت سایزر GM است، اما این واقعیت نیست که شنوندگان آن را دوست دارند. بنابراین، هنگام کار بر روی بازسازی، باید به سادگی به خلوص و شفافیتی دست پیدا کنید که در محصولات صنعت موسیقی مدرن بسیار ذاتی است. کریستوفر M. IHIHO

معرفی...

نسخه ویژه برای رصدخانه

من در سال 1999 مجموعه ای از مقاله ها را در مورد بازیابی صدا در یک رایانه خانگی معمولی شروع کردم، اما بی سر و صدا از بین رفت، اگرچه نمونه های صوتی زیادی وجود داشت و تصاویر متحرک گیف آماده شده بود. جالب است که مطالب من در مورد این موضوع چندین بار گم شده و بازسازی شده است. شاید برای بهتر شدن باشد - من امروز به خیلی چیزها متفاوت نگاه می کنم، اما، به اندازه کافی عجیب، هنوز هم برخی از تکنیک ها و - جالب تر از همه - "نرم افزار" وجود دارند که از این تفاوت تقریباً هفت ساله جان سالم به در برده اند (و این یک جهش بزرگ در عملکرد رایانه های شخصی خانگی و کیفیت برنامه ها). من در مورد چنین لحظاتی با جزئیات بیشتر صحبت خواهم کرد. در این مجموعه سعی خواهم کرد هم رویکرد کلی ترمیم دیجیتال را پوشش دهم (به شکلی که شخصاً آن را برای خودم کار کردم، بدون اینکه اصلاً تظاهر به جهانی بودن کنم)، و هم بخش های ضروری از تئوری صدا و ضبط صدا را تمرین کنید (به عنوان یک منطقه بسیار نزدیک)، و برنامه هایی را که برای من راحت تر به نظر می رسند را توصیف کنید، و ... تا اینجا.

کیفیت تراک‌های صوتی در اکثر کارتون‌ها و فیلم‌های دیجیتالی شده شوروی به سادگی افسرده‌کننده است و کیفیت ویدیو کاملاً قابل تحمل است (درباره جشن سیبرخی از مجموعه های موسیقی به سادگی سکوت می کنند) من را به نیاز به چنین آغازی متقاعد می کند. علاوه بر این، حتی برخی از استودیوها، به اصطلاح، کار می کنند، و همچنین دیالوگ هایی با افرادی که خود را در این زمینه حرفه ای می دانند، با روحیه:

آیا می دانید که سیگنال مفید شما به 3 کیلوهرتز ختم می شود؟

بله، من وقت نداشتم با این همه کمپرسور سرهم کنم...

من این 11 کیلوهرتز رو به 44 کیلوهرتز تبدیل میکنم و صداش خوبه! آیا چنین ویرایشگری را می شناسید، CoolEdit؟" - نشان می دهد که حتی ابتدایی ترین مفاهیم اساسی گاهی اوقات نیاز به پیاده سازی با اسلحه دارند.

هر کسی که فکر می کند به این نیاز ندارد می تواند بلافاصله به قسمت سوم برود - اما ناگهان در دو قسمت اول چیز جدیدی برای خود پیدا می کند یا یکی از اشتباهات غیر ارادی من را اصلاح می کند ، که من فقط از آن خوشحال خواهم شد. . مبتدیان (و مقالات در درجه اول آنها را هدف قرار داده اند) نباید یک کلمه را از دست بدهند؛)

سه ویژگی اصلی "صدای دیجیتال" وجود دارد: نرخ نمونهبرداری(یا کوانتیزاسیون که نرخ نمونه نیز نامیده می شود)، عمق بیت(عمق) بیت (یا به سادگی عمق بیت، یا عرض نمونه)، و تعداد کانال. AudioCD طبق این طرح دارای پارامترهای 44100/16/2 است. به طور تقریبی می توان گفت که برای به دست آوردن این فرمت، حجم صدا با استفاده از خط کش با ارتفاع 2^16= 44100 بار در ثانیه اندازه گیری شد. 65536 "میلی متر صدا" معمولی، در غیر این صورت - مراحل کوانتیزاسیون. طبق همان تقسیمات، کاملاً "گرد" بود (در نقل قول - زیرا مراحل کوانتیزاسیون لازم نیست عدد صحیح باشد).

بیایید یک صدای آنالوگ مشروط را مانند این تصویر کنیم:

یک عقیده بدبینانه وجود دارد که هیچ منبع صدای آنالوگ در طبیعت وجود ندارد - فقط وضوح آن بسیار جدی تر است. و محیط انتشار صدا - به عنوان مثال هوا - یک فیلتر طبیعی از درجه بالایی است؛). از سوی دیگر، هر شکل سیگنال، مهم نیست که چقدر پیچیده یا شکسته باشد، می‌تواند از چنین سینوسی‌های ساده «مونتاژ» شود.

نکته: گوش انسان یک سیستم بسیار پیچیده است که در مرکز آن یک لوله غشایی تشدید مخروطی قرار دارد. حدود 25 هزار (!) انتهای سلول های عصبی - "میکروفون" دارد، که هر کدام در محدوده فرکانس خود "کوک" شده اند (این به سادگی و هوشمندانه به دلیل قرار گرفتن آن روی یک مخروطی است، بگذارید یادآوری کنم، غشاء). . مغز انسان پس از دریافت سیگنال مخلوط شده از این کنسول میکس دیوانه 25000 کانالی، تصویر صدا را بازسازی می کند. واضح است که از نظر فنی ایجاد چنین مدلی، به بیان ملایم، دشوار است و، خوشبختانه، ضروری نیست.

در دنیای الکترونیک، صدا به دنبال ارتعاشات یک غشای میکروفون گرد نازک (مسطح یا کمی محدب) به سیگنال الکتریکی آنالوگ تبدیل می‌شود که از مجموع آنی دامنه‌های امواج همه فرکانس‌هایی که به آن برخورد می‌کنند، ایجاد می‌شود. از جمله فرکانس ها و هارمونیک هایی که برای گوش انسان قابل درک نیستند. بیایید ببینیم چه اتفاقی برای این سیگنال الکتریکی، اما همچنان آنالوگ می‌افتد که در نرخ‌های نمونه پایین و بالا و عمق بیت دیجیتالی می‌شود:

همانطور که می بینید، یک شبکه "مش ریز" با فرکانس بالا (خطوط عمودی) و عمق بیت (خطوط افقی) سیگنال را بسیار مطمئن تر منتقل می کند.

عمق 16 بیتی در فرمت صوتی مصرفی نیز به معنای واقعی کلمه به حداقل می رسد و برای کار حرفه ای با صدا از عمق بیت های 18، 20، 24 و 32 بیت استفاده می شود. (اگرچه در نگاه اول تفاوت اندک است، اما ارتفاع چنین حاکمانی از 65535 تا 1048576 (20 بیت)و 16777216 (24 بیت)"میلی متر صدا". وسعت مقیاس 32 بیتی حتی تلفظ آن آسان نیست: 4.294.967.296) . از نظر سیستم فایل، حجم اشغال شده توسط آهنگ ها هنگام حرکت از 16 به 24 بیت تنها 1.5 برابر و 32 بیت - دقیقا 2 افزایش می یابد.

تعداد کانال‌ها... فکر می‌کنم امروز حتی دانش‌آموزان دبستانی هم نیازی به توضیح تفاوت بین مونو و کواد قدیمی، استریو فراگیر و مدرن 5.1 و 7.1 ندارند.

یکی دیگر از ویژگی های حجم است، به درستی - دامنه، یا محدوده سیگنال. اگرچه طبق تعریف دامنه فقط می تواند مثبت باشد، اغلب به آن مقدار لحظه ای ولتاژ سیگنال نیز می گویند (و ممکن است منفی باشد). دامنه اغلب در دسی بل (dB یا dB) اندازه گیری می شود و این واحد به اندازه عمق بیت پیچیده است. حقیقت این هست که دسی بل مقادیر مطلق را اندازه گیری نمی کند، بلکه مقادیر نسبی را اندازه گیری می کند. فرض کنید، بین دامنه های 0.5 و 1 ولت، اختلاف فقط نیم ولت است، در دسی بل این تفاوت 6 است. و بین دامنه های 110 و 220 ولت، تفاوت در حال حاضر 110 ولت است. با این حال، در دسی بل اختلاف ... دوباره برابر با 6 است! واقعیت این است که 6dB به این معنی است که نسبت دامنه 1:2 است، صرف نظر از اینکه دامنه ها در حال حاضر چه مقادیر دقیقی دارند. علاوه بر این، مقیاسی که دسی بل در آن اندازه گیری می شود، لگاریتمی است. چرا این همه پیچیدگی؟ گوش ما صدا را در مقیاس لگاریتمی درک می کند و هیچ راه گریزی از آن نیست. در اینجا یک جدول مرجع سریع برای تبدیل نسبت دامنه به دسی بل آمده است:

دسی بل	نگرش
0	1.00
1	1.12
2	1.26
3	1.41
5	1.78
6	2.00
8	2.51
10	3.16
20	10.0
40	100.0
60	1 000.00
80	10 000.00
100	100 000.00

علاوه بر این، مسیر به عنوان یک کل دارای چنین ویژگی است محدوده دینامیکی(تفاوت بین آرام ترین و بلندترین صداها، اما نه لزوما آرام ترین صدا در مسیرمعلوم می شود اصلا ساکته ;)). هرچه دامنه وسیع تر باشد، صداهای طبیعی، جلوه های ویژه و آلات موسیقی "زنده" بیشتر به صدا در می آیند. فشرده‌سازی دامنه دینامیکی به شما امکان می‌دهد صداهای آرام را تقویت کنید، در حالی که از "شکستن" صداهای بلند فراتر از محدودیت‌های تعریف شده جلوگیری می‌کند. این فرآیند نامیده می شود فشرده سازیصدا. صدا متراکم تر می شود، گاهی اوقات روشن تر، اما با اشتیاق بیش از حد، سازهای زنده به طور قابل توجهی "پلاستیک" می شوند و صداها شبیه صداهایی می شوند که از طریق یک مسیر رادیویی (با کیفیت بسیار بالا، مسلما) عبور می کنند. جلوه های ویژه برخی از آنها را از دست خواهند داد بهره وری؛)، بر اساس تغییر ناگهانی در حجم. به عنوان مثال، دوبله آماتوری در فیلم ها اغلب تحت فشار نسبتاً شدیدی قرار می گیرد، گاهی اوقات کاملا غیر ضروری. واضح است که محدوده دینامیکی به طور غیر مستقیم توسط عمق بیت سیگنال محدود می شود.

زیان های مرتبط با ویژگی های توصیف شده و تبدیل آنها.

فرکانس.نرخ‌های نمونه‌گیری رایانه‌ای «استاندارد» خوشبختانه مضرب یکدیگر هستند: 44100، 22050، 11025، و غیره. این به جلوگیری از تعدادی از مشکلات مربوط به اعوجاج در هنگام تبدیل کمک می کند و به ویژه از ظاهر پاکت های فرکانس پایین که می توانیم هنگام تبدیل فرکانس های "غیر چندگانه" به دست آوریم - برای مثال، 48000 "سینما" و 44100 "رایانه" از جمله، اعوجاج هایی در حدود 48000-44100=3900 هرتز به ما بدهید - درست در مرکز محدوده شنیداری (هرکسی که حداقل تجربه کمی با سازهای زهی داشته باشد، در عمل به خوبی می داند که "ضربه فرکانس" چیست. هنگامی که رشته ها به طور هماهنگ کشیده می شوند). اما اینها همه هدایای سینمای جهان نیست: "به لطف" فرمت NTSC ما به اصطلاح داریم. فرکانس های "پایین" - 44056 و 47952 هرتز. به طور خلاصه، این به دلیل فرکانس NTSC "ضخیم" 29.97 فریم در ثانیه است، در حالی که کد همگام سازی SMPTE، که عملکرد دستگاه ها را در استودیو هماهنگ می کند، دقیقا 30 "کار می کند". خوشبختانه، ملاقات با چنین دیجیتال سازها و آنها محصولات امروز بعید است. مخابرات ماهواره‌ای دیجیتال و در پشت آنها ضبط‌کننده‌های نوار DAT نیز کنار نرفته‌اند و فرکانس نمونه‌برداری 32000 هرتز را اضافه کرده‌اند، که با این حال، در مقابل پس‌زمینه‌های NTSC شبیه شوخی کودکانه به نظر می‌رسد.

علاوه بر این، هنگام انتقال یک سیگنال دیجیتال از یک دستگاه به دستگاه دیگر، ما از اعوجاج در فرکانس‌های پایین مرتبط با رابط‌های دیجیتال ناقص مصون نیستیم. آنقدر در مورد همه اینها نوشته شده است که ما به سادگی بیان می کنیم: تا آنجا که ممکن است، باید از تبدیل فرکانس (به ویژه تبدیل فرکانس غیر چندگانه) و انتقال سیگنال حتی از طریق رابط های به ظاهر کاملا دیجیتالی خودداری شود. تمام این شرایط با پردازش صدا به طور کامل در داخل کامپیوتر برآورده می شود - ما فقط در ورودی از دست می دهیم. (از طرف دیگر، اگر به طور ناگهانی یک دستگاه خارجی حرفه ای به طور خاص برای تبدیل فرکانس نمونه برداری طراحی شده است، بهتر است از آن استفاده کنید. درست است، این یک تکنیک گران است و کیفیت پردازش نرم افزار برای آهنگ ها کاملاً کافی است. برای کارتون یا ضبط کنسرت های خانگی).

اعوجاج هایی وجود دارد که ما نمی توانیم آنها را تحت تأثیر قرار دهیم - برای مثال، آنهایی که به فرکانس طبیعی صدا بستگی دارند. صادقانه بگویم، برای بازسازی کامل یک سینوسی با فرکانس 20 کیلوهرتز، فرکانس نمونه برداری باید از 44 کیلوهرتز دور باشد (اندازه گیری های 44100/20000 = 2.205 برای بازسازی دو نیم دایره به وضوح کافی نیست! در عوض، ما دو "مرحله" دریافت خواهیم کرد - ببینید. نمودارها در ابتدای مقاله)، در حالت ایده آل - چند صد (!) کیلوهرتز. خوشبختانه، این نوع اعوجاج حداقل توسط فیلترهای مدرن با مرتبه بالا جبران می شود، که اکثر اعوجاج های هارمونیک حاصل را "رد" می کنند. به همین دلیل، ریز مدارهای تقویت کننده های مدرن برای انتقال صدای با کیفیت بالا با فرکانس ها کار می کنند. از دهم مگاهرتز و بالاتر.

یکی دیگر از دست دادن بسیار ناخوشایند - به اصطلاح. انفجارفرکانس ها ("وای"، "فلتر"). اگر نوار به دلایلی (یک غلتک لاستیکی فشار "ضربه" یا کاپیتان و غیره) "در حرکت" یا با شتاب و شتاب نرم حرکت کند، یا خود نوار قبلاً توسط مکانیسم انتقال نوار تغییر شکل داده باشد، در رسانه های آنالوگ رخ می دهد. این منجر به تغییر در زیر و بمی و در صورت برجسته تر شدن، به اختلال در الگوی ریتمیک می شود. یک بار با وحشت به یک صفحه گرامافون با صدای ضبط شده تونی یومی برخوردم که قطعات سمت دوم آن... نه در مرکز دیسک (!) چاپ شده بود. نوسان صدا چیز دیگری بود، و شکوفایی بصری بازو و آهنگ‌ها از یک سری کامل گرامافون «کارتون» فراتر رفت. چرا رکوردها را جداگانه ذکر می کنم؟ حقیقت این هست که هیچ راه خودکاری برای اصلاح چنین تحریفاتی وجود ندارد و بعید است در آینده نزدیک ظاهر شود. اگر فونوگرام ارزش غیرقابل انکاری داشته باشد، منطقی است که با آن به صورت دستی رنج ببریم، دوره نوسان را در چند ده نوسان در چندین برداشت "حدس بزنیم" و اعوجاج های "ضد فاز" را اعمال کنیم (در ادامه در این مورد بیشتر توضیح خواهیم داد). اما این فقط برای انفجارهای نواری نیز صادق است، زیرا رکورد در حالی که مسیر مارپیچی آن به سمت مرکز دیسک حرکت می کند... دقیقاً همانجا. سرعت زاویه ای ثابت است، اما سرعت خطی، افسوس.

دامنه.نوع بعدی اعوجاج با هرگونه تغییر و تحول همراه است، حتی در دستگاه های مجازی - این خطاها زمانی است که لازم است مجدداً حجم سیگنالی را که دریافت کرده ایم به "ارتفاع" نوار بیت "پیوند" کنیم. کامپیوتر به عنوان چنین، البته، دیگر ما را از آنها نجات نمی دهد، و تنها انتخاب ما این است که هنگام پردازش (و ذخیره) سیگنال، یک عمق بیت مصالحه را انتخاب کنیم. با صدای واقعاً باکیفیت، منطقی است که حداقل 24-32 بیت کار کنید (اگرچه بسیاری حتی تفاوت صدا را متوجه نمی شوند). با این رویکرد اصولی، توصیه می شود برنامه های مورد استفاده را برای عادلانه بودن پردازش بررسی کنید - زیرا گاهی اوقات با آنچه توسط سازندگان اعلام شده مطابقت ندارد (در طول پردازش، صدا را می توان به 16 بیت تبدیل کرد). برای بررسی، می توانید برای مثال از BitPolicy استفاده کنید.

یک گفتگوی جداگانه و مهم در مورد دامنه بهینهسیگنال پردازش شده کار با یک سیگنال آرام - در بخش کوچک "پایین" مقیاس دامنه - عمق بیت آن را کاهش می دهد، زیرا هر بار پس از هر پردازشی، محدوده حاصل را به چندین مرحله، متناسب با مراحل "بزرگ" آن، می کنیم. به این ترتیب می‌توانید عمق بیت را به 14 بیت یا حتی کمتر کاهش دهید. در واقع یک سیگنال 16 بیتی در -24dB(حدود 6٪ از حداکثر دامنه) دارای عمق بیت 12 (!) بیت است - "ارتفاع" قسمت مربوطه خط کش کل است. 4096 تقسیمات! یکی دو تا از کارتون هایی که در مقدمه نام بردم دقیقاً این دامنه را داشتند، اما صدا با افتخار در AC3 با فرکانس 48 کیلوهرتز پیچیده شده بود. می گویند مال ما بدان. به هر حال، برای دستیابی به کیفیت 44100/16 با صدای 12 بیتی، فرکانس نمونه برداری باید به 705.6 کیلوهرتز افزایش یابد!

هرچه دامنه کمتر باشد، در حین پردازش در معرض اعوجاج بیشتری قرار می گیرد.

دامنه بیش از حد بزرگ، به نوبه خود، می تواند منجر به بالاتر بودن سیگنال از "بالاترین" تقسیم دامنه "خط کش" شود. این به اصطلاح "کلیپ" است - یک "قطع"، برای همیشه بخشی از سیگنال را از دست داده است. کلیپ ها متفاوت هستند: کلیپ هایی که در حین پردازش به دست می آیند - مانند کلیک های خشک تیز، در حین دیجیتالی کردن - مانند صدای ترق ترق کسل کننده، و بار غیرقابل توجه "گرم" روی دیجیتالیزرهای حرفه ای گران قیمت تر، که سعی می کنند به آرامی آنها را به حداکثر مجاز محدود کنند. . چنین اعوجاج های نرمی به آنالوگ های "زنده" نزدیک است - مثلاً به سیم پیچ بلندگو در یک سیستم صوتی که به حداکثر حرکت خود در یک میدان مغناطیسی رسیده است، یا به یک فیلم مغناطیسی که در میدانی گیر کرده است که در آن مغناطش "اضافی" دیگر وجود ندارد. ممکن است.

یک مصالحه معقول در طول پردازش، انتخاب دامنه ای است که کمی "هوا" در بالای آن باقی بماند. -3dBیا کمی بیشتر ("با چشم" در ویرایشگرها - تا 30٪ فضای آزاد از ارتفاع کامل آهنگ صوتی). در سوابقسیگنالی که قابل پیش بینی بودن آن (یا در خود مسیر صوتی) مشخص نیست، آستانه بالایی باید با سطوح ضبط نزدیک تر به -6dB تنظیم شود - این مطمئناً از هر دوی شما در برابر بارهای بیش از حد تخته در طول یک "ترکیدن" غیرمنتظره صدا محافظت می کند. و از "قفل کردن" در کنسول مخلوط یا تقویت کننده میانی (نکته: برچسب "0 VU" خروجی های آنالوگ تجهیزات استودیویی به 12- و حتی -15 دسی بل از سطح ضبط کننده های دیجیتال تنظیم شده است!) . یک جایگزین این است که از یک محدود کننده استفاده کنید، البته اگر آن را دارید. این به شما این امکان را می دهد که نه تنها خطاهای سطح را در طول دیجیتالی سازی هموار کنید، بلکه اوج های واقعا غیر ضروری را نیز تراز کنید. علاوه بر این، با یک رویکرد ماهرانه، می توانید دامنه کلی را کمی "پمپ کنید" بدون اینکه سیگنال را برای پردازش بیشتر خراب کنید. البته با برخورد متفکرانه و محترمانه.

پس از پایان کار با صدا (اما نه قبل از آن)، می توانید عادی کردن(به قسمت 2 مراجعه کنید) تا -0.2dB - از نظر بصری تقریباً 97٪ از حداکثر بازه را دنبال کنید. طبق توصیه های دیگر، قوی ترین سیگنال در طول نرمال سازی نهایی نباید از -0.5 دسی بل تجاوز کند. در هر صورت، تراز کردن پیک ها در 0dB ارزش ندارد. تغییر محسوسی در حجم وجود نخواهد داشت، اما این سطح به راحتی می تواند منجر به مشکلات شود. در اینجا ایده خوبی است برای پایان دادن به یک سوال متداول دیگر - حساسیت گوش انسان: در نزدیکی آستانه شنوایی 2-3dB است و در سطوح متوسط حدود 0.4dB است.

عمق بیت و ... نویز. در نگاه اول، تشخیص ارتباط بین آنها دشوار است، اما در واقعیت این یکی دیگر از مشکلات صدای کوانتیزه است. و یک دلیل دیگر برای اینکه بیهوده با سیگنال آرام کار نکنید. برای یک مبدل نظری ایده آل (ایده آل، تاکید می کنم) همیشه حداکثر نسبت سیگنال به نویز وجود دارد که می تواند ارائه دهد، و در درجه اول به دامنه بستگی دارد. بسیار ساده است: حتی با نویز صفر، نسبت سیگنال به نویز نمی تواند بیشتر از کل محدوده دینامیکی ارائه شده توسط عمق بیت باشد. دو فرمول دقیق تر و ساده تر وجود دارد (به ترتیب 1 و 2):

1.76 + (تعداد بیت * 6.2)= نسبت سیگنال به نویز

2 + (تعداد بیت * 6)= نسبت سیگنال به نویز

بنابراین، هر چه می توان گفت، عمق 12 بیتی از نظر فیزیکی نمی تواند سیگنال/نویز بیشتر از 74 دسی بل (صدای یک نوار نوار یا ایستگاه رادیویی FM) ارائه دهد. برای مقایسه: صدای 8 بیتی 50 دسی بل (پخش رادیویی ایستگاه های "قدیمی" و موج متوسط) و 16 بیتی - 98 دسی بل (محدوده دینامیکی کامل یک ارکستر سمفونیک) می دهد. البته با دیجیتایزرهای واقعی و نه تئوری، این ارقام حتی کمتر هستند - خطا در پارامترهای قطعات الکترونیکی، نقص در محافظت از قسمت آنالوگ، تداخل دستگاه های دیجیتال مجاور و غیره سکه های خود را به این قلک می اندازند. .

ما ضرر و زیان ناشی از کاهش تعداد کانال ها را در نظر نخواهیم گرفت :).

بیایید آن را جمع بندی کنیم

افزایش فرکانس نمونه برداری و عمق بیت سیگنال تاثیر خوبی بر قابلیت اطمینان آن دارد؛)

تبدیل های غیر ضروری (و به ویژه انتقال سیگنال بین دستگاه ها)، حتی به شکل دیجیتال، سیگنال را مخدوش می کند. در نتیجه، فرکانس نمونه برداری از مسیر خروجی باید بلافاصله در طول دیجیتالی سازی انتخاب شود و اگر هدف مشاهده در رایانه است، بهتر است بلافاصله آن را روی 44100 تنظیم کنید تا 48000 با موارد بعدی (و علاوه بر این، "چند" ) تبدیل.

توصیه می شود هنگام ضبط سیگنال با دینامیک غیرقابل پیش بینی (یا روی تجهیزات غیرقابل پیش بینی) در -12dB - -6dB حداکثر پیک سیگنال را حدس بزنید. در حین پردازش - تا -6dB - -3dB برای به حداقل رساندن اعوجاج در حین پردازش و در عین حال فضای امن برای تغییرات شکل موج آینده باقی می ماند. (نکته: برای اختلاط چند کاناله، همچنین ایده خوبی است که سطوح آهنگ را در محدوده -12dB - -6dB نگه دارید). عادی سازی نهایی یک آهنگ ترکیبی یا پردازش شده صحیح است زیر 0dB، در محدوده -0.5dB - -0.2dB.

P.S.:در واقع، بسیاری از "چیزهای کوچک" و مشکلات دنیای دیجیتال در پشت صحنه باقی می مانند. به عنوان مثال، با ضبط یک سیگنال در 20 کیلوهرتز، هر بار به طور معجزه آسایی دکمه را فشار می دهید "رک"دقیقا زمانی که سینوسی از صفر می گذرد؟ نه؟ این بدان معنی است که هر یک از برداشت های شما هر بار نتایج کاملاً متفاوتی روی اسیلوگرام (و در نتیجه در صدا) می دهد! و نه تنها در این فرکانس، بلکه، به طور طبیعی، در سایر فرکانس ها. در پشت صحنه، لحظه‌ای مانند اینرسی گوش انسان باقی می‌ماند (و مانند چشم، «فریم‌های شنیداری» خود را که خیلی سریع تغییر می‌کند را با یک «حرکت» مداوم صدا اشتباه می‌گیرد) و غیره، که مورد بحث قرار می‌گیرد. همه جا بدون من ما به ادامه می‌دهیم

وزارت آموزش و پرورش

فدراسیون روسیه

موسسه دولتی مسکو

مهندسی رادیو الکترونیک و اتوماسیون

(دانشگاه فنی)

درس علوم کامپیوتر

رکورد قدیمی: بازیابی صدا و صدا دیجیتال با استفاده از پردازش دیجیتال چیست؟

دانش آموز چیستیاکوف I.A.

گروه OTO 4-04

معلم آندریانووا E. G.

این کار برای حفاظت تأیید شده است ________________________________

کار درسی با نمره ____________________ دفاع می شود

مسکو 2005

1. مقدمه……………………………………………………………………..3

2. بخش اول، نظری………………………………………..3

الف. تئوری صدای دیجیتال……………………………………3

ب- دیجیتالی شدن صدا و ذخیره آن در رسانه های دیجیتال.7

د. مزایا و معایب صدای دیجیتال…………….14

د. در مورد موضوع پردازش صدا…………………………………….17

E. تجهیزات…………………………………………………………

ز. نرم افزار…………………………………..22

3. بخش دوم: کاربردی تر…………………………………………………………………………

1. اتصال پخش کننده به کامپیوتر…………….25

2. تنظیم قابلیت های کارت صدا…………………..26

3. مرمت………………………………………………………………

4. آماده سازی فایل ها………………………………………………………………………………………………………………

5. تقسیم فایل موج به ترکیبات جداگانه.........32

6. چشم اندازها و مسائل ……………………………………………………………………………………………

7. واژه نامه اصطلاحات…………………………………….34

1. معرفی

اخیراً قابلیت‌های تجهیزات چندرسانه‌ای رشد چشمگیری داشته است و توجه کافی به این بخش شده است، اما هنوز کاربر معمولی نمی‌تواند تصور روشنی از قابلیت‌های دوست آهنین خود در زمینه بازتولید صدا داشته باشد. ، جیر جیر، نویز، امواج باینری و غیره همه چیز به بازتولید فریاد و انفجار در بازی ها و فیلم ها محدود می شود (خوشبختانه پیشرفت فناوری قبلاً به این سطح رسیده است) و گوش دادن به کتابخانه موسیقی خانگی (یا وقت آن رسیده است که نام دیگری مانند "کتابخانه دیجیتال" در نظر بگیرید؟) .

در این کار سعی خواهیم کرد جنبه های اصلی این مشکل را درک کنیم. بیایید کمی در مورد آناتومی، تئوری صدای دیجیتال و آنچه می توان از یک صفحه وینیل قدیمی و کاست صوتی یاد گرفت صحبت کنیم.

به جز اینکه کامپیوتر خانگی ما یک کارت صدا و دو بلندگو دارد، دقیقاً از قابلیت های صوتی کامپیوتر چه می دانیم؟ متأسفانه، احتمالاً به دلیل ادبیات ناکافی یا دلایل دیگر، کاربر اغلب با چیزی غیر از میکسر و ضبط کننده ورودی/خروجی صوتی داخلی ویندوز آشنا نیست. برای اینکه بفهمید یک کامپیوتر در زمینه صدا چه کارهایی می تواند انجام دهد، فقط باید علاقه داشته باشید و فرصت هایی برای شما باز می شود که شاید حتی تصورش را هم نمی کردید. و همه اینها آنقدرها هم که در نگاه اول به نظر می رسد دشوار نیست.

2. بخش اول: بیشتر نظری.

تمام فرآیندهای ضبط، پردازش و بازتولید صدا به یک روش یا روش دیگر روی یک اندام کار می کنند که با آن صداها را درک می کنیم - گوش. دو تکه :)
بدون درک آنچه می شنویم، چه چیزی برای ما مهم است و چه چیزی نیست، دلیل الگوهای موسیقی خاص چیست - بدون این و چیزهای کوچک دیگر، طراحی تجهیزات صوتی خوب غیرممکن است، فشرده سازی یا پردازش موثر صدا غیرممکن است. آنچه در اینجا توضیح داده شده است، فقط اصول اولیه است.
از بیرون به اصطلاح گوش خارجی را می بینیم. اینجا هیچ چیز خاصی برای ما جالب نیست. سپس یک کانال وجود دارد - تقریباً 0.5 سانتی متر قطر و حدود 3 سانتی متر طول. بعد پرده گوش است که استخوان ها به آن متصل شده اند - گوش میانی. این استخوان‌ها ارتعاش پرده گوش را بیشتر منتقل می‌کنند - به غشایی دیگر، به داخل گوش داخلی - لوله‌ای با مایع به قطر حدود 0.2 میلی‌متر و طول 3-4 سانتی‌متر، که مانند حلزون پیچ خورده است. نکته مهم داشتن گوش میانی این است که ارتعاشات هوا برای ارتعاش مستقیم مایع بسیار ضعیف است و گوش میانی به همراه پرده گوش و غشای گوش داخلی یک تقویت کننده هیدرولیک را تشکیل می دهند - مساحت پرده گوش چندین برابر بزرگتر از آن است. غشای گوش داخلی، بنابراین فشار
(که برابر با F/S است) ده ها بار تقویت می شود.
در گوش داخلی، در تمام طول آن، چیزی شبیه به یک رشته کشیده می شود - غشای دراز دیگری، در ابتدای گوش سخت و در انتهای آن نرم است. بخش خاصی از این غشاء در محدوده خود ارتعاش می کند، فرکانس های پایین در قسمت نرم به سمت انتها، بالاترین ها در همان ابتدا هستند. در امتداد این غشاء اعصابی قرار دارند که ارتعاشات را حس کرده و با استفاده از دو اصل به مغز منتقل می کنند:
اولی اصل شوک است. از آنجایی که اعصاب هنوز قادر به انتقال ارتعاشات هستند
( پالس های باینری ) با فرکانس تا 400-450 هرتز، این اصل است که در زمینه شنوایی با فرکانس پایین استفاده می شود. در غیر این صورت در آنجا دشوار است - ارتعاشات غشاء بسیار قوی هستند و بر اعصاب زیادی تأثیر می گذارند. اصل پرکاشن با یک ترفند کمی به حدود 4 کیلوهرتز گسترش می یابد - چندین (تا ده) اعصاب در مراحل مختلف ضربه می خورند و پهنای باند آنها را جمع می کنند. این روش خوب است زیرا مغز اطلاعات را کاملتر درک می کند - از یک طرف، ما هنوز جداسازی فرکانس آسانی داریم، و از طرف دیگر، می توانیم به خود ارتعاشات، شکل و ویژگی های آنها و نه فقط به طیف فرکانس نگاه کنیم. . این اصل به مهمترین بخش برای ما تعمیم داده شده است
- طیف صدای انسان و به طور کلی، تمام اطلاعات مهم برای ما تا 4 کیلوهرتز قرار دارد.

خب، اصل دوم به سادگی محل عصب برانگیخته است که برای صداهای بالای 4 کیلوهرتز استفاده می شود. در اینجا، جدا از این واقعیت، ما اصلاً به هیچ چیز اهمیت نمی دهیم - نه فاز، نه چرخه وظیفه ... طیف خالی.
بنابراین، در منطقه با فرکانس بالا، ما شنوایی صرفا طیفی با وضوح نه چندان بالا داریم، اما برای فرکانس‌های نزدیک به صدای انسان - کامل‌تر، نه تنها بر اساس جداسازی طیف، بلکه بر اساس تجزیه و تحلیل اضافی اطلاعات توسط خود مغز، دادن یک استریو کامل تر - برای مثال یک عکس. بیشتر در این مورد در زیر.

درک اصلی صدا در محدوده 1 تا 4 کیلوهرتز رخ می دهد؛ صدای انسان در همان محدوده است (و صداهای تولید شده توسط اکثر فرآیندهای طبیعت که برای ما مهم هستند). انتقال صحیح این قطعه فرکانسی اولین شرط برای صدای طبیعی است.

درباره حساسیت (قدرت و فرکانس)

حالا در مورد دسی بل. به طور خلاصه، این یک معیار لگاریتمی نسبی افزایشی برای بلندی (قدرت) صدا است که درک انسان از بلندی صدا را به بهترین شکل منعکس می کند و در عین حال کاملاً ساده محاسبه می شود.

در آکوستیک، مرسوم است که ولوم را با دسی بل SPL (سطح قدرت صدا - نمی دانم اینجا چه صدایی دارد) اندازه گیری می شود. صفر این مقیاس تقریباً حداقل صدایی است که شخص می تواند بشنود. بر این اساس شمارش معکوس در جهت مثبت است. یک فرد می تواند به طور معناداری صداهایی را تا حدود 120 دسی بل SPL بشنود. در 140 دسی بل درد شدید احساس می شود، در 150 دسی بل آسیب گوش رخ می دهد. مکالمه معمولی تقریباً 60 - 70 دسی بل SPL است.
بعداً در این قسمت که dB ذکر می شود به معنای dB از صفر SPL است.
حساسیت گوش به فرکانس های مختلف بسیار متفاوت است. حداکثر حساسیت در محدوده 1 تا 4 کیلوهرتز است که تن صدای اصلی انسان است.
صدای 3 کیلوهرتز همان صدایی است که در 0 دسی بل شنیده می شود. حساسیت در هر دو جهت به طور قابل توجهی کاهش می یابد - به عنوان مثال، برای صدای 100 هرتز به 40 دسی بل (100 برابر دامنه ارتعاش) نیاز داریم، برای 10 کیلوهرتز - 20 دسی بل.
معمولاً می توان گفت که دو صدا از نظر حجم با اختلافی حدود 1 دسی بل تفاوت دارند. با وجود این، 1 دسی بل بیشتر از مقدار کمی است. ما فقط یک درک بسیار فشرده و یکسان از بلندی صدا داریم.
اما کل محدوده - 120 دسی بل - واقعاً بزرگ است، از نظر دامنه میلیون ها بار!

به هر حال، دو برابر شدن دامنه مربوط به افزایش حجم 6 دسی بل است. توجه! گیج نشوید: 12 دسی بل 4 برابر است، اما تفاوت 18 دسی بل در حال حاضر 8 برابر است! و نه 6، همانطور که ممکن است تصور شود. دسی بل - اندازه گیری لگاریتمی)

حساسیت طیفی در خواص مشابه است. می توان گفت که دو صدا (تن های ساده) در فرکانس با هم تفاوت دارند که اختلاف آنها در ناحیه 3 کیلوهرتز حدود 0.3% باشد و در ناحیه 100 هرتز 4% اختلاف لازم است! برای مرجع، فرکانس‌های نت (اگر همراه با نیم‌تون‌ها، یعنی دو کلید پیانو مجاور، از جمله کلیدهای مشکی) گرفته شود، حدود 6 درصد متفاوت است.
به طور کلی، در منطقه 1 تا 4 کیلوهرتز، حساسیت گوش از همه جهات حداکثر است و اگر مقادیر غیر لگاریتمی را در نظر بگیریم که فناوری دیجیتال باید با آن کار کند، زیاد نیست. توجه داشته باشید - بسیاری از چیزهایی که در پردازش صوتی دیجیتال اتفاق می‌افتد، می‌توانند از نظر دیجیتالی وحشتناک به نظر برسند و همچنان صدایی غیرقابل تشخیص از نسخه اصلی داشته باشند.

در پردازش دیجیتال، مفهوم دسی بل از صفر و پایین به ناحیه مقادیر منفی محاسبه می شود. صفر حداکثر سطح قابل نمایش توسط یک مدار دیجیتال است.

A. به طور دقیق، در مورد خود شکل.

برخی از حقایق و مفاهیمی که بدون آنها سخت است.

مطابق با نظریه ریاضیدان فوریه، یک موج صوتی را می توان به عنوان طیفی از فرکانس های موجود در آن نشان داد.

مولفه های فرکانس طیف، نوسانات سینوسی (به اصطلاح تون های خالص) هستند که هر کدام دامنه و فرکانس خاص خود را دارند. بنابراین، هر ارتعاشی، حتی پیچیده ترین شکل،
(به عنوان مثال، صدای انسان) را می توان به عنوان مجموع ساده ترین نوسانات سینوسی فرکانس ها و دامنه های خاص نشان داد. و برعکس، با ایجاد ارتعاشات مختلف و قرار دادن آنها بر روی یکدیگر (میکس، میکس) می توانید صداهای مختلفی دریافت کنید.

سابقه و هدف: سمعک/مغز انسان قادر است فرکانس‌های صدا را از 20 هرتز تا 20 کیلوهرتز متمایز کند (حد بالایی ممکن است بسته به سن و عوامل دیگر متفاوت باشد).
علاوه بر این، حد پایین بسته به شدت صدا بسیار نوسان می کند.

ب- دیجیتالی شدن صدا و ذخیره آن در رسانه های دیجیتال

صدای آنالوگ "معمولی" در تجهیزات آنالوگ به عنوان یک سیگنال الکتریکی پیوسته نشان داده می شود. کامپیوتر با داده ها به شکل دیجیتال کار می کند. این بدان معناست که صدای کامپیوتر به صورت دیجیتال نمایش داده می شود. تبدیل سیگنال آنالوگ به دیجیتال چگونه انجام می شود؟

صدای دیجیتال راهی برای نمایش یک سیگنال الکتریکی از طریق مقادیر عددی گسسته دامنه آن است. فرض کنید یک تراک صوتی آنالوگ با کیفیت خوب داریم (با گفتن "کیفیت خوب" ضبط آرامی را شامل اجزای طیفی از کل محدوده فرکانس شنیداری - تقریباً از 20 هرتز تا 20 کیلوهرتز) فرض می کنیم و می خواهیم آن را "ورودی" کنیم. به کامپیوتر (یعنی دیجیتالی کردن آن) بدون افت کیفیت. چگونه می توان به این امر دست یافت و چگونه دیجیتالی شدن اتفاق می افتد؟ موج صوتی یک تابع پیچیده است، وابستگی دامنه یک موج صوتی به زمان. به نظر می رسد که از آنجایی که این یک تابع است، می توانید آن را در رایانه "همانطور که هست" بنویسید، یعنی شکل ریاضی تابع را توصیف کنید و آن را در حافظه رایانه ذخیره کنید.
با این حال، این عملا غیرممکن است، زیرا ارتعاشات صدا را نمی توان با یک فرمول تحلیلی نشان داد (مثلاً y=COSx). تنها یک راه باقی مانده است - توصیف عملکرد با ذخیره مقادیر گسسته آن در نقاط خاص. به عبارت دیگر، در هر نقطه از زمان، مقدار دامنه سیگنال را می توان اندازه گیری کرد و به صورت اعداد یادداشت کرد. با این حال، این روش همچنین دارای اشکالاتی است، زیرا ما نمی توانیم مقادیر دامنه سیگنال را با دقت بی نهایت ثبت کنیم و مجبور هستیم آنها را گرد کنیم. به عبارت دیگر، ما این تابع را در امتداد دو محور مختصات - دامنه و زمان تقریب خواهیم زد
(تقریبا در نقاط به معنای به زبان ساده گرفتن مقادیر یک تابع در نقاط و نوشتن آنها با دقت محدود است). بنابراین، دیجیتالی کردن سیگنال شامل دو فرآیند است - فرآیند نمونه گیری
(نمونه برداری) و فرآیند کوانتیزاسیون. فرآیند نمونه برداری فرآیند به دست آوردن مقادیر مقادیر سیگنال تبدیل شده در بازه های زمانی معین است (شکل 1).

کوانتیزاسیون فرآیند جایگزینی مقادیر واقعی سیگنال با مقادیر تقریبی با دقت خاص است (شکل 2). بنابراین، دیجیتالی کردن، ثبت دامنه سیگنال در فواصل زمانی معین و ثبت مقادیر دامنه حاصله به صورت مقادیر دیجیتال گرد است (از آنجایی که مقادیر دامنه یک مقدار پیوسته هستند، نمی توان آن را یادداشت کرد. مقدار دقیق دامنه سیگنال در یک عدد محدود است، به همین دلیل است که آنها به گرد کردن متوسل می شوند). مقادیر دامنه سیگنال ثبت شده را نمونه می گویند.
بدیهی است که هرچه بیشتر اندازه گیری های دامنه را انجام دهیم (فرکانس نمونه برداری بیشتر) و هرچه مقادیر حاصل را کمتر گرد کنیم (سطوح کوانتیزاسیون بیشتر)، نمایش دقیق تری از سیگنال به شکل دیجیتال بدست می آوریم.

سیگنال دیجیتالی را می توان به عنوان مجموعه ای از مقادیر دامنه متوالی ذخیره کرد.

حالا در مورد مشکلات عملی. اولاً، باید در نظر داشته باشیم که حافظه رایانه بی نهایت نیست، بنابراین هر بار هنگام دیجیتالی کردن، لازم است نوعی سازش بین کیفیت (مستقیماً وابسته به پارامترهای استفاده شده در طول دیجیتالی شدن) و حجم اشغال شده توسط سیگنال دیجیتالی پیدا شود. .

ثانیاً، فرکانس نمونه برداری یک حد بالایی را برای فرکانس سیگنال دیجیتالی تعیین می کند، یعنی حداکثر فرکانس مولفه های طیفی برابر با نصف فرکانس نمونه برداری سیگنال است. به بیان ساده، برای به دست آوردن اطلاعات کامل در مورد صدا در باند فرکانسی تا 22050 هرتز، فرکانس نمونه برداری حداقل 44.1 کیلوهرتز مورد نیاز است.

مشکلات و تفاوت های ظریف دیگری در ارتباط با دیجیتالی کردن صدا وجود دارد.
بدون پرداختن به جزئیات، توجه می کنیم که در "صدای دیجیتال"، به دلیل گسسته بودن اطلاعات در مورد دامنه سیگنال اصلی، نویزها و اعوجاج های مختلفی ظاهر می شود (عبارت "در صدای دیجیتال فلان فرکانس و نویز وجود دارد. ” یعنی زمانی که این صدا از دیجیتال به آنالوگ تبدیل می شود، فرکانس ها و نویز ذکر شده در صدای آن وجود دارد. مثلا جیتر
- نویز که در نتیجه این واقعیت ظاهر می شود که نمونه برداری سیگنال در طول نمونه برداری در فواصل زمانی کاملاً مساوی اتفاق نمی افتد، اما با برخی انحرافات. یعنی اگر مثلاً نمونه برداری با فرکانس 44.1 کیلوهرتز انجام شود، نمونه برداری نه دقیقاً هر 1/44100 ثانیه، بلکه گاهی کمی زودتر و گاهی کمی دیرتر انجام می شود. و از آنجایی که سیگنال ورودی دائما در حال تغییر است، چنین خطایی منجر به "گرفتن" سطح سیگنالی می شود که کاملاً صحیح نیست. در نتیجه، ممکن است هنگام پخش سیگنال دیجیتالی، مقداری لرزش و اعوجاج احساس شود. ظاهر جیتر نتیجه پایداری نه مطلق مبدل های آنالوگ به دیجیتال است.
برای مبارزه با این پدیده از ژنراتورهای ساعت بسیار پایدار استفاده می شود.
مزاحم دیگر صدای خرد کردن است. همانطور که گفتیم، هنگام کمی کردن دامنه سیگنال، به نزدیکترین سطح گرد می شود. این خطا باعث احساس صدای "کثیف" می شود.

مرجع: پارامترهای استاندارد برای ضبط سی دی های صوتی به شرح زیر است: فرکانس نمونه برداری - 44.1 کیلوهرتز، سطح کوانتیزاسیون - 16 بیت.
چنین پارامترهایی با 65536 (2) سطح کوانتیزاسیون دامنه در هنگام گرفتن مقادیر آن 44100 بار در ثانیه مطابقت دارد.

در عمل، فرآیند دیجیتالی سازی (نمونه برداری و کمی سازی سیگنال) برای کاربر نامرئی می ماند - تمام کارهای خشن توسط برنامه های مختلفی انجام می شود که دستورات مناسب را به راننده می دهد.
(روال کنترل سیستم عامل) کارت صدا. هر برنامه ای (چه یک ضبط کننده داخلی ویندوز باشد یا یک ویرایشگر صوتی قدرتمند) که قادر به ضبط سیگنال آنالوگ در رایانه باشد، به هر طریقی سیگنال را با پارامترهای خاصی دیجیتالی می کند که ممکن است در کار بعدی با صدای ضبط شده مهم باشد، و به همین دلیل مهم است که بفهمیم فرآیند دیجیتالی شدن چگونه اتفاق می‌افتد و چه عواملی بر نتایج آن تأثیر می‌گذارند.

ما باید آن را بشنویم، اما اجازه شنیدن اعداد را نداریم.

2. تبدیل صدا از دیجیتال به آنالوگ

چگونه پس از دیجیتالی شدن به صدا گوش دهیم؟ یعنی چگونه می توان آن را از دیجیتال به آنالوگ برگرداند؟

برای تبدیل سیگنال نمونه برداری شده به فرم آنالوگ مناسب برای پردازش توسط دستگاه های آنالوگ (تقویت کننده ها و فیلترها) و پخش بعدی از طریق سیستم های بلندگو، از مبدل دیجیتال به آنالوگ (DAC) استفاده می شود. فرآیند تبدیل فرآیند نمونه برداری معکوس است: داشتن اطلاعات در مورد بزرگی نمونه ها
(دامنه سیگنال) و با گرفتن تعداد معینی نمونه در واحد زمان، سیگنال اصلی با درون یابی بازیابی می شود.
(شکل 3).

تا همین اواخر، تولید مثل صدا در رایانه های خانگی مشکل بود، زیرا رایانه ها به DAC های ویژه مجهز نبودند. در ابتدا، بلندگوی داخلی (بلندگوی رایانه شخصی) به عنوان ساده ترین دستگاه صوتی در رایانه استفاده می شد. به طور کلی، این اسپیکر هنوز در تقریباً همه رایانه های شخصی موجود است، اما هیچ کس به یاد نمی آورد که چگونه آن را "تقویت" کند تا شروع به پخش کند. به طور خلاصه، این اسپیکر به یک پورت روی مادربرد متصل است که دارای دو موقعیت 1 و 0 است. بنابراین، اگر این پورت به سرعت روشن و خاموش شود، می توان صداهای کم و بیش باورپذیری را از بلندگو استخراج کرد. بازتولید فرکانس‌های مختلف به این دلیل به دست می‌آید که مخروط بلندگو پاسخ محدودی دارد و نمی‌تواند فوراً از مکانی به مکان دیگر بپرد، بنابراین
به دلیل تغییرات ناگهانی ولتاژ در آن، به آرامی نوسان می کند. و اگر آن را با سرعت های مختلف ارتعاش دهید، می توانید ارتعاشات هوا را در فرکانس های مختلف دریافت کنید. یک جایگزین طبیعی برای بلندگو به اصطلاح Covox بود - این ساده ترین DAC است که بر روی چندین مقاومت انتخاب شده (یا یک ریز مدار آماده) ساخته شده است که تبدیل نمایش دیجیتال سیگنال را به آنالوگ تضمین می کند - یعنی به مقادیر دامنه واقعی تولید Covox آسان است و بنابراین تا زمانی که کارت صدا در دسترس همه قرار گرفت، در بین آماتورها موفقیت آمیز بود.

در یک کامپیوتر مدرن، صدا با استفاده از کارت صدا - یا متصل یا تعبیه شده در مادربرد کامپیوتر - تولید و ضبط می شود. وظیفه کارت صدا در کامپیوتر، ورودی و خروجی صدا است.
در عمل این بدان معناست که کارت صدا مبدلی است که صدای آنالوگ را به دیجیتال و بالعکس تبدیل می کند. برای تشریح آن به صورت ساده می توان عملکرد کارت صدا را به صورت زیر توضیح داد.
فرض کنید یک سیگنال آنالوگ به ورودی کارت صدا می رسد و کارت روشن می شود (توسط نرم افزار). ابتدا سیگنال آنالوگ ورودی به یک میکسر آنالوگ می رود که سیگنال ها را مخلوط کرده و صدا و تعادل را تنظیم می کند. میکسر مخصوصاً برای اینکه کاربر بتواند سطوح را کنترل کند ضروری است. سیگنال تنظیم شده و متعادل شده سپس وارد مبدل آنالوگ به دیجیتال می شود، جایی که سیگنال نمونه برداری و کوانتیزه می شود و در نتیجه یک جریان بیت از طریق گذرگاه داده به کامپیوتر ارسال می شود که نشان دهنده سیگنال صوتی دیجیتالی است. خروجی اطلاعات صوتی تقریباً مشابه ورودی است، فقط در جهت مخالف رخ می دهد. جریان داده ارسال شده به کارت صدا بر مبدل دیجیتال به آنالوگ غلبه می کند که سیگنال الکتریکی را از اعداد توصیف کننده دامنه سیگنال تشکیل می دهد. سیگنال آنالوگ حاصل را می توان از طریق هر مسیر آنالوگ برای تبدیل های بیشتر، از جمله پخش، عبور داد. لازم به ذکر است که اگر کارت صدا مجهز به رابطی برای تبادل داده های دیجیتال باشد، در هنگام کار با صدای دیجیتال از بلوک های آنالوگ کارت استفاده نمی شود.

روش های مختلفی برای ذخیره صدای دیجیتال وجود دارد. همانطور که گفتیم، صدای دیجیتالی مجموعه ای از مقادیر دامنه سیگنال است که در فواصل زمانی معین گرفته می شود. بنابراین، اولاً، یک بلوک از اطلاعات صوتی دیجیتالی شده را می توان در یک فایل "همانطور که هست"، یعنی به عنوان دنباله ای از اعداد (مقادیر دامنه) نوشت. در این حالت دو روش برای ذخیره اطلاعات وجود دارد.

اولین (شکل 4) PCM (مدولاسیون کد پالس) است - روشی برای کدگذاری سیگنال دیجیتال با ثبت مقادیر دامنه مطلق (نمایش های علامت دار یا بدون علامت وجود دارد). این فرمی است که داده ها در تمام سی دی های صوتی ضبط می شوند.

روش دوم (شکل 5) ADPCM (Adaptive Delta PCM - مدولاسیون نسبی پالس-کد تطبیقی) است - مقادیر سیگنال را نه به صورت مطلق، بلکه در تغییرات نسبی دامنه (افزایش) ثبت می کند.

ثانیاً، می‌توان داده‌ها را فشرده یا ساده کرد تا حافظه کمتری نسبت به زمانی که نوشته شده بود «همانطور که هست» اشغال کند. در اینجا نیز دو راه وجود دارد.

کدگذاری بدون اتلاف یک روش رمزگذاری صوتی است که امکان بازیابی 100٪ داده ها از یک جریان فشرده را فراهم می کند. این روش فشرده سازی داده ها در مواردی استفاده می شود که حفظ کیفیت اصلی داده ها حیاتی است. به عنوان مثال، پس از میکس صدا در یک استودیوی ضبط، داده ها باید در یک آرشیو با کیفیت اصلی خود برای استفاده های بعدی ذخیره شوند. الگوریتم های رمزگذاری بدون اتلاف موجود امروزی (به عنوان مثال، Monkeys Audio) می توانند حجم اشغال شده توسط داده ها را 20-50٪ کاهش دهند، اما در عین حال از بازیابی 100٪ داده های اصلی از داده های به دست آمده پس از فشرده سازی اطمینان حاصل کنند. چنین رمزگذارهایی نوعی بایگانی کننده داده (مانند ZIP، RAR و دیگران) هستند که فقط برای فشرده سازی صدا طراحی شده اند.

روش دومی برای کدگذاری وجود دارد که در مورد آن با جزئیات بیشتر صحبت خواهیم کرد - کدگذاری با اتلاف. هدف از چنین رمزگذاری استفاده از هر وسیله ای برای دستیابی به شباهت صدای سیگنال بازیابی شده با سیگنال اصلی با کمترین مقدار داده های بسته بندی شده است. این با استفاده از الگوریتم های مختلفی که سیگنال اصلی را "ساده می کند" به دست می آید (خارج کردن جزئیات غیر ضروری "غیر ضروری" از آن) که منجر به این واقعیت می شود که سیگنال رمزگشایی شده در واقع مشابه سیگنال اصلی نیست، اما فقط شبیه به نظر می رسد روش های فشرده سازی زیادی و همچنین برنامه هایی وجود دارد که این روش ها را پیاده سازی می کنند. معروف ترین آنها MPEG-1 Layer I, II, III هستند (آخرین MP3 معروف است).
MPEG-2 AAC (کدینگ صوتی پیشرفته)، Ogg Vorbis، Windows Media Audio (WMA)،
TwinVQ (VQF)، MPEGPlus، TAC، و دیگران. به طور متوسط، نسبت تراکم ارائه شده توسط این رمزگذارها در محدوده 10-14 (بار) است. به ویژه باید تأکید کرد که همه کدگذارهای با اتلاف مبتنی بر استفاده از مدل به اصطلاح روان آکوستیک هستند که دقیقاً همان چیزی است که
"ساده سازی" سیگنال اصلی. به طور دقیق تر، مکانیسم چنین رمزگذارهایی تجزیه و تحلیل سیگنال رمزگذاری شده را انجام می دهد، که در طی آن بخش هایی از سیگنال تعیین می شود، که در مناطق فرکانس خاصی از آنها تفاوت های ظریف غیرقابل شنیدن برای گوش انسان (فرکانس های پوشانده یا غیرقابل شنیدن) وجود دارد که پس از آن، آنها مشخص می شوند. از سیگنال اصلی حذف شده است. بنابراین، درجه فشرده سازی سیگنال اصلی به درجه آن بستگی دارد
"ساده سازی"؛ فشرده سازی قوی که از طریق "ساده سازی تهاجمی" به دست می آید
(زمانی که رمزگذار چندین تفاوت ظریف را غیرضروری در نظر می گیرد)، چنین فشرده سازی به طور طبیعی منجر به کاهش شدید کیفیت می شود، زیرا نه تنها جزئیات نامحسوس، بلکه قابل توجه صدا را نیز می توان حذف کرد.

همانطور که گفتیم، تعداد زیادی کدگذار با اتلاف مدرن وجود دارد.
رایج ترین فرمت MPEG-1 Layer III (MP3 معروف) است.
این فرمت محبوبیت خود را کاملاً شایسته به دست آورد - این اولین کدک گسترده در نوع خود بود که به چنین سطح بالایی از فشرده سازی با کیفیت صدای عالی دست یافت. امروزه جایگزین های زیادی برای این کدک وجود دارد، اما انتخاب با کاربر است. مزایای
MP3 گسترده است و کیفیت رمزگذاری نسبتاً بالایی دارد که به لطف توسعه رمزگذارهای MP3 مختلف توسط علاقه مندان (مثلاً رمزگذار Lame) به طور عینی در حال بهبود است. جایگزین قدرتمند برای کدک MP3
Microsoft Windows Media Audio (فایل‌های WMA و .ASF). طبق آزمایش‌های مختلف، این کدک در نرخ بیت متوسط از «مثل MP3» به «به‌طور محسوسی بدتر از MP3» و در نرخ بیت پایین «بهتر از MP3» نشان داده می‌شود. Ogg Vorbis (فایل‌های
.OGG) یک کدک کاملاً بدون مجوز است که توسط توسعه دهندگان مستقل ایجاد شده است. اغلب اوقات عملکرد بهتری نسبت به MP3 دارد، تنها ایراد آن شیوع کم آن است، که می تواند در انتخاب یک کدک برای ذخیره سازی بلندمدت صدا به یک بحث مهم تبدیل شود. بیایید کدک MP3 Pro هنوز جوان را به یاد بیاوریم که در جولای 2001 توسط Coding معرفی شد
فن آوری در ارتباط با تامسون چند رسانه ای. کدک ادامه یا به طور دقیق تر، توسعه MP3 قدیمی است - با MP3 به عقب (به طور کامل) و جلو (تا حدی) سازگار است. از طریق استفاده از SBR جدید (Spectral
باند Replication)، کدک به طور قابل توجهی بهتر از سایر فرمت ها در نرخ بیت پایین عمل می کند، اما کیفیت رمزگذاری در نرخ بیت متوسط و بالا اغلب از کیفیت تقریباً همه کدک های توصیف شده پایین تر است. بنابراین MP3 Pro برای انجام پخش صوتی در اینترنت و همچنین برای ایجاد پیش نمایش آهنگ ها و موسیقی مناسب تر است.

با صحبت در مورد روش های ذخیره صدا به شکل دیجیتال، نمی توان رسانه های ذخیره سازی داده را به یاد آورد. سی دی صوتی آشنا که در ابتدا ظاهر شد
دهه 80، در سال های اخیر (که به دلیل کاهش قابل توجه هزینه رسانه ها و درایوها است) گسترده شد. و قبل از آن، حامل های داده دیجیتال کاست های نوار مغناطیسی بودند، اما نه معمولی، بلکه مخصوصاً برای ضبط کننده های به اصطلاح DAT طراحی شده بودند. هیچ چیز قابل توجه نیست - ضبط صوت درست مانند ضبط صوت هستند، اما قیمت آنها همیشه بالا بوده است و چنین لذتی برای همه نبود. این ضبط صوت عمدتاً در استودیوهای ضبط استفاده می شد. مزیت این گونه ضبط صوت ها این بود که علیرغم استفاده از رسانه های آشنا، داده های روی آنها به صورت دیجیتال ذخیره می شد و عملاً هیچ ضرری در هنگام خواندن/نوشتن برای آنها نداشت (که برای پردازش استودیویی و ذخیره صدا بسیار مهم است). امروزه، علاوه بر سی دی های آشنا، تعداد زیادی رسانه ذخیره سازی مختلف ظاهر شده اند. رسانه ها در حال بهبود هستند و هر سال در دسترس تر و فشرده تر می شوند. این فرصت های بزرگی را در زمینه ایجاد پخش کننده های صوتی تلفن همراه باز می کند. در حال حاضر تعداد زیادی از مدل های مختلف پخش کننده دیجیتال قابل حمل به فروش می رسد. و می توان فرض کرد که این هنوز با اوج توسعه این نوع فناوری فاصله دارد.

د. مزایا و معایب صدای دیجیتال

از نقطه نظر کاربر معمولی، مزایای زیادی وجود دارد - فشرده بودن رسانه های ذخیره سازی مدرن به او اجازه می دهد، به عنوان مثال، تمام دیسک ها و رکوردهای مجموعه خود را به شکل دیجیتال منتقل کند و آنها را برای سال های طولانی در سه دستگاه کوچک ذخیره کند. هارد دیسک اینچی یا روی یک دوجین یا دو سی دی. می توانید از نرم افزار ویژه استفاده کنید و ضبط های قدیمی را کاملاً از قرقره ها و رکوردها "پاک کنید" و نویز و ترقه را از صدای آنها حذف کنید. همچنین می توانید نه تنها صدا را تنظیم کنید، بلکه می توانید آن را تزئین کنید، غنا، صدا را اضافه کنید و فرکانس ها را بازیابی کنید.
علاوه بر دستکاری های ذکر شده با صدا در خانه، اینترنت نیز به کمک علاقه مندان به صدا می آید. به عنوان مثال، این شبکه به مردم اجازه می دهد تا موسیقی را به اشتراک بگذارند، به صدها هزار ایستگاه رادیویی اینترنتی مختلف گوش دهند، و ساخته های صوتی خود را در معرض دید عموم قرار دهند، همه فقط با یک کامپیوتر و اینترنت. و سرانجام ، اخیراً انبوهی از تجهیزات صوتی دیجیتال قابل حمل مختلف ظاهر شده است که توانایی های حتی متوسط ترین نماینده آنها اغلب این امکان را فراهم می کند که به راحتی مجموعه ای از موسیقی را با مدت زمان ده ها ساعت با خود در جاده ببرید.

از دیدگاه یک حرفه ای، صدای دیجیتال واقعاً امکانات بسیار زیادی را در اختیار شما قرار می دهد. اگر قبلاً استودیوهای صدا و رادیو در چندین ده متر مربع قرار داشتند، اکنون می توان آنها را با یک کامپیوتر خوب جایگزین کرد که از نظر قابلیت از ده استودیو اینگونه مجموعا برتری دارد و هزینه آن چندین برابر ارزانتر از یک است. این بسیاری از موانع مالی را از بین می برد و ضبط صدا را هم برای حرفه ای ها و هم برای آماتورهای معمولی قابل دسترسی تر می کند. نرم افزار مدرن به شما این امکان را می دهد که هر کاری که می خواهید با صدا انجام دهید. پیش از این، جلوه های صوتی مختلفی با کمک دستگاه های مبتکرانه ای به دست می آمد که همیشه نشان دهنده اوج تفکر فنی نبودند یا صرفاً دستگاه های خانگی بودند. امروزه پیچیده ترین و غیرقابل تصورترین جلوه ها با فشار دادن چند دکمه به دست می آیند. البته، موارد فوق تا حدودی اغراق آمیز است و رایانه جایگزین شخص - مهندس صدا، کارگردان یا تدوینگر نمی شود، اما می توان با اطمینان گفت که فشرده بودن، تحرک، قدرت عظیم و کیفیت تضمین شده فناوری دیجیتال مدرن طراحی شده برای پردازش صدا. تقریباً به طور کامل جایگزین فناوری قدیمی استودیوها شده است.تجهیزات آنالوگ.

با این حال، نمایش دیجیتالی داده ها یک مزیت غیرقابل انکار و بسیار مهم دارد - اگر رسانه حفظ شود، داده های روی آن در طول زمان تحریف نمی شوند. اگر نوار مغناطیسی به مرور زمان مغناطیسی زدایی شود و کیفیت ضبط از بین برود، اگر ضبط خراشیده شود و صدای کلیک و ترقه به صدا اضافه شود، سی دی/هارد دیسک/حافظه الکترونیکی یا قابل خواندن است (در صورت سالم بودن) یا خیر. و هیچ اثر پیری ندارد. توجه به این نکته ضروری است که در اینجا در مورد CD های صوتی صحبت نمی کنیم.
DA استانداردی است که پارامترها و فرمت ضبط را بر روی سی دی های صوتی تعیین می کند) زیرا با وجود این واقعیت که این یک حامل اطلاعات دیجیتال است، اثر پیری هنوز از آن فرار نمی کند. این به دلیل ویژگی‌های ذخیره و خواندن داده‌های صوتی از CD صوتی است. اطلاعات انواع سی دی ها فریم به فریم ذخیره می شود و هر فریم عنوانی دارد که با آن می توان آن را شناسایی کرد. با این حال، انواع سی دی ها ساختار متفاوتی دارند و از روش های مختلف علامت گذاری فریم استفاده می کنند.
از آنجایی که درایوهای CD-ROM کامپیوتر عمدتاً برای خواندن داده ها طراحی شده اند.
سی دی ها (باید گفت که انواع مختلفی از استاندارد Data-CD وجود دارد که هر کدام مکمل استاندارد اصلی CD-DA هستند)، آنها اغلب نمی توانند به درستی به سمت CD صوتی "جهت" پیدا کنند، جایی که نحوه علامت گذاری فریم ها به این صورت است. متفاوت از Data-CD (در فریم های سی دی صوتی هدر خاصی ندارند و برای تعیین افست هر فریم لازم است اطلاعات موجود در فریم نظارت شود). این بدان معنی است که اگر هنگام خواندن یک دیتا سی دی، درایو به راحتی روی دیسک "جهت" پیدا کند و هرگز فریم ها را اشتباه نگیرد، در این صورت هنگام خواندن از روی سی دی صوتی، درایو نمی تواند به وضوح جهت یابی شود، که، مثلاً، یک خراش است. یا گرد و غبار ظاهر می شود، می تواند منجر به خواندن قاب اشتباه و در نتیجه صدای پرش یا ترق ترق شود. مشکل مشابه
(ناتوانی اکثر درایوها در قرارگیری صحیح خود در CD-DA) دلیل یک اثر ناخوشایند دیگر است: کپی کردن اطلاعات از
سی دی صوتی حتی هنگام کار با دیسک های کاملا سالم نیز باعث ایجاد مشکل می شود، زیرا "جهت گیری روی دیسک" صحیح کاملاً به درایو خواندن بستگی دارد و نمی توان آن را به وضوح توسط نرم افزار کنترل کرد.

توزیع گسترده و توسعه بیشتر رمزگذارهای صوتی با اتلاف ذکر شده (MP3، AAC و دیگران) گسترده ترین امکانات را برای توزیع و ذخیره سازی صدا باز کرده است. کانال‌های ارتباطی مدرن مدت‌هاست که امکان انتقال حجم زیادی از داده‌ها را در زمان نسبتاً کوتاهی فراهم کرده‌اند، اما کندترین انتقال داده بین کاربر نهایی و ارائه‌دهنده خدمات ارتباطی باقی می‌ماند. خطوط تلفنی که اکثر کاربران از طریق آن به اینترنت متصل می شوند امکان انتقال سریع داده ها را ندارند. نیازی به گفتن نیست که چنین حجمی از داده که توسط اطلاعات صوتی و تصویری فشرده نشده اشغال می شود، زمان بسیار زیادی طول می کشد تا از طریق کانال های ارتباطی معمولی منتقل شود. با این حال، ظهور رمزگذارهای با اتلاف که فشرده سازی ده تا پانزده برابر را فراهم می کنند، انتقال و تبادل داده های صوتی را به یک فعالیت روزمره برای هر کاربر تبدیل کرده است.
اینترنت و رفع تمامی موانع ایجاد شده توسط کانال های ارتباطی ضعیف.
در این رابطه باید گفت که ارتباطات دیجیتال سیار که امروزه با سرعتی جهشی در حال توسعه است، تا حد زیادی مدیون کدگذاری زیان آور است.
واقعیت این است که پروتکل های انتقال صدا از طریق کانال های ارتباطی سیار تقریباً بر اساس همان اصول رمزگذارهای معروف موسیقی عمل می کنند. بنابراین، توسعه بیشتر در زمینه رمزگذاری صدا همواره منجر به کاهش هزینه انتقال داده در سیستم‌های تلفن همراه می‌شود که کاربر نهایی از آن فقط سود می‌برد: ارتباطات ارزان‌تر می‌شود، فرصت‌های جدید ظاهر می‌شوند، عمر باتری دستگاه‌های تلفن همراه افزایش می‌یابد. و غیره. تا حدی کمتر، رمزگذاری با ضرر به صرفه جویی در هزینه خرید سی دی با آهنگ های مورد علاقه شما کمک می کند - امروز فقط باید به
اینترنت جایی است که می توانید تقریباً هر آهنگی را که به آن علاقه دارید پیدا کنید. البته، این وضعیت مدت‌هاست که برای شرکت‌های ضبط آزاردهنده بوده است - مردم به‌جای خرید سی‌دی، درست زیر دماغشان، آهنگ‌ها را مستقیماً از طریق آن‌ها مبادله می‌کنند.
اینترنت، چیزی که زمانی معدن طلا بود را به یک تجارت کم سود تبدیل می کند، اما این موضوع در حال حاضر یک موضوع اخلاقی و مالی است. یک چیز مسلم است: برای این وضعیت و رونق تبادل موسیقی از طریق هیچ کاری نمی توان کرد
اینترنت که دقیقاً با ظهور کدگذارهای با اتلاف ایجاد شده است، دیگر نمی تواند متوقف شود. و این فقط به نفع کاربر معمولی است.

د. در مسئله پردازش صدا

پردازش صدا را باید به عنوان تبدیل های مختلف اطلاعات صدا به منظور تغییر برخی ویژگی های صدا درک کرد. پردازش صدا شامل روش هایی برای ایجاد جلوه های صوتی مختلف، فیلتر کردن و همچنین روش هایی برای پاکسازی صدا از نویزهای ناخواسته، تغییر تایم و غیره است. همه این تنوع عظیم از تحولات در نهایت به انواع اساسی زیر خلاصه می شود:

1. تبدیلات دامنه. آنها بر روی دامنه سیگنال انجام می شوند و منجر به تقویت / تضعیف یا تغییر آن طبق قانون در بخش های خاصی از سیگنال می شوند.

2. تبدیل فرکانس. آنها بر روی اجزای فرکانس صدا انجام می شوند: سیگنال به شکل یک طیف فرکانس در فواصل زمانی معین ارائه می شود، اجزای فرکانس لازم پردازش می شوند، به عنوان مثال، فیلتر کردن، و سیگنال از طیف به یک موج معکوس می شود.

3. تبدیل فاز. تغییر فاز سیگنال به یک روش یا روش دیگر؛ به عنوان مثال، چنین تبدیل های یک سیگنال استریو به شما امکان می دهد تا اثر چرخش یا "حجم" صدا را درک کنید.

4. دگرگونی های موقت. اجرا شده توسط روی هم قرار دادن، کشش / فشرده سازی سیگنال ها. به شما امکان می دهد، به عنوان مثال، افکت های اکو یا کر و همچنین بر ویژگی های فضایی صدا ایجاد کنید.

بحث در مورد هر یک از این نوع تبدیل ها می تواند به یک کار علمی کامل تبدیل شود. ارزش ارائه چندین مثال عملی از استفاده از این نوع تبدیل ها در هنگام ایجاد جلوه های صوتی واقعی را دارد:

اکو (پژواک) با استفاده از تبدیل‌های زمانی پیاده‌سازی شد. در واقع، برای به دست آوردن اکو، لازم است یک کپی با تأخیر زمانی از آن بر روی سیگنال ورودی اصلی قرار داده شود. برای اینکه گوش انسان کپی دوم سیگنال را به عنوان یک تکرار و نه به عنوان پژواک سیگنال اصلی درک کند، زمان تاخیر باید تقریباً 50 میلی ثانیه تنظیم شود. شما می توانید نه تنها یک کپی از آن، بلکه چندین نسخه را روی سیگنال اصلی قرار دهید، که به شما امکان می دهد اثر تکرار چندگانه صدا (اکوی چندصدایی) را در خروجی دریافت کنید.
برای اینکه پژواک در حال محو شدن به نظر برسد، لازم است که نه تنها کپی‌های تاخیری سیگنال، بلکه کپی‌های بی‌صدا از نظر دامنه را روی سیگنال اصلی قرار دهید.

طنین (تکرار، بازتاب). اثر این است که صدا را مشخصه حجم یک سالن بزرگ می دهد، جایی که هر صدا یک پژواک متناظر و به آرامی محو می شود. در عمل، با کمک طنین می توانید به عنوان مثال، یک موسیقی متن ساخته شده در یک اتاق ساکت را "احیا کنید". Reverb با اثر اکو تفاوت دارد زیرا یک سیگنال خروجی با تأخیر زمانی روی سیگنال ورودی قرار می گیرد، به جای کپی تاخیری سیگنال ورودی. به عبارت دیگر، یک بلوک Reverb به سادگی حلقه ای است که در آن خروجی بلوک به ورودی آن متصل می شود، به طوری که سیگنال از قبل پردازش شده در هر چرخه به ورودی بازگردانده می شود و با سیگنال اصلی مخلوط می شود.

گروه کر (کر). در نتیجه استفاده از آن، صدای سیگنال به صدای یک گروه کر یا صدای همزمان چند ساز تبدیل می شود. طرح به دست آوردن چنین افکتی مشابه طرح ایجاد افکت اکو است، تنها تفاوت این است که کپی های تاخیری سیگنال ورودی قبل از اختلاط با فرکانس ضعیف (به طور متوسط از 0.1 تا 5 هرتز) تحت مدولاسیون فرکانس ضعیف قرار می گیرند. سیگنال ورودی. افزایش تعداد صداها در یک گروه کر با افزودن کپی هایی از سیگنال با زمان های تاخیر مختلف به دست می آید.

البته پردازش سیگنال نیز مانند همه حوزه های دیگر دارای مشکلاتی است که به نوعی سد راه است. به عنوان مثال، هنگام تجزیه سیگنال ها به یک طیف فرکانس، یک اصل عدم قطعیت وجود دارد که نمی توان بر آن غلبه کرد. این اصل بیان می کند که دستیابی به تصویر طیفی دقیق از یک سیگنال در یک لحظه خاص در زمان غیرممکن است: یا برای به دست آوردن تصویر طیفی دقیق تر، باید بخش زمانی بزرگ تری از سیگنال را تجزیه و تحلیل کنیم، یا اگر بیشتر هستیم. علاقه مند به زمانی که این یا آن تغییر در طیف رخ داده است، باید دقت خود طیف را قربانی کنیم. به عبارت دیگر، بدست آوردن طیف دقیق یک سیگنال در یک نقطه غیرممکن است - طیف دقیق برای بخش بزرگی از سیگنال، یا یک طیف بسیار تقریبی، اما برای یک بخش کوتاه.

E. تجهیزات

بخش مهمی از گفتگو در مورد صدا به تجهیزات مربوط می شود. دستگاه های مختلفی برای پردازش و ورودی/خروجی صدا وجود دارد. در مورد یک کامپیوتر شخصی معمولی، باید جزئیات بیشتری را در مورد کارت های صدا بپردازیم. کارت های صدا معمولا به صدا، موسیقی و صدا-موسیقی تقسیم می شوند. از نظر طراحی، تمام کارت های صدا را می توان به دو گروه تقسیم کرد: اصلی (نصب شده بر روی مادربرد کامپیوتر و ارائه ورودی و خروجی داده های صوتی) و دختری (تفاوت اساسی طراحی با بردهای اصلی - آنها اغلب به یک وصل می شوند. کانکتور مخصوص واقع در برد اصلی). تخته های دختر اغلب برای ارائه یا گسترش قابلیت های یک سینت سایزر MIDI استفاده می شود.

کارت‌های صدا، موسیقی و صدا به شکل دستگاه‌هایی ساخته می‌شوند که در اسلات مادربرد قرار داده شده‌اند (یا در ابتدا در آن تعبیه شده‌اند).
از نظر بصری، آنها معمولا دو ورودی آنالوگ دارند - خط و میکروفون، و چندین خروجی آنالوگ: خروجی خط و خروجی هدفون. اخیراً کارت ها نیز شروع به تجهیز به ورودی و خروجی دیجیتال کرده اند که انتقال صدا بین دستگاه های دیجیتال را فراهم می کند. ورودی ها و خروجی های آنالوگ معمولا دارای جک هایی مشابه جک های هدفون (1/8 اینچ) هستند. به طور کلی، کارت صدا کمی بیشتر از دو ورودی دارد: آنالوگ CD، MIDI و ورودی های دیگر. آنها، بر خلاف ورودی های میکروفون و خط، نه در پنل پشتی کارت صدا، بلکه روی خود برد قرار دارند. ممکن است ورودی های دیگری نیز وجود داشته باشد، به عنوان مثال، برای اتصال مودم صوتی. ورودی ها و خروجی های دیجیتال معمولاً به شکل یک رابط S/PDIF (رابط انتقال سیگنال دیجیتال) با کانکتور مربوطه (S/PDIF - مخفف Sony/Panasonic Digital Interface - Sony/Panasonic Digital Interface) ساخته می شوند. S/PDIF یک نسخه "مصرف کننده" از استاندارد پیچیده تر حرفه ای AES/EBU است (انجمن مهندسی صدا /
اتحادیه رادیو و تلویزیون اروپا). سیگنال S/PDIF برای انتقال دیجیتال استفاده می شود
(رمزگذاری) داده های استریو 16 بیتی با هر نرخ نمونه برداری.
علاوه بر موارد فوق، بردهای صوتی و موسیقی دارای رابط MIDI با کانکتورهایی برای اتصال دستگاه های MIDI و جوی استیک و همچنین برای اتصال کارت موسیقی دختر هستند (البته اخیراً امکان اتصال دومی نادر شده است). برخی از مدل های کارت صدا برای راحتی کاربر مجهز به یک پنل جلویی نصب شده در قسمت جلویی واحد سیستم کامپیوتری هستند که کانکتورهای متصل به ورودی ها و خروجی های مختلف کارت صدا روی آن قرار دارند.

بیایید چندین بلوک اصلی را که صفحه های صدا و صدا و موسیقی را تشکیل می دهند، تعریف کنیم.

1. واحد پردازش سیگنال دیجیتال (کدک). در این بلوک، تبدیل آنالوگ به دیجیتال و دیجیتال به آنالوگ (ADC و
DAC). این بلوک ویژگی های کارت مانند حداکثر فرکانس نمونه برداری هنگام ضبط و پخش یک سیگنال، حداکثر سطح کوانتیزاسیون و حداکثر تعداد کانال های پردازش شده (مونو یا استریو) را تعیین می کند. ویژگی های نویز تا حد زیادی به کیفیت و پیچیدگی اجزای این بلوک بستگی دارد.

2. بلوک سینت سایزر. موجود در کارت های موسیقی بر اساس سنتز FM یا WT یا هر دو به طور همزمان انجام می شود. می تواند تحت کنترل پردازنده خود یا تحت کنترل یک درایور خاص کار کند.

3. بلوک رابط. انتقال داده را از طریق رابط های مختلف (به عنوان مثال S/PDIF) فراهم می کند. یک کارت صدای خالص اغلب فاقد این بلوک است.

4. واحد اختلاط. در کارت های صدا، واحد میکس تنظیمی از موارد زیر را فراهم می کند: سطوح سیگنال از ورودی های خطی. سطوح از ورودی MIDI و ورودی صوتی دیجیتال. سطح سیگنال عمومی؛ سوژه متحرک تن صدا

بیایید مهمترین پارامترهای مشخص کننده تابلوهای صدا و صدا و موسیقی را در نظر بگیریم. مهمترین ویژگی ها عبارتند از: حداکثر نرخ نمونه برداری در حالت ضبط و حالت پخش، حداکثر سطح کوانتیزاسیون یا عمق بیت.
(حداکثر سطح کوانتیزاسیون) در حالت ضبط و پخش. علاوه بر این، از آنجایی که بردهای صوتی و موسیقی دارای سینت سایزر نیز هستند، ویژگی های آنها شامل پارامترهای سینت سایزر نصب شده نیز می شود.
طبیعتاً، هرچه سطح کوانتیزاسیون کارت قادر به رمزگذاری سیگنال‌ها بیشتر باشد، کیفیت سیگنال بالاتری به دست می‌آید. تمام مدل های مدرن کارت صدا قادر به رمزگذاری سیگنال با سطح 16 بیت هستند و اخیراً کارت های خانگی با سطح 24 بیت ظاهر شده اند (خط کارت
Audigy، Audigy II از Creative). یکی از ویژگی های مهم، قابلیت پخش و ضبط همزمان جریان های صوتی است.
توانایی یک کارت برای پخش و ضبط همزمان را فول دوبلکس می گویند. یک ویژگی دیگر وجود دارد که اغلب در هنگام خرید کارت صدا نقش تعیین کننده ای دارد - نسبت سیگنال / نویز (S/N). این نشانگر بر خلوص ضبط و پخش سیگنال تأثیر می گذارد. نسبت سیگنال به نویز نسبت توان سیگنال به توان نویز در خروجی دستگاه است؛ این نشانگر معمولاً بر حسب دسی بل اندازه گیری می شود. نسبت 80-85 دسی بل را می توان خوب در نظر گرفت. کامل
– 95-100 دسی بل. با این حال، باید در نظر داشت که کیفیت پخش و ضبط به شدت تحت تأثیر تداخل (تداخل) سایر اجزای رایانه (منبع تغذیه و غیره) است. در نتیجه، نسبت سیگنال به نویز ممکن است بدتر شود. در عمل، روش های بسیار زیادی برای مبارزه با این وجود دارد. برخی از افراد پیشنهاد می کنند کامپیوتر را زمینی کنید.
برخی دیگر، به منظور محافظت از کارت صدا در برابر تداخل تا حد امکان،
آن را به بیرون از کیس کامپیوتر ببرید. با این حال، محافظت کامل از خود در برابر تداخل بسیار دشوار است، زیرا حتی عناصر خود نقشه با یکدیگر تداخل ایجاد می کنند. آنها همچنین در تلاش برای مبارزه با این هستند و برای این منظور از هر عنصر روی تخته محافظت می کنند. اما مهم نیست که چقدر برای حل این مشکل تلاش می شود، حذف کامل تأثیر دخالت خارجی غیرممکن است.

یکی دیگر از مشخصه های به همان اندازه مهم، ضریب اعوجاج غیرخطی یا اعوجاج هارمونی کل، THD است. این نشانگر همچنین به شدت بر خلوص صدا تأثیر می گذارد. ضریب اعوجاج غیرخطی به صورت درصد اندازه گیری می شود: 1٪ - صدای "کثیف". 0.1٪ - صدای عادی؛ 0.01٪ - صدای Hi-Fi خالص. 0.002% - صدای Hi-Fi – Hi End کلاس اعوجاج غیرخطی نتیجه عدم دقت در بازگرداندن سیگنال از دیجیتال به آنالوگ است.
به صورت ساده، فرآیند اندازه گیری این ضریب به صورت زیر انجام می شود. یک سیگنال سینوسی خالص به ورودی کارت صدا ارسال می شود. در خروجی دستگاه سیگنالی گرفته می شود که طیف آن مجموع سیگنال های سینوسی (مجموع سینوسی اصلی و هارمونیک های آن) است.
سپس با استفاده از یک فرمول خاص، نسبت کمی سیگنال اصلی و هارمونیک های آن به دست آمده در خروجی دستگاه محاسبه می شود. این رابطه کمی اعوجاج هارمونیک کل (THD) است.

سینت سایزر MIDI چیست؟ اصطلاح "سینت سایزر" معمولاً برای اشاره به یک آلت موسیقی الکترونیکی استفاده می شود که در آن صدا ایجاد و پردازش می شود و رنگ و ویژگی های آن تغییر می کند.
به طور طبیعی، نام این دستگاه از هدف اصلی آن - سنتز صدا می آید. تنها دو روش اصلی سنتز صدا وجود دارد: FM (مدولاسیون فرکانس) و WT (جدول موج).
- موج جدول). از آنجایی که نمی‌توانیم آنها را در اینجا به تفصیل مورد بحث قرار دهیم، فقط ایده اصلی روش‌ها را شرح می‌دهیم. سنتز FM بر این ایده استوار است که حتی پیچیده ترین نوسانات اساساً مجموع ساده ترین نوسانات سینوسی است. بنابراین، می توان سیگنال های تعداد محدودی از مولدهای موج سینوسی را روی هم قرار داد و با تغییر فرکانس امواج سینوسی، صداهایی شبیه به صداهای واقعی تولید کرد. سنتز موج جدولی بر اساس یک اصل متفاوت است. سنتز صدا هنگام استفاده از این روش از طریق دستکاری از پیش ضبط شده به دست می آید
(دیجیتال) صداهای آلات موسیقی واقعی. این صداها (به نام نمونه) در حافظه دائمی سینت سایزر ذخیره می شوند.

لازم به ذکر است که از آنجایی که داده های MIDI مجموعه ای از دستورات هستند، موسیقی هایی که با استفاده از MIDI نوشته می شوند نیز با استفاده از دستورات سینت سایزر نوشته می شوند. به عبارت دیگر، نمره MIDI دنباله ای از دستورات است: چه نتی باید بنوازد، از چه ابزاری استفاده شود، مدت زمان و کلید صدای آن چقدر است و غیره. برای خیلی ها آشناست
فایل های MIDI (.MID) چیزی بیش از مجموعه ای از این دستورات نیستند. به طور طبیعی، از آنجایی که تعداد زیادی تولید کننده سینتی سایزرهای MIDI وجود دارند، یک فایل مشابه می تواند در سینت سایزرهای مختلف صداهای متفاوتی داشته باشد (زیرا خود سازها در فایل ذخیره نمی شوند، بلکه فقط دستورالعمل هایی برای سینت سایزر برای نواختن سازها وجود دارد، در حالی که سینت سایزرهای مختلف چگونه می توانند پخش شوند. صدا متفاوت است).

بیایید به بررسی تابلوهای صوتی و موسیقی برگردیم. از آنجایی که قبلاً مشخص کرده ایم MIDI چیست، نمی توانیم ویژگی های سینت سایزر سخت افزاری داخلی کارت صدا را نادیده بگیریم. یک سینت سایزر مدرن اغلب بر اساس به اصطلاح "جدول موج" - WaveTable است (به طور خلاصه، اصل عملکرد چنین سینت سایزر این است که صدای موجود در آن از مجموعه ای از صداهای ضبط شده با روی هم قرار دادن آنها به صورت پویا و تغییر سنتز می شود. پارامترهای صدا)، قبلاً سنتز نوع اصلی FM بود
(مدولاسیون فرکانس - سنتز صدا با ایجاد نوسانات سینوسی ساده و اختلاط آنها). ویژگی های اصلی سینت سایزر WT عبارتند از: تعداد ابزارهای موجود در رام و حجم آن، وجود
رم و حداکثر حجم آن، تعداد افکت های پردازش سیگنال احتمالی و همچنین امکان پردازش افکت کانال به کانال (البته در صورت وجود پردازنده افکت)، تعداد مولدهایی که حداکثر تعداد صداها را تعیین می کنند. در حالت پلی فونیک (پلی فونیک) و شاید مهمتر از همه، استانداردی که سینت سایزر بر اساس آن ساخته می شود.
(GM، GS یا XG). به هر حال، ظرفیت حافظه یک سینت سایزر همیشه یک مقدار ثابت نیست. واقعیت این است که اخیراً سینت سایزرها دیگر ROM خود را ندارند، اما از RAM اصلی رایانه استفاده می کنند: در این حالت، تمام صداهای استفاده شده توسط سینتی سایزر در یک فایل روی دیسک ذخیره می شوند و در صورت لزوم در RAM خوانده می شوند.

G. نرم افزار

موضوع نرم افزار بسیار گسترده است، بنابراین ما بخش کوچکی از برنامه ها را برای پردازش صدا در نظر خواهیم گرفت.

مهمترین دسته برنامه ها ویرایشگرهای صوتی دیجیتال هستند. ویژگی های اصلی چنین برنامه هایی حداقل قابلیت ضبط است
(دیجیتال سازی) صدا و ذخیره روی دیسک. نمایندگان توسعه‌یافته این نوع برنامه‌ها اجازه بسیار بیشتری را می‌دهند: ضبط، میکس صوتی چند کاناله در چندین آهنگ مجازی، پردازش با جلوه‌های ویژه (هم داخلی و هم متصل خارجی - بعداً بیشتر در مورد آن)، حذف نویز، ناوبری و ابزارهای توسعه یافته در قالب طیف‌سنجی و سایر دستگاه‌های مجازی، کنترل/کنترل دستگاه‌های خارجی، تبدیل صدا از فرمت به فرمت، تولید سیگنال، ضبط به سی‌دی و موارد دیگر. برخی از این برنامه ها: Cool Edit Pro
(Syntrillium)، Sound Forge (Sonic Foundry)، Nuendo (Steinberg)، Samplitude
تهیه کننده (Magix)، Wavelab (Steinberg)، دارت.

ویژگی های اصلی ویرایشگر Cool Edit Pro 2.0 (نگاه کنید به تصویر 1 - نمونه ای از پنجره کار برنامه در حالت چند آهنگ): ویرایش و میکس صدا در 128 آهنگ، 45 جلوه DSP داخلی، از جمله ابزارهایی برای مسترینگ، تجزیه و تحلیل و بازیابی صدا، پردازش 32 بیتی، پشتیبانی از صدا با پارامترهای 24 بیتی / 192 کیلوهرتز، ابزارهای قدرتمند برای کار با حلقه ها (حلقه ها)، پشتیبانی DirectX و همچنین کنترل SMPTE/MTC، پشتیبانی از کار با ویدئو و MIDI ، و بیشتر.

اسکرین شات 1.

ویژگی های اصلی ویرایشگر Sound Forge 6.0a (نگاه کنید به اسکرین شات 2 - نمونه ای از پنجره کار برنامه): قابلیت های ویرایش غیر مخرب قدرتمند، پردازش پس زمینه چند وظیفه ای وظایف، پشتیبانی از فایل های با پارامترهای تا 32 بیت / 192 کیلوهرتز، مدیر از پیش تعیین شده، پشتیبانی از فایل های بیش از 4 گیگابایت، کار با ویدئو، مجموعه بزرگی از جلوه های پردازشی، بازیابی از فریز، پیش نمایش افکت های کاربردی، تحلیلگر طیفی و غیره.

اسکرین شات 2

ریستورهای تخصصی صدا نیز نقش مهمی در پردازش صدا دارند. چنین برنامه هایی به شما امکان می دهند کیفیت صدای از دست رفته مواد صوتی را بازیابی کنید، کلیک های ناخواسته، نویز، ترقه، تداخل خاص از ضبط شده از کاست های صوتی را حذف کنید و سایر تنظیمات صوتی را انجام دهید. برنامه های مشابه: Dart، Clean (از Steinberg
شرکت)، آزمایشگاه تمیز کردن صدا. (از Magix Ent.)، تصحیح کننده موج.

ویژگی های اصلی ترمیم کننده Clean 3.0 (نگاه کنید به تصویر 3 - پنجره کار برنامه): حذف انواع ترقه ها و نویزها، حالت تصحیح خودکار، مجموعه ای از جلوه ها برای پردازش صدای اصلاح شده، از جمله عملکرد "صدای فراگیر" با مدل سازی آکوستیک بصری افکت، ضبط سی دی با داده های آماده، سیستم راهنمایی "هوشمند"، پشتیبانی از پلاگین های VST خارجی و سایر ویژگی ها.

اسکرین شات 3

بخش دوم: عملی تر

اخیراً موضوع بایگانی دیسک ها و کاست های قدیمی وینیل مطرح شده است. امروزه همه با رایانه خود به موسیقی گوش می دهند، و گاهی اوقات شرم آور است که ما به ضبط های قدیمی دسترسی نداریم.

دیجیتالی کردن موسیقی

سعی کنید به ضبط‌های قدیمی و کاست‌های صوتی خود جان تازه‌ای بدهید. تا اواسط دهه هشتاد، دوستداران موسیقی به دو گروه تقسیم می‌شدند: متخصصانی که می‌دانستند چگونه صفحه‌های وینیل گرانبها و نوارها را در شرایط عالی نگه دارند، و آماتورهایی که به اثر انگشت یا خراش روی سطح صفحه اهمیت نمی‌دادند. اکنون چنین مشکلاتی وجود ندارد. سی دی ها جمع و جورتر هستند و آسیب دیدن آنها دشوارتر است. هنگامی که سی دی ها فراگیر شدند، صفحه های گرامافون بازنشسته شدند. البته، تنها در عصر دیجیتال گنجینه های موسیقی می توانند شنوندگان را به وجد بیاورند: ضبط های قدیمی را در رایانه خود پردازش کرده و آنها را روی سی دی بسوزانید!

1. اتصال پخش کننده به کامپیوتر

اول از همه، پخش کننده را به کامپیوتر خود وصل کنید. این را از راه های گوناگون می توان انجام داد. برخی از پخش کننده ها تقویت کننده مخصوص به خود را دارند - آن را به ورودی Line-in کارت صدا وصل کنید. اگر پخش کننده شما آمپلی فایر خود را ندارد و سیگنال خیلی ضعیف است، از یک تقویت کننده خارجی مانند سیستم استریو استفاده کنید. کابل هایی با کانکتورهای مختلف برای این اهداف را می توان در فروشگاه های برق یا غرفه ها خریداری کرد. اگر به کابلی با ترکیب غیرعادی کانکتورها نیاز دارید که در بازار موجود نیست، کانکتورهای مورد نیاز را جداگانه خریداری کنید و خودتان کابل مورد نیاز خود را بسازید. مراقب باشید که حلقه ظاهر نشود زیرا بعداً باعث ایجاد نویز می شود. برای جلوگیری از این امر، کابل زمین پخش کننده را نیز به کیس کامپیوتر متصل کنید. بسیار توصیه می شود که ابتدا به آنچه می خواهیم بازیابی کنیم گوش دهیم، زیرا یک "سورپرایز" به شکل "وووش، رکورد گیر کرده است" هنگام ضبط موسیقی متن بر روی HDD بسیار مفید نخواهد بود. اگر چنین مشکلی تشخیص داده شد، بار روی پیکاپ را تنظیم می کنیم، اما اگر تنظیمی وجود نداشته باشد، باید نوعی وزن را روی سر بازو وارد کنید.
(بسیار نامطلوب است، اما راه دیگری وجود ندارد). اگر همه چیز به خوبی پیش رفت، در بلندگوها (هدفون) فرصتی برای شنیدن صداهای مفید ماسه چوب گرد وینیل یا صدای سرکوب نشده موج سواری از چیزی مانند Yauza 221-1S MP با MK-60، نوع I وجود دارد.

2. پیکربندی قابلیت های کارت صدا

از برنامه کنترل صدا در ویندوز برای تنظیم سطح سیگنال دریافتی استفاده کنید. برای انجام این کار، روی نماد بلندگو در سینی با دکمه سمت چپ ماوس دوبار کلیک کنید. کنترل‌های Line-in و Wave سطح باید روشن باشند.
علاوه بر این، کنترل صدا موبایل نباید کمتر از وسط خط کش باشد. منبع قدرتمند تداخل اغلب ورودی میکروفون است. اغلب نویز غیر ضروری تولید می کند، بنابراین باید یک علامت چک در کنار علامت "خاموش کردن" وجود داشته باشد. حالا بیایید پارامترهای ضبط را پیکربندی کنیم. باز کردن در
تب "کنترل صدا" "گزینه ها" - "خواص". در گزینه
"تنظیمات صدا" گزینه "ضبط" را انتخاب کنید، در قسمت "کنترل های حجم نمایش" در خط خط ورودی باید یک علامت وجود داشته باشد.
روی OK کلیک کنید. در "کنترل صدا" منبع ضبط را انتخاب کنید - در مورد ما Line-in خواهد بود. تنظیم کننده کشویی را تقریباً در وسط خط کش قرار دهید. فعلاً پنجره «کنترل صدا» را باز بگذارید.

3. ترمیم

اکنون، به طور دقیق، می توانید از مطلوب به واقعی حرکت کنید.
مقدار کافی نرم افزار برای بازیابی ضبط های قدیمی وجود دارد.
راه‌حل‌های حرفه‌ای برای مهندسان صدا وجود دارد که به ویرایشگرهای صدا نزدیک‌تر هستند، که کاربر معمولی می‌تواند ظرف پنج سال آن را درک کند.
در این مدت، آنچه می توانست بازسازی شود برای همیشه از بین خواهد رفت.
خوشبختانه، برنامه هایی در این دنیا وجود دارد که می توانید خیلی سریع آن ها را کشف کنید و کیفیت نسبتاً بالایی از مواد نهایی دریافت کنید.
یکی از این راه حل ها CoolEdit از Syntrillium است.
(www.syntrillium.com) ویرایشگر صدا با قابلیت ضبط و پردازش موسیقی.
خب برنامه رو دانلود کردی؟ نصب شده است؟ امیدوارم افزونه “Audio Cleanup” را فراموش نکرده باشید که برای ما بسیار مفید خواهد بود. اجازه دهید ویرایشگر را راه اندازی کنیم و به پنجره اصلی برنامه نگاه کنیم (شکل 2). استاندارد
رابط ویندوز (تا حدی، همانطور که اغلب گفته می شود، بصری). بیایید به این ترتیب توافق کنیم: داستان مفصلی در مورد همه قابلیت های برنامه "Cool Edit 2000" نسخه 1.1 در اینجا وجود نخواهد داشت.
بیایید فقط آنچه را که واقعاً برای بازسازی صدا نیاز داریم در نظر بگیریم.

اکنون نوبت به انجام یک تنظیم کوچک اما بسیار مهم در برخی از پارامترهای برنامه رسیده است. اجازه دهید توضیح دهم چرا: احتمالاً بسیاری از کاربرانی که این خطوط را می‌خوانند، نمی‌خواهند خود را به تمیز کردن صدا از رسانه‌های وینیل محدود کنند، زیرا هنوز کسی کاست‌های فشرده معمولی را لغو نکرده است. در مورد ضبط صدا از میکروفون چه می توان گفت؟ صاحبان کارت "SB Live!" خواندن پاراگراف کوتاه بعدی مفید خواهد بود.

تقریباً همه دارندگان پخش‌کننده‌های کاست ثابت می‌دانند که محدوده فرکانس اطلاعات ضبط شده در مورد نوار کاست نوع 1 در محدوده 40-14000 هرتز قرار دارد. نوار دی اکسید کروم دامنه وسیع تری می دهد. اما تعداد کمی از مردم می دانند که ضبط صوت هنوز هم "فریادهای روح" فردی را بازتولید می کند و در محدوده وسیع تری (20 تا 20000 هرتز) که با انواع صداها و تداخل ها مسدود می شود، به گوش آرام نمی رسد. عشق موزیک. برنامه "Cool Edit" به شما امکان می دهد این نقص را اصلاح کنید و پاسخ فرکانس دامنه نوار کاست را به سطح کاملا مناسبی ارتقا دهید.

اکنون، به خصوص برای صاحبان خوش شانس کارت "SB Live!": احتمالاً می دانید که پاسخ فرکانسی کدک به هیچ وجه ایده آل نیست و پس از 4.5 کیلوهرتز کاهش تدریجی در سطح فرکانس های بالایی شروع می شود که در بسیاری از موارد خوب نیست با کمک "ویرایش سرد" ما بر این مانع نیز غلبه خواهیم کرد.

برای رفع نواقص فوق، فیلتر FFT ویرایشگر را راه اندازی می کنیم که در مرحله اولیه تمیز کردن صدا دستیار ما خواهد بود.
بیایید هر فایل wav را باز کنیم یا با فشار دادن دکمه ای که نقطه قرمز آن در پانل دکمه در گوشه سمت راست پایین قرار دارد، چند ثانیه سکوت ضبط کنیم.
سپس به منوی برنامه بروید: Transform-Filters-FFT Filter. در پنجره ای که باز می شود (شکل 2)، اجازه دهید یک تنظیمات (تنظیم) کاملاً بدون فکر ایجاد کنیم، که برای آن خط زرد را کمی با ماوس می کشیم. با استفاده از دکمه «افزودن»، اجازه دهید تنظیمات خود را با هر نام سانسور شده فراخوانی کرده و آن را ذخیره کنیم. برای چی؟ و برای این واقعیت که اکنون ما فایل "Cool.ini" واقع در آدرس را ویرایش خواهیم کرد:
X:Program Files Cool2000. یعنی با معرفی چند پارامتر اضافی برای اصلاح کاستی های آزاردهنده دستگاه پخش کاست و کارت “SB Live!”.
فایل "Cool.ini" را باز کنید، جایی که ما به دنبال بخش هستیم. اما نکته این است که این بخش در این فایل تنها پس از استفاده از خدمات فیلتر FFT ظاهر می شود. به همین دلیل است که برای ایجاد نوعی از پیش تنظیم انتزاعی به حرکات بدن نیاز داشتیم. حالا بیایید نگاه کنیم در کجای بخش
تنظیمی که ما ایجاد کردیم قرار دارد - ما به سادگی نامی را که با آن از پیش تنظیم خود فراخوانی کرده ایم پیدا می کنیم. و سپس دشوار نیست: در یک خط آزاد این پارامتر "کوچک" را می نویسیم:

آیتم29=MCRESTORATION,3,19,0,20,426,5,845,0,1288,0,1986,0,2259,0,2855,
6,3179,9,3444,1,3583,28,3688,42,3773,48,3848,61,3925,76,3957,96,3998,100,
4004,100,4012,5,4096,5,19,0,20,426,5,845,0,1288,0,1986,0,2259,0,2855,6,3179,

9,3444,21,3583,28,3688,42,3773,48,3848,61,3925,76,3957,96,3998,100,4004,100,

4012,5,4096,5,2,0,12000,1,2,0,0,1000,100,5,-10,100,-
0.5,12,24000,1,0,1,1,48000

این عدد را حتما در یک خط می نویسیم! اینها پارامترهایی برای تصحیح پاسخ فرکانسی دستگاه های ضبط کاست هستند. ایگور بابایلوف با مهربانی فایل ویرایش شده Cool.ini را که روزها و شب های زیادی را روی آن کار کرد به اشتراک گذاشت: www.hot.ee/uvs/Cool.zip. که من عمیق ترین تعظیم خود را به او تقدیم می کنم.
من فکر نمی کنم که پارامترهای پاسخ فرکانسی کنسول های کاست مختلف بسیار متفاوت باشد. از طرف دیگر، اگر مقدار زیادی از گیاهان همیشه سبز را روی Dragon Nacamichi یا Maranz خرج کرده اید، واضح است که به این تنظیمات نیازی ندارید.
برای صاحبان "SB Live!" اکیداً توصیه می شود که ابتدا هر فونوگرافی ضبط شده را با پیش تنظیم زیر از این فیلتر عبور دهید:

Item36=SBCORRECtion,3,20,0,0.83,0.532,1,793,1,1003,2,1223,4,1713,5,2046,
10,2391,12,2569,15,2710,18,3066,24,3234,27,3398,35,3480,41,3546,47,3628,
56,3726,70,3825,89,4096,100,20,0,0,83,0,532,1,793,1,1003,2,1223,4,1713,5,
2046,10,2391,12,2569,15,2710,18,3066,24,3234,27,3398,35,3480,41,3546,47,
3628,56,3726,70,3825,89,4096,100, 2,0,12000,1,2,0,0,1000,100,3, -10,100,0,
14,24000,1,0,0,1,48000

این مقدار را در همان Cool.ini و در همان قسمت می نویسیم
، فراموش نکنید که پارامترها باید در یک خط ناقص نوشته شوند.
از آنجایی که رایانه و پخش‌کننده ما متصل هستند، از نظر عملکرد آزمایش شده و آماده کار هستند، و برنامه «Cool Edit 2000» پس از افزودن‌ها احساس خوبی دارد، می‌توانیم با خیال راحت فرآیند ضبط گرامافون را روی هارد دیسک آغاز کنیم.
ضبط را یا از طریق "فایل" - "جدید" شروع می کنیم، یا دکمه ضبط را روی پانل فشار می دهیم. نترسید، ضبط بلافاصله شروع نمی شود: از ما خواسته می شود که ویژگی های سیگنالی را که باید ضبط شود انتخاب کنیم. در پنجره باز شده Sample را انتخاب کنید
نرخ = 44100 و صدای 16 بیتی در حالت استریو - چرا به مونو نیاز داریم؟ بازو را روی رکورد قرار می دهیم و با فشار دادن دکمه OK، ضبط شروع می شود، همانطور که توسط نشانگر ضبط به شکل نوارهای قرمز ضربان دار و یک تایمر مشهود است. ضبط یک چیز خاص با گرفتن بخش های خالی در ابتدا و انتهای فونوگرام بسیار مطلوب است، یعنی جایی که فقط صدای خش خش خود جرم شنیده می شود - ما در آینده برای تصفیه عمیق صدا به آن نیاز خواهیم داشت. حتی می توانید چند ثانیه از آهنگ قبلی یا بعدی را ضبط کنید.
در محلی که نیاز داریم دکمه Stop را فشار داده و در پنجره برنامه گرامافون ضبط شده را مشاهده می کنیم (شکل 3).

شکل 3
بیایید شاهکار ضبط شده را در یک فایل wav (فایل - ذخیره به عنوان) ذخیره کنیم. در مرحله بعد، اگر از "SB Live!" استفاده می کنید، فیلتر FFT آشنا را باز کنید (Transform-
Filters-FFT Filter) و با انتخاب پیش تنظیم SBCORRECtion و فشار دادن دکمه OK، شروع به یکسان سازی پاسخ فرکانسی سیگنال ضبط شده می کنیم (شکل 4). در مرحله بعد اقدام به حذف ترقه ها و کلیک های فونوگرام 2 می کنیم.

چرا همه آنها با هم به منوی Transform-Noise Reduction-Click/ می روند
Pop Eliminator، که در آن بهینه ترین پارامترهای تمیز کردن صدا در پنجره ای که باز می شود انتخاب می شود (داده ها توسط ترمیم کننده های حرفه ای ارائه شده است که در این مورد بیش از یک سگ خورده اند).
در شکل 5 این پارامترها برای دیدن همه ارائه شده است. اما ابتدا باید بر روی دکمه Auto Find All Levels کلیک کنیم و تنها پس از آن OK کنیم تا فرآیند تمیز کردن صدا شروع شود.

اگر بعد از بزرگنمایی، بخش اولیه را پیدا نکردیم، نگران نباشید، اما نشانگر ماوس را به نوار لغزنده بالای تصویر ببرید و این نوار لغزنده را به سمت چپ ببرید، جایی که ابتدای فونوگرام را خواهید دید. . اکنون از ماوس برای انتخاب ناحیه اولیه با نویز، مربوط به تقریباً 3 ثانیه صدا (زمان در پانل زیر نشان داده شده است) و در منوی Transform-Noise, Reduction-Noise، استفاده کنید.
کاهش، با استفاده از دکمه دریافت نمایه از انتخاب، از سر و صدایی که بسیار متنفریم عکس می گیریم. اما ابتدا، اجازه دهید بهینه ترین مقادیر برخی از پارامترها را که در شکل مشاهده می شود، تنظیم کنیم. 7 به همراه عکس نویز. و برای شنیدن نتیجه اولیه کار کاهش نویز، روی دکمه Preview کلیک کنید، فراموش نکنید که فونوگرام را از قبل پاک کنید.
اگر نتیجه رضایت بخش بود، دکمه OK را فشار دهید و فرآیند کاهش نویز را شروع کنید، که بسیار کمتر از پاک کردن سیگنال از ترقه ها و کلیک ها طول می کشد. پس از اتمام، ایده خوبی است که نتیجه را با نام دیگری ذخیره کنید تا ایده ای از تمام مراحل تصفیه صدا داشته باشید.

باید گفت که پس از پاک کردن کامل فونوگرام از نویز، سطح سیگنال به طور قابل توجهی کاهش می یابد و بنابراین، شما باید سیگنال را با استفاده از دستور Transform-Amplitude-Normalize نرمال کنید که زمان زیادی را صرف می کند.
در نهایت، زمان انجام مرحله نهایی فرآیند ما فرا رسیده است، یعنی گرامافون خود را در اطراف لبه‌ها برش داده و آن را در یک فایل ذخیره کنیم. فوراً می گویم که می توانید با انتخاب بخش غیر ضروری و استفاده از دستور Edit-Cut، بخش های شروع و پایان غیر ضروری یک فایل صوتی را در «ویرایش سرد» برش دهید.
برای کسانی که می‌خواهند ضبط‌های کاست‌های فشرده را به شکل دیجیتال تبدیل کنند، این کار دقیقاً با یک مرحله ساده می‌شود - تمیز کردن فونوگرام از نویز و کلیک‌ها. پس از اتمام ضبط موسیقی در هارد دیسک، تنظیمات MCRESTORation را در فیلتر FFT انتخاب کنید، پاسخ فرکانس سیگنال از پخش کننده کاست را یکسان کنید و سپس به سادگی فرآیند کاهش نویز و عادی سازی سیگنال را آغاز کنید.
خوب، ما قطعه تمیز و بریده شده گرامافون را که به شکل الهی آورده شده است، همانطور که دوست دارید ذخیره می کنیم - فرمت wav یا دیگری. با اولین مورد می توانید هر کاری انجام دهید، حتی رمزگذاری به MP3. آه، تقریباً فراموش کرده بودم، شما هنوز باید همه این موارد را روی یک سی دی ضبط کنید، تا بتوانید به راحتی در جایی از پخش کننده دوستان خود به آن گوش دهید، و گونه ها و سوراخ های بینی خود را از اهمیت خود در روند به روز رسانی به روز کنید. صدا.

در نتیجه باید فایل های صوتی آماده شده را روی سی دی رایت کنید.

4. آماده سازی فایل ها

حالا بیایید موسیقی را روی سی دی رایت کنیم. ما از Nero استفاده می کنیم. البته سایر برنامه ها نیز به همین صورت عمل می کنند. Nero را اجرا کرده و Compile a new CD and Audio-CD را انتخاب کنید.
نمایشگر آهنگ و مدیر فایل باز می شود. فایل های WAV را در پنجره Songs بکشید و رها کنید. برای تغییر ترتیب فایل ها می توانید در این پنجره بکشید و رها کنید.
سپس تمام آهنگ ها را انتخاب کنید، روی آنها کلیک راست کرده و انتخاب کنید
خواص. مدت مکث بین آهنگ ها را تنظیم کنید. اگر مکث از قبل در خود فایل ها وجود داشته باشد، بهتر است این مقدار روی صفر تنظیم شود. پس از این کار، تب Filters را فراخوانی کنید. همچنین ابزارهایی برای بهبود کیفیت صدا در اینجا وجود دارد. با استفاده از تابع عادی سازی، می توانید حجم آهنگ های جداگانه را برابر کنید: فیلد Normalize را برجسته کرده و روش را روی Maximum تنظیم کنید. Nero تمام آهنگ ها را با حداکثر حجم ممکن تنظیم می کند تا اعوجاج صدا ایجاد نشود.
گفتگو را با کلیک کردن بر روی OK ببندید.

5. تقسیم فایل موج به ترکیبات جداگانه

حالا فایل های بزرگ را به قسمت های جداگانه تقسیم کنید تا سی دی پلیر بتواند آهنگ ها را تشخیص دهد. روی فایل مربوطه کلیک کنید و دوباره پنجره Properties را باز کنید. برگه Indexes, Limits, Split را فراخوانی کنید.
Nero امواج صوتی را به ترتیب نمایش می دهد. سپس تقسیم بندی کنید: جایی که بریدگی در موج ظاهر می شود، ابتدای مورد نظر ترکیب قرار دارد. اگر روی این مکان کلیک کنید و Play را فشار دهید متوجه خواهید شد که آیا این درست است یا خیر. اگر در مورد انتقال صحبت می کنید، محدوده را برجسته کرده و روی Zoom In کلیک کنید. برای درج یک خط خاکستری در جایی که می‌خواهید ترکیب‌ها را جدا کنید، کلیک کنید. سپس بر روی Split کلیک کنید. به قسمت Full بروید
مشاهده کنید، در صورت لزوم، همه چیز را دوباره تکرار کنید و در نهایت با کلیک بر روی OK کاری را که انجام داده اید تایید کنید. از "Properties" برای اختصاص نام به ترکیبات فردی استفاده کنید. پس از آن، روی دکمه در نوار ابزار کلیک کنید تا یک سی دی رایت کنید، سرعت را تنظیم کنید، روی نوشتن کلیک کنید - و تمام، شما صاحب شاهکار خود هستید!

6. چشم اندازها و مسائل

چشم انداز توسعه و استفاده از صدای دیجیتال بسیار گسترده به نظر می رسد. به نظر می رسد هر کاری که می توان در این زمینه انجام داد قبلا انجام شده است. با این حال، اینطور نیست. مشکلات زیادی وجود دارد که هنوز کاملاً دست نخورده باقی مانده است.

به عنوان مثال، حوزه تشخیص گفتار هنوز بسیار توسعه نیافته است. مدت هاست که تلاش هایی برای ایجاد نرم افزارهایی با قابلیت تشخیص کیفی گفتار انسان صورت گرفته و در حال انجام است، اما همه آنها هنوز به نتیجه مطلوب منتهی نشده اند. اما پیشرفت مورد انتظار در این زمینه می تواند به طرز باورنکردنی وارد کردن اطلاعات به رایانه را ساده کند. فقط تصور کنید که به جای تایپ متن، می توانید به سادگی آن را هنگام نوشیدن قهوه در جایی نزدیک کامپیوتر خود دیکته کنید. برنامه های زیادی وجود دارد که ظاهراً قادر به ارائه چنین فرصتی هستند، اما همه آنها جهانی نیستند و زمانی که صدای خواننده کمی از لحن مشخص شده منحرف می شود، به بیراهه می روند.
چنین کاری نه به اندازه غم و اندوه راحتی به ارمغان می آورد. یک کار حتی دشوارتر (که شاید اصلاً قابل حل نباشد) تشخیص صداهای رایج است، به عنوان مثال، صدای ویولن در صدای ارکستر یا جداسازی یک قطعه پیانو. می توان امیدوار بود که روزی این امر امکان پذیر شود، زیرا مغز انسان به راحتی می تواند با چنین وظایفی کنار بیاید، اما امروز خیلی زود است که در مورد کوچکترین تغییرات در این زمینه صحبت کنیم.

همچنین فضایی برای کاوش در زمینه سنتز صوتی وجود دارد. امروزه روش‌های مختلفی برای سنتز صدا وجود دارد، اما هیچ‌یک از آنها سنتز صدایی را که نمی‌توان از واقعی تشخیص داد، ممکن نمی‌سازد. اگر مثلاً صدای پیانو یا ترومبون حتی کم و بیش قابل اجرا باشد، هنوز نتوانسته‌اند به صدای قابل‌اعتماد یک ساکسیفون یا گیتار الکتریک دست یابند - تفاوت‌های ظریف صوتی زیادی وجود دارد که تقریبا غیرممکن است. به صورت مصنوعی بازآفرینی کنید

بنابراین، به جرات می توان گفت که در زمینه پردازش، خلق و سنتز صدا و موسیقی، هنوز با آن کلمه تعیین کننده ای که به توسعه این شاخه از فعالیت های انسانی پایان دهد، بسیار فاصله داریم.

7. واژه نامه اصطلاحات

1) DSP - پردازشگر سیگنال دیجیتال (پردازنده سیگنال دیجیتال).
دستگاه (یا موتور نرم افزار) که برای پردازش سیگنال دیجیتال طراحی شده است.

2) نرخ بیت - در رابطه با جریان داده - تعداد بیت در ثانیه
(بیت در ثانیه). همانطور که برای فایل های صوتی اعمال می شود (به عنوان مثال، پس از رمزگذاری با اتلاف)، چند بیت یک ثانیه صدا را توصیف می کنند.

3) صدا یک موج صوتی است که در فضا منتشر می شود. در هر نقطه از فضا را می توان به عنوان تابعی از دامنه در برابر زمان نشان داد.

4) رابط - مجموعه ای از نرم افزار و سخت افزار طراحی شده برای سازماندهی تعامل دستگاه های مختلف.

5) درونیابی - یافتن مقادیر میانی یک کمیت بر اساس برخی از مقادیر شناخته شده آن. یافتن مقادیر تابع f(x) در نقاط x واقع بین نقاط xo

مایک تورنتون ترمیم و تمیز کردن فایل های صوتی. بازیابی صداهای ضبط شده در منزل. کیفیت صدا بهبود یافته است

زیان های مرتبط با ویژگی های توصیف شده و تبدیل آنها.

همچنین بخوانید

نحوه نصب بازی‌ها و برنامه‌ها روی کیت گواهی برنامه ویندوزفون ویندوزفون

ما ویجت ها را با استفاده از ابزار Gadgets Revived برمی گردانیم

حساب شخصی Orion Express - ثبت نام و ورود

زنگ