(۳-۸۶)
ماتریس هانکل سیگنال آلوده می تواند به شکل زیر شکسته شود:
(۳-۸۷)
که در آن و N به ترتیب ماتریس هانکل مربوط به سیگنال تمیز و نویز می باشند.
اینک با مقدمه ای که از ابزار SVD بیان کردیم، ابتدا مروری بر روش های تشخیص نواحی سکوت، صدادار و بی صدا خواهیم داشت و در فصل بعد به تشریح روش ترکیبی تجزیه مقادیر منفرد در روش تفریق طیفی می پردازیم. این روش مبتنی بر روش تفریق طیفی اما با تخمین دنباله نویز از ابزار SVD است.
۳-۵- الگوریتم های تشخیص نواحی سکوت و صدادار و بی صدا
تشخیص قسمت های سکوت و صدادار و بی صدا نقش بسیار مهمی را در پردازش سیگنال های صوتی به عهده دارد. به عنوان مثال در بسیاری از روش های غنی سازی سیگنال های صوتی همانند روش تفریق طیفی]۱۶،۱۲ [، جهت تخمین میزان نویز، از قسمت های سکوت سیگنال استفاده می گردد و یا اینکه در برخی از روش ها همانند روش پیشنهادی آقایان شیخ زاده و ابوطالبی]۲۴[، به جهت تأثیر غیر یکسان نویز بر روی قسمت های صدادار و بی صدا]۲۴،۱۶[، نیاز است تا این قسمت ها از همدیگر تفکیک شوند تا روابط خاصی برای هریک از آنها ارائه شود. برای تشخیص قسمت های سکوت، روش های مختلف و متنوعی وجود دارند نظیر روش عبور از صفر]۱[، روش قدر مطلق اندازه]۱[، روش های مبتنی بر موجک]۱۹[، استفاده از مدل لاپلاسین-گوسین]۱۸[ و … . در روش [۱۱۷]VAD با بهره گرفتن از عبور از صفر و نیز روش قدر مطلق به ترتیب از آستانه گذاری بر روی میزان عبور از صفر و قدر مطلق اندازه سیگنال صوتی آغشته به نویز استفاده می گردد. در برخی از روش های مبتنی بر موجک از یکسری عملیات مقایسه ای در باندهای مختلف فرکانسی استفاده می گردد]۱۹[. در این بخش، روش ها و الگوریتم های مختلف آشکار ساز صوت مورد بحث و بررسی قرار می گیرد.
(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت nefo.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))
۳-۵-۱- تشخیص قسمت های سکوت با بهره گرفتن از قدرمطلق اندازه
آسانترین روش مورد استفاده در آشکارساز صوت این روش می باشد. در شکل (۳-۱)، نمودار اندازه یک سیگنال صوتی گسسته بر حسب زمان رسم شده است. این سیگنال صوتی مربوط به عبارتfour می باشد که توسط گوینده زن تلفظ شده است. همانطور که از این شکل پیداست، اندازه دامنه سیگنال در حروف صدادار بیشتر از حروف بی صدا و در حرف بی صدا نیز بیشتر از قسمت های سکوت می باشد]۱،۲[، بدین منظور اولین روشی که به ذهن می آید استفاده از قدرمطلق اندازه سیگنال در شناسایی قسمت های سکوت می باشد.
روش کار بدین صورت است که ابتدا سیگنال صوتی به بازه های زمانی کوچکتر تقسیم می شود و سپس مجموع قدرمطلق اندازه نمونه های سیگنال در هر فریم محاسبه می گردد:
(۳-۸۸)
که در آن X(n;m) اندازه سیگنال صوتی آغشته به نویز که عمل پنجره گذاری (تقسیم به بازه های زمانی کوچکتر) روی آن انجام شده است می باشد و m طول پنجره می باشد.
از آنجایی که در فریم های سکوت، هیچکونه سیگنال صوتی وجود نداشته و تنها شامل نویز می باشند و از طرف دیگر چون در سیگنال های صوتی با SNR متوسط و خوب، اندازه سیگنال در حروف بی صدا به اندازه کافی بزرگ می باشد تا بر تضعیف احتمالی که بر اثر نویز روی اندازه آن ایجاد می شود چیره و غالب گردد لذا با یک آستانه گذاری می توان، فریم های سکوت را از سیگنال جدا نمود. این آستانه گذاری بر روی مقادیر SUM انجام می گیرد و یکی از ساده ترین روابط برای محاسبه مقدار آستانه بصورت زیر می باشد :
T = median(SUM)
(۳-۸۹)
که Sum دنباله ای است از Sumi ها.
همانطور که بیان شده است، کارایی این الگوریتم در SNR های پایین و حتی در برخی SNR های متوسط به شدت کاهش می یابد.