در ادامه، ارزیابی الگوریتم پیشنهادی را به ازاء هر یک از معیارهای مطرح شده برای هر کدام از مجموعههای دادهای، ارائه کرده و تحلیل خواهیم نمود.
( اینجا فقط تکه ای از متن فایل پایان نامه درج شده است. برای خرید متن کامل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )
۴-۵-۱- معیار دقت
همانطور که گفته شد معیار دقت، دقت الگوریتم خوشهبندی را در قرار دادن اشیاء داده در خوشهها مورد ارزیابی قرار میدهد. مقدار این معیار عددی بین صفر و یک است و مقدار بالاتر بیانگر دقت و یا خلوص بیشتر خوشهبندی است. ما این معیار را برای هر یک از خوشهبندیهای نهایی تولید شده، محاسبه نموده و الگوریتم پیشنهادی را با ۴ الگوریتم دیگر در نمودارهای مختلف مقایسه خواهیم نمود. هر یک از شکلهای ۴-۲ تا ۴-۵ ارزیابی معیار دقت را به ترتیب برای مجموعههای دادهای iris، glass، vehicle و segment به ازاء ۵ الگوریتم نشان میدهند.
شکل ۴-۲ ارزیابی معیار دقت برای مجموعه دادهای iris در دو حالت با تعداد خوشههای ۳ و ۴
شکل ۴-۳ ارزیابی معیار دقت برای مجموعه دادهای glass در سه حالت با تعداد خوشههای ۴، ۶ و ۸
شکل ۴-۴ ارزیابی معیار دقت برای مجموعه دادهای vehicle در دو حالت با تعداد خوشههای ۴ و ۸
شکل ۴-۵ ارزیابی معیار دقت برای مجموعه دادهای segment در دو حالت با تعداد خوشههای ۵ و ۷
ارزیابی معیار دقت برای الگوریتم COHD و مقایسه آن با دیگر الگوریتمها، نشان میدهد که این الگوریتم از دقت بیشتری نسبت به ۴ الگوریتم دیگر برخوردار است. البته همانطور که در شکل ۴-۳ نشان داده شده است الگوریتم COHD برای مجموعه دادهای glass در خوشهبندیهایی با تعداد خوشهی ۶ و ۸ نتوانسته است به دقت بیشتری نسبت به دیگر الگوریتمها دست یابد. علت این مسئله وزن اختصاص داده شده به خوشهبندیهای اولیه بر اساس شاخص DB است، با توجه به اینکه برای مجموعه دادهای glass، خوشهبندیهایی با دقت بیشتر دارای شاخصDB با مقدار کمتر نمیباشند. از اینرو، خوشهبندی نهایی نیز از دقت کمتری برخوردار خواهد شد.
۷الگوریتم MCLA برای مجموعه دادهای glass با تعداد خوشهی ۸ دارای خروجی نمیباشد. به همین علت در ارزیابیهای انجام شده برای این الگوریتم، مقداری به ازاء معیارهای مختلف مشخص نشده است. دلیل عدم پاسخگویی الگوریتم MCLA در این وضعیت به علت اینکه پیادهسازی آن توسط شخص دیگری صورت گرفته است، برای ما مشخص نمیباشد.
۴-۵-۲- شاخص Davies-Bouldin
همانطور که گفته شد شاخص DB میزان فشردگی و تفکیک شدگی خوشهها را نشان میدهد. مقدار این شاخص هر چه کوچکتر باشد بیانگر فشردگی بیشتر خوشهها و تفکیک شدگی مناسبتر آنها خواهد بود. مقدار محاسبه شده برای این شاخص در بازهی مشخصی قرار نمیگیرد و عددی بزرگتر از صفر و مثبت میباشد. ما این معیار را برای هر یک از خوشهبندیهای نهایی تولید شده، محاسبه نموده و الگوریتم پیشنهادی را با ۴ الگوریتم دیگر در نمودارهای مختلف مقایسه خواهیم نمود. از آنجا که مقدار این شاخص بازهی مشخصی ندارد به ازاء هر خوشهبندی با تعداد خوشهی K یک نمودار مستقل ترسیم شده است. هر یک از شکلهای ۴-۶ تا ۴-۹ ارزیابی شاخص DB را به ترتیب برای مجموعههای دادهای iris، glass، vehicle و segment به ازاء ۵ الگوریتم نشان میدهند.
شکل ۴-۶ ارزیابی شاخص DB برای مجموعه دادهای iris در دو حالت با تعداد خوشههای ۳ و ۴
شکل ۴-۷ ارزیابی شاخص DB برای مجموعه دادهای glass در سه حالت با تعداد خوشههای ۴، ۶ و ۸
شکل ۴-۸ ارزیابی شاخص DB برای مجموعه دادهای vehicle در دو حالت با تعداد خوشههای ۴ و ۶٫ مقدار این شاخص برای الگوریتم HGPA با تعداد خوشههای ۴ و ۶ به ترتیب ۹۳٫۹۱۰ و ۸۲٫۰۸۲ میباشد که به دلیل تفاوت بسیار با دیگر مقادیر در نمودار ترسیم نشده است.
شکل ۴-۹ ارزیابی شاخص DB برای مجموعه دادهای segment در دو حالت با تعداد خوشههای ۵ و ۷
ارزیابیهای انجام شده برای شاخص DB نشان میدهد که خوشهبندیهای بدست آمده با بهره گرفتن از الگوریتم COHD از فشردگی و تفکیک شدگی مناسبتری نسبت به ۴ الگوریتم دیگر برخوردار است.