‫ دسته‌بندی نیمه نظارتی منیفلدهای متقاطع بر مبنای تمایز نقاط داخلی منیفلدها از سایر نقاط

دسته‌بندی نیمه نظارتی منیفلدهای متقاطع بر مبنای تمایز نقاط داخلی منیفلدها از سایر نقاط

زهره كریمی, سعید شیری قیداری, محمد رحمتی, روح اله رمضانی

چکیده

دسته‌بندی نیمه نظارتی مبتنی بر منیفلد در سال‌های اخیر مورد توجه بسیاری از پژوهشگران واقع شده است. رویکردهای موجود از فاصله اقلیدسی به صورت محلی برای تقریب فاصله روی منیفلدها و اعمال فرض هموار بودن روی منیفلد استفاده می‌کنند. در فضایی که چند منیفلد با یکدیگر اشتراک دارند این تقریب در نواحی اشتراک صحیح نبوده و باعث انتشار اشتباه برچسب‌ها می‌شود. در این مقاله الگوریتمی بر مبنای تفکیک نقاط داخلی منیفلد از سایر نقاط جهت دسته‌بندی نیمه‌نظارتی روی منیفلدهای متقاطع جهت یادگیری دسته‌بند مبتنی بر اتصالات مطمئن‌تر در گراف ارائه‌کننده‌ی داده پیشنهاد شده است. الگوریتم پیشنهادی وزن یال‌های گراف ارائه‌کننده‌ی منیفلد را جهت انتشار برچسب اصلاح می‌کند. در مقایسه با رویکردهای دسته‌بندی نیمه نظارتی روی چند منیفلد، رویکرد پیشنهادی بر مبنای این فرض‌های محدودکننده نیست: مشخص بودن ابعاد ذاتی منیفلدها، نیاز به تعداد خیلی زیاد داده‌های بدون برچسب جهت تخمین منیفلدها و انتساب خصوصیات همسایگی مشابه به تمام نقاط. آزمایش‌ها روی مجموعه داده‌های مصنوعی و واقعی نشان‌دهنده‌ی دقت خوب روش پیشنهادی نسبت به روش‌های مشابه است.

کلمات کلیدی

دسته بندی نيمه نظارتي, منيفلدهای متقاطع, لاپلاسين, فرض هموار بودن