نوع مقاله : مقاله پژوهشی
نویسندگان
دانشکده مهندسی صنایع و سیستمها، دانشگاه تربیت مدرّس، تهران، ایران
چکیده
یکی از عناصر مهم در تحلیل ژست افراد، تخمین زاویۀ سر است؛ لیکن یکی از موانع اصلی برای این تخمین، هزینة برچسبگذاری تصاویر است. برچسبگذاری زاویة سر افراد در تصاویر مختلف فرایندی هزینهبر، زمانگیر و نیازمند دانش تاحدی تخصصی است. از همین رو تصاویر برچسبدار برای مسئلة تخمین زاویة سر در مقایسه با بقیة مسائل بینایی رایانه محدود است. یکی از راهحلهای جبران کمبود برچسبها، استفاده از روشهای خودنظارتی است. روشهای خودنظارتی میتوانند از دادههای بدون برچسب (تصاویر چهرة افراد)، به طریق پیش آموزش دادن شبکههای عصبی ژرف، ویژگیهای مناسبی برای تخمین زاویة سر استخراج کنند. در کنار پیش آموزش دادن شبکههای ژرف به روش یادگیری خودنظارتی، میتوان از وظایف خودنظارتی به عنوان تابع هزینة کمکی در کنار وظیفة اصلی تخمین زاویة سر استفاده کرد. این مقاله سعی دارد که تمایز استفاده از روشهای یادگیری خودنظارتی برای تخمین زاویة سر را نشان دهد. همچنین نشان داده میشود که با طراحی معماری یادگیری چند وظیفهای از ترکیب توابع هزینة بانظارت و خود نظارتی، میانگین خطای تخمین زاویة سر تا 29 درصد نسبت به روش پایه بانظارت و معماری HopeNet کاهش مییابد.
کلیدواژهها