نویسندگان
دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت ایران، تهران، ایران
چکیده
یکی از مهمترین چالشهای توسعۀ اینترنت اشیاء، محدودیت انرژی تجهیزات است. در راستای کاهش مصرف انرژی، در این مقاله، ما مسئله کنترل توأم نرخ فشردهسازی (با اتلاف) و تعداد بستههای ارسالی در واحد زمان را برای یک گره اینترنت اشیاء مجهز به منبع انرژی تجدیدپذیر مطرح میکنیم. نوآوری راهکار پیشنهادی در توجه همزمان به دو هدف بهینهسازی یعنی: «سطح تطابق» دادههای دریافتی با دادههای اصلی و نیز رعایت قید تأخیر ارسال دادههاست. برای این منظور، با استفاده از چارچوب ریاضی فرآیند تصمیم مارکُفی مقیّد، مسئله را در قالب یک بهینهسازی تصادفی طرح میکنیم با هدف بیشینه کردن متوسط «سطح تطابق» دادهها در بلندمدت، ضمن ایجاد محدودیت در متوسط تأخیرِ گزارش رویدادهای حسگری. نامقیّدسازی مسئله با روش استاندارد «لاگرانژین» انجام میشود. الگوریتم پیشنهادی ما برای محاسبۀ سیاست بهینۀ تطبیقپذیر نیز بر مبنای دو تکنیک یادگیری تقویتی سریع به نام PDS و VE است که میتواند با جداسازی پویایی سیستم به دو بخش قطعی و تصادفی، صرفاً با اتخاذ تصمیمات حریصانه و بدون نیاز به دانش آماری فرآیندهای تصادفیِ کانالِ بیسیم، شارژ انرژی و وقوع رویدادهای حسگری، همگرایی به سیاست بهینه را تضمین نماید. کارایی سیاستهای پیشنهادی با الگوریتم استاندارد Q-learning مورد مقایسه قرار گرفته و به لحاظ مصرف انرژی، میزان هدررفت بستههای داده و همچنین «سطح تطابق» دادههای گزارش شده ارزیابی میشوند. نتایج نشان میدهند که سطح تطابق دادههای گزارش شده در روش VE نسبت به روش استاندارد Q-learning به میزان 63.741 درصد و روش PDS نسبت به روش استاندارد Q-learning میزان 61.845 درصد بهبود یافته است.
کلیدواژهها