نویسندگان
1 دانشکده مهندسی، دانشگاه زنجان, دانشکده ریاضی، دانشگاه تحصیلات تکمیلی علوم پایه زنجان
2 دانشکده برق رایانه و فناوری اطلاعات، دانشگاه آزاد اسلامی قزوین
چکیده
در تیمهای رباتیک خودمختار در کاربردهای دنیای واقعی لازم است عاملها برای رسیدن به بیشترین سود باهم همکاری کنند. تصمیمگیری و چگونگی عملکرد و همکاری آنان با هم به دلیل پویا بودن محیط، پیوستگی برخی از پارامترها، غیرقطعی بودن محیط و ناشناخته بودن همتیمیها فرآیندی پیچیده محسوب میشود. در این مقاله مأموریت نظارت مداوم پهپادها به عنوان یک سیستم چندعامله در دنیای واقعی معرفی شده است. در ادامه، مسئله تصمیمگیری برخط عاملها در شرایطی که اعضای تیم و محیط به طور کامل شناخته شده نیستند، مطرح شده است . این مسئله با کمک فرآیند تصمیمگیری مارکوف مدل شده و درنهایت یک الگوریتم حریصانه برای تصمیمگیری برخط عامل در تیم ارائه شده است. آزمایشهای انجام شده نشان میدهند این روش تصمیمگیری که مبتنی بر دانش آموخته شده قبلی عامل است، عملکرد تیم را در محیط ناشناخته بهبود میدهد.
کلیدواژهها