نویسندگان
دانشکده مهندسی و علوم کامپیوتر، دانشگاه شهید بهشتی، تهران، ایران
چکیده
ظهور مفهومGPGPU همراه با CUDA ومدلهای برنامه نویسی نظیرOpenCl ، فرصتهای جدیدی را برای کاهش تأخیر و توان مصرفیِ برنامههای کارایی محور فراهم میکند. GPU میتواند هزاران نخ پردازشی موازی را برای پنهان کردن تأخیر پرهزینه دسترسی به حافظه اجرا کند. با این حال، برای برخی از برنامههای حافظه محور، به احتمال زیاد در برخی فواصل زمانی تمام نخهای پردازشی یک هسته متوقف شده و منتظر تأمین داده توسط واحد حافظه هستند. در این پژوهش هدف ما بهبود تأخیر دسترسی به حافظه برای بستههای تولیدی توسط هستههای بحرانی در پردازندههای گرافیکی است. به منظور بهبود زمان غیربهینه هستهها، ما بر روی شبکه میان ارتباطی بین هستهها و حافظه پنهان سطح آخر تمرکز و بسته مربوط به هستههایی که تعداد بیشتری نخ متوقف شده دارند را در ورود به شبکه و داوری در شبکه اولویت قرار میدهیم. به این ترتیب ، بیشترین اولویت در داوری و تخصیص منابع به بستههای بحرانیتر اعطا میشود، بنابراین درخواست حافظه برای آنها سریعتر سرویس دهی شده و متوسط زمان توقف هسته کاهش و در نهایت کارایی پردازنده گرافیکی افزایش مییابد.
کلیدواژهها