‫ شناسایی رویداد در ویدیو با استفاده از شبکه عصبی عمیق بهینه

شناسایی رویداد در ویدیو با استفاده از شبکه عصبی عمیق بهینه

امیرحسین زنگنه, مهدی چم‌پور, کامران لایقی

چکیده

یادگیری عمیق به عنوان یکی از تکنیک‌های یادگیری ماشین، از پیشرفت‌های فناوری واحدهای پردازش گرافیکی استفاده کرده و این امر به نوبه خود استفاده گسترده از آن را فراهم آورده ‌است. تکنیک‌های یادگیری عمیق  به نتایج بسیار خوبی در بسیاری از مسائل مهم از جمله شناسایی و تشخیص رویداد در ویدیوی ورزش فوتبال، در مقایسه با روش‌های سنتی دست یافته‌اند. یکی از چالش های عمده استفاده از شبکه‌های عصبی عمیق برای مدیریت و طبقه بندی تصاویر، تعداد بسیار زیاد پارامترهای قابل آموزش در این نوع شبکه‌ها است که منجر به بار محاسباتی بالا و زمان طولانی برای آموزش شبکه عصبی عمیق می‌شود.

شبکه عصبی دنس‌نت  یکی از آخرین شبکه‌های ارائه شده برای اهداف شناسایی و تشخیص اشیاء هست. ما در این مقاله از شبکه عصبی عمیق دنس‌نت برای شناسایی و تشخیص رویدادهای کارت زرد و قرمز، پنالتی و ضربه آزاد در ویدیوی ورزش فوتبال به عنوان یک معماری پایه استفاده کرده‌ایم. تعداد و اندازه بلوک‌های شبکه دنس-نت در تعداد پارامترهای قابل آموزش و همچنین دقت شبکه تاثیر گذار است. 

در این مقاله ما سعی کرده‌ایم با ایجاد تغییر در معماری پایه شبکه عصبی عمیق دنس‌نت با حفظ دقت، تعداد پارامترهای قابل آموزش این شبکه را کاهش دهیم. برای این منظور با بررسی حالت‌های ممکن برای قرار گیری بلوک‌های با سایز مختلف شبکه دنس‌نت اقدام به ارائه یک معماری پیشنهادی برای شبکه عصبی عمیق کرده‌ایم. نتایج ارزیابی‌ها، نشان‌دهنده کاهش تعداد پارامترهای قابل آموزش شبکه عصبی عمیق و در عین حال افزایش دقت معماری پیشنهادی برای شناسایی و تشخیص رویدادهای مهم در ورزش فوتبال است


کلمات کلیدی

مراجع