شناسایی رویداد در ویدیو با استفاده از شبکه عصبی عمیق بهینه

نویسندگان

1 دانشکده مهندسی برق و کامپیوتر، واحد تهران شمال، دانشگاه آزاد اسلامی، تهران، ایران

2 دانشکده مهندسی کامپیوتر، دانشگاه صنعتی قوچان، قوچان، ایران

چکیده

یادگیری عمیق به عنوان یکی از تکنیک‌های یادگیری ماشین، از پیشرفت‌های فناوری واحدهای پردازش گرافیکی استفاده کرده و این امر به نوبه خود استفاده گسترده از آن را فراهم آورده ‌است. تکنیک‌های یادگیری عمیق  به نتایج بسیار خوبی در بسیاری از مسائل مهم از جمله شناسایی و تشخیص رویداد در ویدیوی ورزش فوتبال، در مقایسه با روش‌های سنتی دست یافته‌اند. یکی از چالش های عمده استفاده از شبکه‌های عصبی عمیق برای مدیریت و طبقه بندی تصاویر، تعداد بسیار زیاد پارامترهای قابل آموزش در این نوع شبکه‌ها است که منجر به بار محاسباتی بالا و زمان طولانی برای آموزش شبکه عصبی عمیق می‌شود.شبکه عصبی دنس‌نت  یکی از آخرین شبکه‌های ارائه شده برای اهداف شناسایی و تشخیص اشیاء هست. ما در این مقاله از شبکه عصبی عمیق دنس‌نت برای شناسایی و تشخیص رویدادهای کارت زرد و قرمز، پنالتی و ضربه آزاد در ویدیوی ورزش فوتبال به عنوان یک معماری پایه استفاده کرده‌ایم. تعداد و اندازه بلوک‌های شبکه دنس-نت در تعداد پارامترهای قابل آموزش و همچنین دقت شبکه تاثیر گذار است. در این مقاله ما سعی کرده‌ایم با ایجاد تغییر در معماری پایه شبکه عصبی عمیق دنس‌نت با حفظ دقت، تعداد پارامترهای قابل آموزش این شبکه را کاهش دهیم. برای این منظور با بررسی حالت‌های ممکن برای قرار گیری بلوک‌های با سایز مختلف شبکه دنس‌نت اقدام به ارائه یک معماری پیشنهادی برای شبکه عصبی عمیق کرده‌ایم. نتایج ارزیابی‌ها، نشان‌دهنده کاهش تعداد پارامترهای قابل آموزش شبکه عصبی عمیق و در عین حال افزایش دقت معماری پیشنهادی برای شناسایی و تشخیص رویدادهای مهم در ورزش فوتبال است

کلیدواژه‌ها

  • [1] R. da Silva and S. R. Dahmen, “Universality in the distance between two teams in a football tournament,” Physica A: Statistical Mechanics and its Applications, vol. 398, pp. 56–64, 2014.
  • [2] K. Bandyopadhyay, Legacies of Great Men in World Soccer: Heroes, Icons, Legends. Routledge, 2017.
  • [3] M. Fei, W. Jiang, and W. Mao, “Creating personalized video summaries via semantic event detection,” Journal of Ambient Intelligence and Humanized Computing, pp. 1–12, 2018.
  • [4] J. Yu, A. Lei, and Y. Hu, “Soccer Video Event Detection Based on Deep Learning,” in International Conference on Multimedia Modeling, 2019, pp. 377–389.
  • [5] M. N. Ali, M. Abdullah-Al-Wadud, and S.-L. Lee, “An efficient algorithm for detection of soccer ball and players,” Proc. 16th ASTL Control and Networking, vol. 16, 2012.
  • [6] A. Bialkowski, P. Lucey, P. Carr, Y. Yue, S. Sridharan, and I. Matthews, “Large-scale analysis of soccer matches using spatiotemporal tracking data,” in 2014 IEEE International Conference on Data Mining, 2014, pp. 725–730.
  • [7] W. Dubitzky, P. Lopes, J. Davis, and D. Berrar, “The open international soccer database for machine learning,” Machine Learning, vol. 108, no. 1, pp. 9–28, 2019.
  • [8] C. Cuevas, D. Quilón, and N. García, “Techniques and applications for soccer video analysis: A survey,” Multimedia Tools and Applications, vol. 79, no. 39, pp. 29685–29721, 2020.
  • [9] Z. Wang, J. Yu, and Y. He, “Soccer video event annotation by synchronization of attack–defense clips and match reports with coarse-grained time information,” IEEE Transactions on Circuits and Systems for Video Technology, vol. 27, no. 5, pp. 1104–1117, 2016.
  • [10] K. Tang, Y. Bao, Z. Zhao, L. Zhu, Y. Lin, and Y. Peng, “AutoHighlight: Automatic Highlights Detection and Segmentation in Soccer Matches,” in 2018 IEEE International Conference on Big Data (Big Data), 2018, pp. 4619–4624.
  • [11] S. Jai-Andaloussi, A. Mohamed, N. Madrane, and A. Sekkaki, “Soccer video summarization using video content analysis and social media streams,” in 2014 IEEE/ACM International Symposium on Big Data Computing, 2014, pp. 1–7.
  • [12] P. Shi and X. Yu, “Goal event detection in soccer videos using multi-clues detection rules,” in Management and Service Science, 2009. MASS’09. International Conference on, 2009, pp. 1–4.
  • [13] M.-L. Shyu, Z. Xie, M. Chen, and S.-C. Chen, “Video semantic event/concept detection using a subspace-based multimedia data mining framework,” IEEE Transactions on Multimedia, vol. 10, no. 2, pp. 252–259, 2008.
  • [14] M. H. Kolekar, “Bayesian belief network based broadcast sports video indexing,” Multimedia Tools and Applications, vol. 54, no. 1, pp. 27–54, 2011.
  • [15] D. W. Tjondronegoro and Y.-P. P. Chen, “Knowledge-discounted event detection in sports video,” Ieee transactions on systems, man, and cybernetics-part a: Systems and humans, vol. 40, no. 5, pp. 1009–1024, 2010.
  • [16] M. Y. Eldib, B. S. A. Zaid, H. M. Zawbaa, M. El-Zahar, and M. El-Saban, “Soccer video summarization using enhanced logo detection,” in Image Processing (ICIP), 2009 16th IEEE International Conference on, 2009, pp. 4345–4348.
  • [17] B. Fakhar, H. R. Kanan, and A. Behrad, “Event detection in soccer videos using unsupervised learning of Spatio-temporal features based on pooled spatial pyramid model,” Multimedia Tools and Applications, pp. 1–31, 2019.
  • [18] Z. Dang, J. Du, Q. Huang, and S. Jiang, “Replay detection based on semi-automatic logo template sequence extraction in sports video,” in Image and Graphics, 2007. ICIG 2007. Fourth International Conference on, 2007, pp. 839–844.
  • [19] H. Pan, P. Van Beek, and M. I. Sezan, “Detection of slow-motion replay segments in sports video for highlights generation,” in icassp, 2001, pp. 1649–1652.
  • [20] H. M. Zawbaa, N. El-Bendary, A. E. Hassanien, and T. Kim, “Event detection based approach for soccer video summarization using machine learning,” International Journal of Multimedia and Ubiquitous Engineering, vol. 7, no. 2, pp. 63–80, 2012.
  • [21] G. Huang, Z. Liu, L. Van Der Maaten, and K. Q. Weinberger, “Densely connected convolutional networks,” in Proceedings of the IEEE conference on computer vision and pattern recognition, 2017, pp. 4700–4708.
دوره 18، شماره 2
پاییز و زمستان
آذر 1399