بهبود بازیابی تصاویر رنگی با استفاده از رنگ، بافت و شکل در روش کیسه کلمات بصری مبتنی بر امضاء

نویسندگان

دانشکده فنی مهندسی، دانشگاه آزاد اسلامی واحد خوراسگان(اصفهان)، اصفهان، ایران

چکیده

تولید و ذخیره‌سازی تصاویر به صورت دیجیتالی باعث بوجود آمدن سیستم‌های بازیابی تصویر، با قابلیت بازیابی تصاویر با استفاده از محتوای بصری آن‌ها گردید. در بین سیستم‌های بازیابی تصویر مبتنی بر متن و یا محتوا، روش‌های مبتنی بر محتوا عملکرد جامع‌تر و بهتری دارند. اما یکی از نکاتی که در موفقیت این سیستم‌ها تاثیر بسزایی دارد ویژگی‌های مستخرج از تصاویر است. به این معنی که اگر ویژگی‌های مناسب و کاملی از تصاویر استخراج نشود، دقت این روش‌ها در بازیابی کاهش می‌یابد. یکی از روش‌هایی که اخیرا در حوزه بازیابی مبتنی بر محتوا بسیار مورد توجه محققین قرار گرفته است، تکنیک کیف کلمات بصری مبتنی بر امضاء است که بدون استفاده از روش‌های خوشه‌بندی ویژگی‌ها را کوانتیزه می‌کند. با وجود اینکه برتری این روش نسبت به روش کیف کلمات در مقالات اخیر گزارش شده است، اما برای رسیدن به نتایج مناسب، تصاویر را به بلوک‌های بسیار کوچکی تقسیم می‌کند تا به این صورت بتواند با تکیه بر ویژگی‌های محلی، به کلمات مشابهی در تصاویر مختلف دست یابد. به بیان دیگر، در تکنیک کیف کلمات بصری مبتنی بر امضاء ویژگی‌های سراسری نادیده گرفته می‌شود و بنابراین این روش برای هر نوع تصویری مناسب نیست و در بسیاری از پایگاه داده‌ها عملکرد ضعیفی دارد. از اینرو در این مقاله در جهت بهبود دقت بازیابی تصاویر از ترکیب سه ویژگی سراسری گابور، هیستوگرام جهت لبه و هیستوگرام گرادیان جهت‌دار با دو ویژگی محلی رنگ و بافت سراسری غالب به صورت کیف کلمات بصری مبتنی بر امضا استفاده شده است، تا به این صورت بتوان دانش کافی از محتوای تصاویر استخراج نمود و در نتیجه دقت بازیابی را بهبود داد. نتایج ارزیابی بر روی دو پایگاه داده Wang و Oxford حاکی از آن است که مدل پیشنهادی در مقایسه با روش پیشین در معیار دقت بهبود داشته است.

کلیدواژه‌ها

  • [1] M. Rehman, M. Iqbal, M. Sharif, and M. Raza, "Content based image retrieval: survey," World Applied Sciences Journal, vol. 19, pp. 404-412, 2012.
  • [2] A. Sandhu and A. Kochhar, "Content based image retrieval using texture, color and shape for image analysis," International Journal of Computers & Technology, vol. 3, pp. 149-152, 2012.
  • [3] T. W. Cai, J. Kim, and D. D. Feng, "Content-based medical image retrieval," in Biomedical information technology, ed: Elsevier, 2008, pp. 83-113.
  • [4] J. M. Dos Santos, E. S. De Moura, A. S. Da Silva, and R. da Silva Torres, "Color and texture applied to a signature-based bag of visual words method for image retrieval," Multimedia Tools and Applications, vol. 76, pp. 16855-16872, 2017.
  • [5] Y. Rui, T. S. Huang, and S.-F. Chang, "Image retrieval: Past, present, and future," in Journal of Visual Communication and Image Representation, 1997.
  • [6] A. Kumar, J. Kim, W. Cai, M. Fulham, and D. Feng, "Content-based medical image retrieval: a survey of applications to multidimensional and multimodality data," Journal of digital imaging, vol. 26, pp. 1025-1039, 2013.
  • [7] C. B. Akgül, D. L. Rubin, S. Napel, C. F. Beaulieu, H. Greenspan, and B. Acar, "Content-based image retrieval in radiology: current status and future directions," Journal of digital imaging, vol. 24, pp. 208-222, 2011.
  • [8] T. Mei, Y. Wang, X.-S. Hua, S. Gong, and S. Li, "Coherent image annotation by learning semantic distance," in Computer Vision and Pattern Recognition, 2008. CVPR 2008. IEEE Conference on, 2008, pp. 1-8.
  • [9] J. Li and J. Z. Wang, "Automatic linguistic indexing of pictures by a statistical modeling approach," IEEE Transactions on pattern analysis and machine intelligence, vol. 25, pp. 1075-1088, 2003.
  • [10] D. M. Blei and M. I. Jordan, "Modeling annotated data," in Proceedings of the 26th annual international ACM SIGIR conference on Research and development in informaion retrieval, 2003, pp. 127-134.
  • [11] Z.-J. Zha, X.-S. Hua, T. Mei, J. Wang, G.-J. Qi, and Z. Wang, "Joint multi-label multi-instance learning for image classification," in Computer Vision and Pattern Recognition, 2008. CVPR 2008. IEEE Conference on, 2008, pp. 1-8.
  • [12] S. Zhang, J. Huang, Y. Huang, Y. Yu, H. Li, and D. N. Metaxas, "Automatic image annotation using group sparsity," in Computer Vision and Pattern Recognition (CVPR), 2010 IEEE Conference on, 2010, pp. 3312-3319.
  • [13] J. Tang, H. Li, G.-J. Qi, and T.-S. Chua, "Image annotation by graph-based inference with integrated multiple/single instance representations," IEEE Transactions on Multimedia, vol. 12, pp. 131-141, 2010.
  • [14] Y. Wang, T. Mei, S. Gong, and X.-S. Hua, "Combining global, regional and contextual features for automatic image annotation," Pattern Recognition, vol. 42, pp. 259-266, 2009.
  • [15] D. Aldavert, M. Rusiñol, R. Toledo, and J. Lladós, "A study of Bag-of-Visual-Words representations for handwritten keyword spotting," International Journal on Document Analysis and Recognition (IJDAR), vol. 18, pp. 223-234, 2015.
  • [16] T. Deselaers, L. Pimenidis, and H. Ney, "Bag-of-visual-words models for adult image classification and filtering," in Pattern Recognition, 2008. ICPR 2008. 19th International Conference on, 2008, pp. 1-4.
  • [17] A. Bosch, X. Muñoz, and R. Martí, "Which is the best way to organize/classify images by content?," Image and vision computing, vol. 25, pp. 778-791, 2007.
  • [18] D. Filliat, "A visual bag of words method for interactive qualitative localization and mapping," in Robotics and Automation, 2007 IEEE International Conference on, 2007, pp. 3921-3926.
  • [19] M. L. A. Vidal, J. M. Cavalcanti, E. S. de Moura, A. S. da Silva, and R. da Silva Torres, "Sorted dominant local color for searching large and heterogeneous image databases," in Proceedings of the 21st International Conference on Pattern Recognition (ICPR2012), 2012, pp. 1960-1963.
  • [20] J. Liu, "Image retrieval based on bag-of-words model," arXiv preprint arXiv:1304.5168, 2013.
  • [21] N. Chathurani, S. Geva, V. Chandran, and T. Chappell, "Content based image retrieval using signature representation," in 12th Australasian Data Mining Conference, 2014.
  • [22] M. Alkhawlani, M. Elmogy, and H. Elbakry, "Content-based image retrieval using local features descriptors and bag-of-visual words," Int J Adv Comput Sci Appl, vol. 6, pp. 212-219, 2015.
  • [23] E. G. Karakasis, A. Amanatiadis, A. Gasteratos, and S. A. Chatzichristofis, "Image moment invariants as local features for content based image retrieval using the bag-of-visual-words model," Pattern Recognition Letters, vol. 55, pp. 22-27, 2015.
  • [24] J. M. dos Santos, E. S. de Moura, A. S. da Silva, J. M. B. Cavalcanti, R. da Silva Torres, and M. L. A. Vidal, "A signature-based bag of visual words method for image indexing and search," Pattern Recognition Letters, vol. 65, pp. 1-7, 2015.
  • [25] I. Dimitrovski, D. Kocev, S. Loskovska, and S. Džeroski, "Improving bag-of-visual-words image retrieval with predictive clustering trees," Information Sciences, vol. 329, pp. 851-865, 2016.
  • [26] F. B. Silva, R. d. O. Werneck, S. Goldenstein, S. Tabbone, and R. d. S. Torres, "Graph-based bag-of-words for classification," Pattern Recognition, vol. 74, pp. 266-285, 2018.
  • [27] D. Y. T. Chino, L. C. Scabora, M. T. Cazzolato, A. E. S. Jorge, C. Traina, and A. J. M. Traina, "ICARUS: retrieving skin ulcer images through bag-of-signatures," in 2018 IEEE 31st International Symposium on Computer-Based Medical Systems (CBMS), 2018, pp. 82-87.
  • [28] D. Y. Chino, L. C. Scabora, C. Traina Jr, and A. J. Traina, "Boss: Image retrieval using bag-of-superpixels signatures," in Proceedings of the 33rd Annual ACM Symposium on Applied Computing, 2018, pp. 309-312.
  • [29] L. Kabbai, M. Abdellaoui, and A. Douik, "Image classification by combining local and global features," The Visual Computer, vol. 35, pp. 679-693, 2019.
  • [30] A. Rashno and E. Rashno, "Content-based image retrieval system with most relevant features among wavelet and color features," arXiv preprint arXiv:1902.02059, 2019.
  • [31] U. Sharif, Z. Mehmood, T. Mahmood, M. A. Javid, A. Rehman, and T. Saba, "Scene analysis and search using local features and support vector machine for effective content-based image retrieval," Artificial Intelligence Review, vol. 52, pp. 901-925, 2019.
  • [32] A. Sarwar, Z. Mehmood, T. Saba, K. A. Qazi, A. Adnan, and H. Jamal, "A novel method for content-based image retrieval to improve the effectiveness of the bag-of-words model using a support vector machine," Journal of Information Science, vol. 45, pp. 117-135, 2019.
  • [33] V. Geetha, V. Anbumani, S. Sasikala, and L. Murali, "Efficient hybrid multi-level matching with diverse set of features for image retrieval," Soft Computing, pp. 1-22, 2020.
  • [34] S. Z. Jumani, F. Ali, I. A. Kandhro, Q. A. Lakhan, U. Ali, M. W. Haroon, and S. Ahmed, "Facial Emotion Identification Based on Local Binary Pattern Feature Detector," Indian Journal of Science and Technology, vol. 12, p. 28, 2019.
  • [35] M. Haghighat, S. Zonouz, and M. Abdel-Mottaleb, "CloudID: Trustworthy cloud-based and cross-enterprise biometric identification," Expert Systems with Applications, vol. 42, pp. 7905-7916, 2015.
  • [36] B. Green, "Canny edge detection tutorial," Retrieved: March, vol. 6, p. 2005, 2002.
  • [37] A. Latif, A. Rasheed, U. Sajid, J. Ahmed, N. Ali, N. I. Ratyal, B. Zafar, S.H. Dar, M. Sajid, and T. Khalil, "Content-based image retrieval and feature extraction: a comprehensive review," Mathematical Problems in Engineering, vol. 2019, 2019.
  • [38] "Wang," ed. http://wang.ist.psu.edu/docs/related/.
  • [39]"OXBuilding,"ed. http://www.robots.ox.ac.uk/~vgg/data/oxbuildings/.
دوره 18، شماره 1
بهار و تابستان
اردیبهشت 1399