‫ یک روش برای کاهش طبقه‌بندی داده با استفاده از تکنیک وزن‌دهی در SVM+

یک روش برای کاهش طبقه‌بندی داده با استفاده از تکنیک وزن‌دهی در SVM+

آرش قربان‌نیا دلاور, زهرا جعفری

چکیده

SVM یک الگوریتم یادگیری مرتبط به تجزیه و تحلیل داده‌ها و تشخیص الگوها مورد استفاده می‌باشد. اما مسئله مهمی که وجود دارد داده‌های تکراری و همچنین زمان پردازش واقعی آن بدرستی مورد محاسبه واقع نشده است. به همین دلیل در این مقاله ما یک روش +DCSVM که برای کاهش طبقه‌بندی داده‌ها با استفاده از تکنیک وزن‌دهی در+ SVMاست را ارائه داده‌ایم. روش پیشنهادی که با در نظر گرفتن پارامترها نسبت به+ SVM زمان پاسخگویی بهینه دارد. با مشاهده پارامتر حجم داده‌ها و چگالی آن‌ها توانستیم اندازه بازه را به‌صورت موردی قسمت‌بندی نماییم که این طبقه‌بندی نسبت به مطالعه موردی بررسی‌ شده زمان اجرای الگوریتم +SVM را کاهش می‌دهد. همچنین با ارائه تابع هدف روش پیشنهادی، توانستیم با ادغام نمودن پارامترها و قسمت‌بندی داده‌ها، داده‌های تکراری را نسبت به +SVM کاهش داده و درنهایت حدآستانه‌ای برای روش +DCSVM ارائه نمودیم تا با توجه به تابع صلاحیت، زمان پردازش را کاهش داده و همچنین سرعت پردازش داده‌ها را افزایش دهیم. در نهایت الگوریتم پیشنهادی با تکنیک وزن‌دهی تابع نسبت به +SVM از لحاظ کارآمدی بهینه ‌شده است.

کلمات کلیدی

داده کاوی, ماشین بردار پشتیبان, طبقه بندی داده, داده های تکراری, چگالی, حد آستانه

مراجع

  • [1] C. Serra-Toro, V. Javier Traver, and F. Pla, "ExploringSome Practical Issues of SVM+: Is Really PrivilegedInformation that Helps," Pattern Recogn. Lett., pp. 40-46,2014.
  • [2] M. Lapin, M. Hein, and B. Schiele, "Learning UsingPrivileged Information: SVM+ and Weighted SVM," NeuralNetworks, vol. 53, pp. 95–108, 2014.
  • [3] J. Feyereisl, and U. Aickelin, "Privileged Information forData Clustering," Information Sciences, vol. 194, pp. 4–23,2012.
  • [4] D. Pechyony, and V. Vapnik, Fast OptimizationAlgorithms for Solving SVM+, in Statistical Learning andData Science, Chapman and Hall/CRC, 2011, ch. 3, pp.27-42.
  • [5] D. Pechyony, and V. Vapnik, "On the Theory of Learningwith Privileged Information," Proc. NIPS, pp. 1894–1902,2010.
  • [6] D. Bollegala, Y. Matsuo, and M. Ishizuka, "A WebSearch Engine-based Approach to Measure SemanticsSimilarity between Words," IEEE Trans. Knowl. Data Eng.vol. 23, pp, 977–990, 2011.
  • [7] M. M. Rahman, S. K. Antani, and G. R. Thoma, "ALearning-based Similarity Fusion and Filtering Approach forBiomedical Image Retrieval using SVM Classification andRelevance Feedback," IEEE Trans. Inf. Technol. Biomed.vol. 15, pp. 640–646, 2011.
  • [8] C.-C. Chang, and C.-J. Lin, "LIBSVM: a Library forSupport Vector Machines," ACM Trans. Intell. Syst.Technol. vol. 2, 2011.
  • [9] B. Ribeiro, C. Silva, A. Vieira, A. Gaspar-Cunha, and J.das Neves, "Financial Distress Model Prediction usingSVM+," Proc. IJCNN, pp. 1–7, 2010.
  • [10] D. Pascual, F. Pla, and J. S. Sanchez, "ClusterValidation Using Information Stability Measures," PatternRecogn. Lett., vol. 31, pp. 454–461, 2010.
  • [11] D. Pechyony, R. Izmailov, A. Vashist, and V. Vapnik,
  • "SMO-style Algorithms for Learning using PrivilegedInformation," Proc. Int. Conf. Data Mining, pp. 235–241,2010.
  • [12] F. Chang, C. Y. Guo, X. R. Lin, and C. J. Lu, "TreeDecomposition for Large-scale SVM Problems," J. Mach.Learn. Res., vol. 11, pp. 2935–2972, 2010.
  • [13] O. Amayri, andN. Bouguila, "A Study of Spam Filteringusing Support Vector Machines," Artif. Intel. Rev., vol. 34,pp. 73–108, 2010.
  • [14] V. Vapnik, and A. Vashist, "A New Learning Paradigm:Learning using Privileged Information," Neural Networks,vol. 22, pp. 544–557, 2009.
  • [15] V. Vapnik, A. Vashist, and N. Pavlovitch, Learningusing Hidden Information: Master-class Learning, Proc.NATO Workshop on Mining Massive Data Sets for Security,pp. 3–14, 2008.
  • [16] L. Liang, and V. Cherkassky, "Connection betweenSVM+ and Multi-task Learning," Proc. International JointConference on Neural Networks, pp. 2048–2054, 2008.