نظرکاوی بین‌زبانی با استفاده از ویژگی‌های معنایی

نویسندگان

دانشکده مهندسی ﺑﺮق وﻛﺎﻣﭙﻴﻮﺗﺮ،دانشگاه ﺗﻬﺮان،ﺗﻬﺮان، اﻳﺮان

چکیده

نظرکاوی یکی از زیربخش‌های متن‌کاوی است. در این حوزه به بررسی متن‌های نظرمند پرداخته می‌شود و هدف تشخیص مثبت و یا منفی بودن مفهوم این متن‌ها است. روش‌ها و راه‌حل‌های پیشنهادی در این حوزه به دو دسته باناظر و بدون ‌ناظر دسته‌بندی می‌شود. از آن‌جا که روش‌های باناظر کارایی و دقت بالاتری نسبت به روش‌های بدون ناظر دارد، سعی می‌شود تا آن‌جایی که امکان دارد شرایط برای استفاده از روش‌های باناظر فراهم شود. اصلی‌ترین نیازمندی این روش‌ها، داده‌های برچسب‌خورده، به عنوان داده آموزش، در دامنه و زبان داده‌های آزمون است. وجود چنین داده‌هایی در تمام جفت دامنه‌ و زبان‌ها محدودیتی برای استفاده از این گونه روش‌ها محسوب می‌شود. با توجه به زمان‌بر و پرهزینه بودن تولید داده‌های برچسب‌خورده به عنوان داده‌های آموزش، معمولاً ایجاد چنین مجموعه داده‌ای به عنوان بهترین راه‌حل در نظر گرفته نمی‌شود. همچنین به دلیل بیان متفاوتی که در دامنه‌ها و زبان‌های متفاوت وجود دارد، استفاده از داده‌های آموزش موجود در دامنه و یا زبان متفاوت به طور مستقیم موجب کاهش کارایی روش‌ها می‌شود. اما وجود داده‌های آموزش در اکثر دامنه‌ها در زبان‌های با منابع غنی انگیزه‌ای برای استفاده غیرمستقیم از این داده‌ها برای نظرکاوی داده‌های آزمون در زبان‌های دیگر ایجاد می‌کند. از این رو روش‌هایی به عنوان روش‌های بین‌زبانی ارائه شد که در آن‌ها از داده‌های آموزش موجود در زبان متفاوت با داده‌های آزمون، برای استخراج اطلاعات و در نهایت انتقال اطلاعات به زبان مورد نظر، بهره می‌برد. در این مقاله روشی برای نظرکاوی بین‌زبانی ارائه می‌شود که این استخراج و انتقال اطلاعات با کیفیت بالایی انجام می‌شود و همچنین برای اکثر زبان‌ها، حتی زبان‌های منابع‌محدود نیز قابل استفاده می‌باشد و به منابع موجود در زبان مورد نظر وابستگی کمی دارد. این روش با استفاده از داده‌های بدون برچسب در هر دو زبان مبدأ و مقصد، یک گراف دوبخشی بین دو دسته از ویژگی‌های محوری و غیرمحوری می‌سازد و ویژگی‌های معنایی را از آن استخراج می‌کند. تنها منبع مورد نیاز برای این روش، یک لغت‌نامه است که به دلیل استفاده از تعداد محدودی از ترجمه‌های آن، میزان وابستگی بالایی به این منبع ندارد.

کلیدواژه‌ها

  • [1] P. D. Turney, "Thumbs Upor Thumbs Down? SemanticOrientation Applied to Unsupervised Classification of Reviews,"
  • Proc. Annu. Meet. ACL, 2002.
  • [2] B. Pang, L. Lee, and S. Vaithyanathan, "Thumbs Up?:Sentiment Classification UsingMachine Learning Techniques,"
  • Proc. Conf. EMNLP, 2002.
  • [3] D. Tang, and et. al., "Sentiment Embeddings with Applicationsto Sentiment Analysis,"IEEE Trans. Knowledge and DataEngineering, vol. 28, pp. 496-509, 2016.
  • [4] T. Zagibalov, and J. Carroll, "Automatic Seed Word Selectionfor Unsupervised Sentiment Classification of Chinese Text,"Proc.Int"l Conf. COLING, 2008.
  • [5] X. Wan, "Co-Training for Cross-Lingual SentimentClassification,"Proc. ACL/AFNLP Int"l Joint Conf., 2009.
  • [6] X. Wan, "Bilingual Co-Trainingfor Sentiment Classification ofChinese Product Reviews,"Computational Linguistics, vol. 37, pp.587-616, 2011.
  • [7] A. Y. Ng, M. I. Jordan, andY. Weiss, "On Spectral Clustering:Analysis and an Algorithm,"Advances in NIPS, 2001.
  • [8] B. Pang, and L. Lee, "A Sentimental Education: SentimentAnalysis Using SubjectivitySummarization Based on MinimumCuts,"Proc. Annu. Meet. ACL, 2004.
  • [9] Y. Dang, Y. Zhang, and H.Chen, "A Lexicon-EnhancedMethod for Sentiment Classification: An Experiment on OnlineProduct Reviews,"IEEE Intelligent Systems, vol. 25, pp. 46-53,2010.
  • [10] Y. Hu, and et. al., "A Language Modeling Approach toSentiment Analysis,"Proc. Int"l Conf. ICCS, 2007.
  • [11] M. Thelwall, and et. al.,"Sentiment in Short StrengthDetection Informal Text,"JASIST, vol. 61, pp. 2544-2558, 2010.
  • [12] T. Mikolov, and et. al., "Distributed Representations of Wordsand Phrases and their Compositionality,"Advances in NIPS, 2013.
  • [13] A. L. Maas, and et. al., "Learning Word Vectors for SentimentAnalysis,"Proc. Annu. Meet. ACL, 2011.
  • [14] I. Labutov, and H. Lipson, "Re-Embedding Words,"Proc.Annu. Meet. ACL, 2013.
  • [15] D. Tang, and et. al., "Sentiment Embeddings with Applicationsto Sentiment Analysis,"IEEE Trans. Knowledge and DataEngineering, vol. 28, pp. 496-509, 2016.
  • [16] D. Davidov, O. Tsur, andA. Rappoport, "Enhanced SentimentLearning Using Twitter Hashtags and Smileys,"Proc. Int"l Conf.COLING, 2010.
  • [17] C. Tan, and et. al., "User-Level Sentiment AnalysisIncorporating Social Networks,"Proc. ACM Int"l Conf. SIGKDD,2011.
  • [18] J. S. Olsson, D. W. Oard,and J. Hajic, "Cross-Language TextClassification,"Proc. Annu. Int"l ACM Conf. SIGIR, 2005
  • [19] J. Brooke, M. Tofiloski,and M. Taboada, "Cross-LinguisticSentiment Analysis: From English to Spanish,"Recent Advances inNIPS, 2009.
  • [20] C. Wan, R. Pan, and J. Li, "Bi-Weighting Domain Adaptationfor Cross-Language Text Classification,"Proc. Int"l Joint Conf.IJCAI, 2011.
  • [21] M. S. Hajmohammadi, R. Ibrahim, A. Selamat, and H. Fujita, "Combination of Active Learning and Self-Training for Cross-Lingual Sentiment Classification with Density Analysis ofUnlabelled Samples,"Information Sciences, vol. 317, pp. 67-77,2015.
  • [22] D. Gao, and et. al.,"Cross-Lingual Sentiment LexiconLearning with Bilingual Word Graph Label Propagation," Computational Linguistics, vol. 41, pp. 21-40, 2015.
  • [23] M. S. C. Almeida, and et. al., "Aligning Opinions: Cross-Lingual Opinion Miningwith Dependencies,"Proc. ACL/AFNLPJoint Conf., 2015.
  • [24] H. Guo, and et. al., "OpinionIt: A Text Mining System forCross-Lingual Opinion Analysis,"Proc. ACM CIKM, 2010.
  • [25] S. Jain, and S. Batra, "Cross Lingual Sentiment Analysis usingModified BRAE,"In Proc. Conf EMNLP, 2015.
  • [26] P. Prettenhofer, and B.Stein, "Cross-Language TextClassification Using Structural Correspondence Learning,"Proc.Annu. Meet. ACL, 2010.
  • [27] P. Prettenhofer, and B. Stein, "Cross-Lingual Adaptation UsingStructural Correspondence Learning,"ACM TIST, vol. 3, p. 13,2011.
  • [28] J. Blitzer, M. Dredze, and F.Pereira, "Biographies, Bollywood,Boom-Boxes and Blenders: Domain Adaptation for SentimentClassification,"Proc. Annu. Meet. ACL, 2007.
  • [29]S. J. Pan, andet. al., "Cross-Domain Sentiment ClassificationviaSpectral FeatureAlignment,"Proc. Int"l Conf.WWW, 2010.
  • [30]G. Zhou, andet. al., "Cross-Domain Sentiment ClassificationviaTopical Correspondence Transfer,"Neurocomputing, vol.159,pp.298-305, 2015.
  • [31]K. W. Church, and P. Hanks, "WordAssociation Norms,Mutual Information, andLexicography,"ComputationalLinguistics, vol. 16,pp. 22-29, 1990.
  • [32]T. M. Cover,and J. A. Thomas, "Elements of InformationTheory,"Wiley-Interscience, 1991.
  • [33]S. Gouws,Y. Bengio,andG. Corrado,"BilBOWA:FastBilingual Distributed Representations withoutWord Alignments," Proc. Int"l Conf. Machine Learning, 2015.
  • [34]Mikolov, Tomas, Quoc V.Le, and I. Sutskever, "ExploitingSimilarities amongLanguages for Machine Translation,"CoRR,abs/1309.4168, 2013.

 

دوره 13، شماره 2
پاییز و زمستان
آذر 1394