نویسندگان
دانشکده فناوری اطلاعات و مهندسی کامپیوتر، دانشگاه شهید مدنی آذربایجان، تبریز
چکیده
اندازهگیری شباهت متن یکی از اصلیترین عملیات در کاربردهای مرتبط با متن نظیر بازیابی اطلاعات، خوشهبندی متن، سیستمهای پرسش و پاسخ است. هدف این مطالعه ارائه رویکردی برای بهبود دقت مدلهای یادگیری عمیق در اندازهگیری تشابه متون است. بدین منظور یک رویکرد ترکیبی مبتنی بر شبکه عصبی سیامی و ویژگیهای شباهت لغوی ارائه میشود. شبکه سیامی پیشنهادی شامل دو زیر شبکه یکسان است که اجزای اصلی هر کدام از آنها به صورت کلی شامل یک لایه تعبیه کلمات و شبکه عصبی عمیق است. با در نظر گرفتن سه نوع شبکه عصبی عمیق شامل شبکه عصبی پیچشی، شبکه حافظه کوتاهمدت طولانی و شبکه حافظه کوتاهمدت طولانی دوطرفه و همچنین دو نوع مدل تعبیه کلمات به همراه ویژگیهای شباهت لغوی، گونههای مختلفی از مدلها پیادهسازی میشود. نتایج آزمایشها روی سه مجموعه داده مورد استفاده نشان میدهد مدل شبکه عصبی سیامی ترکیبی مبتنی بر شبکه پیچشی و ویژگیهای لغوی بالاترین مقدار همبستگی پیرسون و کمترین مقدار میانگین مربع خطاها (MSE) را در بین مدلها به دست میآورد. همچنین نتایج بدست آمده حاکی از عملکرد موفق مدل پیشنهادی نسبت به مدلهای تحقیقات قبلی در معیارهای ضریب همبستگی و MSE است.
کلیدواژهها