‫ پیش‌بینی شباهت متن با استفاده از یک شبکه عصبی سیامی مبتنی بر شبکه عمیق و ویژگی‌های شباهت لغوی

پیش‌بینی شباهت متن با استفاده از یک شبکه عصبی سیامی مبتنی بر شبکه عمیق و ویژگی‌های شباهت لغوی

فریبا خلج, حسین عباسی‌مهر

چکیده

اندازه‌گیری شباهت متن یکی از اصلی‌ترین عملیات در کاربرد‌های مرتبط با متن نظیر بازیابی اطلاعات، خوشه‌بندی متن، سیستم‌های پرسش ‌و پاسخ است. هدف این مطالعه ارائه رویکردی برای بهبود دقت مدل‌های یادگیری عمیق در اندازه‌گیری تشابه متون است. بدین منظور یک رویکرد ترکیبی مبتنی بر شبکه عصبی سیامی و ویژگی‌های شباهت لغوی ارائه می‌شود. شبکه سیامی پیشنهادی شامل دو زیر شبکه یکسان است که اجزای اصلی هر کدام از آن‌ها به‌ صورت کلی شامل یک لایه تعبیه کلمات و شبکه عصبی عمیق است. با در نظر گرفتن سه نوع شبکه عصبی عمیق شامل شبکه عصبی پیچشی، شبکه حافظه کوتاه‌مدت طولانی و شبکه حافظه کوتاه‌مدت طولانی دوطرفه و همچنین دو نوع مدل تعبیه کلمات به همراه ویژگی‌های شباهت لغوی، گونه‌های مختلفی از مدل‌ها پیاده‌سازی می‌شود. نتایج آزمایش‌ها روی سه مجموعه داده‌ مورد استفاده نشان می‌دهد مدل شبکه عصبی سیامی ترکیبی مبتنی بر شبکه پیچشی و ویژگی‌های لغوی بالاترین مقدار همبستگی پیرسون و کمترین مقدار میانگین مربع خطاها (MSE) را در بین مدل‌ها به دست می‌آورد. همچنین نتایج  بدست آمده حاکی از عملکرد موفق مدل پیشنهادی نسبت به مدل‌های تحقیقات قبلی در معیارهای ضریب همبستگی و MSE است. 

کلمات کلیدی:  ، یادگیری عمیق، شبکه سیامی، معیارهای تشابه متن


کلمات کلیدی

شباهت متن, یادگیری عمیق, شبکه سیامی, معیارهای تشابه متن

مراجع