‫ روش عمومی قابل‌اعتماد موقیعت‌یابی متن در تصاویر طبیعی

روش عمومی قابل‌اعتماد موقیعت‌یابی متن در تصاویر طبیعی

امین اله مه آبادی, علیرضا زارعی

چکیده

این مقاله یک روش عمومی دقیق و سریع خودکار تشخیص متون چندزبانی از تصاویر رنگی دوربین و ویدیو با زمینه پیچیده براساس مؤلفة‌ همبند مبتنی بر لبه را در سطح بلاک، کلمه و خط متن ارایه می‌دهد. این روش نسبت به رنگ، ابعاد متن، زاویة دوربین، انحنای سطح تصویر و نورپردازی ناهموار مقاوم است و در تصاویر دارای پیچیدگی زمینه و زبان‌های مختلف به‌ خوبی عمل می‌کند. نتایج دقیق آزمایشات تجربی در تصاویر متنوع طبیعی با داده‌های استاندارد، دارای نرخ فراخوانی 0/90، دقت 0/85، شاخص 0/87F  و MDR برابر با 13% در سطح خط متن و نرخ فراخوانی 70%، دقت 74% و شاخص F برابر با 71% در سطح کلمه است. این روش نسبت به آخرین روش‌ها علمی دارای بهبود نرخ فراخوانی، دقت، شاخص F و MDR در سطوح خط متن و کلمه همچنین برخوردار از قدرت تشخیص داده‌های متنوع جهت پشتیبانی از داده‌های عظیم تصویری است.

کلمات کلیدی

پردازش تصویر, تصاویر رنگی, تصاویر ویدیویی, موقعیت یابی متن, روش مبتنی بر مولفه های متصل, روش قابل اعتماد