‫ بهبود سامانه ‏های تصدیق هویت گوینده براي گفتارهای آلوده به نویز با استفاده از بردارهای هویت موزون

بهبود سامانه ‏های تصدیق هویت گوینده براي گفتارهای آلوده به نویز با استفاده از بردارهای هویت موزون

محسن محمدی, حمیدرضا صادق محمدی

چکیده

دسترسي ايمن به سامانه‌‌هاي كاربردي متفاوت از فواصل دور و نزديك، کاربرپسند بودن، پیچیدگی محاسباتي کم و هزینه پياده‌سازي پایین از ويژ‌گي‌های برجسته روش تصدیق هویت مبتنی بر گفتار است. اما کارایی این شيوه در محیط‌های واقعی به دلیل وجود نویزهای متفاوت صوتی و عوارض كانال به شدت افت می‏کند. روش i-vector PLDA از جمله شيوه‌های موفق در بهبود عملکرد سامانه‌های تصدیق هویت گوینده است. در اين مقاله بهره‌مندي از ویژگی‌های آماری بردارهای ثبت‌نام گویندگان هدف برای وزن‌دهی به بردارهای مدل و تست، جهت بهبود دقت امتیازدهی و در نتیجه عملكرد سامانه‌‌ تصدیق هویت در شرایط آزمون گفتار نويزي پبشنهاد گرديده است. تأثیر استفاده از اين بردارهاي وزن داده شده، كه آن را بردارهای موزون نامیده‏ایم، بر عملکرد سامانه در محیط‌های نویزی مورد ارزیابی قرار گرفته است. آموزش‌ها و آزمون‌ها با استفاده از دادگان گفتار TIMIT، بردارهای ویژگی MFCC و PNCC و روش امتیازدهی PLDA انجام شده است. همچنین برای بهبود عملکرد سامانه در شرایط عدم تطابق نویز، بین گفتار ثبت‏نام و آزمون، از آموزش چند-شرطی برای LDA و PLDA استفاده شده است. همچنین ترکیب امتیازات این آزمون­ها نیز مورد ارزیابی قرار گرفت. نتایج آزمون‌ها مبین آن است که بهره‌گيري از بردارهای موزون دقت سامانه تصدیق هویت گوینده را براي گفتار‌های نویزی نیز افزایش می‌دهد، علاوه بر آن در اکثر قریب به اتفاق موارد ترکیب امتیازات آزمون­ها نیز عملکرد سامانه را بهبود می­بخشد.

کلمات کلیدی

تصدیق هویت گوینده, وزن‌دهی بردار, نویز, بردار هویت, PLDA, multi-condition, I-vector