|
بهبود كيفيت سيستمهاي تبديل گفتار مبتني بر مدل GMM |
|
|
|
نوشته شده توسط همکلاسی
|
|
عنوان مقاله |
بهبود كيفيت سيستمهاي تبديل گفتار مبتني بر مدل GMM |
|
نشریه
|
فني و مهندسي مدرس زمستان 1384 |
|
نویسنده
|
اسلامي مهدي,صياديان ابوالقاسم |
|
حجم
فایل
|
2553
کیلو بایت |
|
دریافت مقاله
|
|
کلمات کلیدی :
تبديل گفتار، تغيير گوينده، نگاشت طيفي، مدل مخلوط گاوسي
چکیده مقاله :
در سيستمهاي تبديل گفتار، گوينده A جملاتي را بيان مي كند و هدف عبارت است از تغيير متكلم جملات بيان شده، از گوينده A (مبدا) به گوينده مورد نظر B (مقصد). البته در مواردي به جاي تبديل گفتار از عبارت تبديل گوينده نيز استفاده مي شود. تغيير گوينده بايد به قسمي انجام پذيرد كه سيگنال تغيير يافته كيفيت مطلوب و طبيعي، اما با صداي گوينده B داشته باشد. سه روش مورد استفاده در اين سيستمها عبارتند از: روشهاي مبتني بر چندي سازي برداري، روشهاي مبتني بر تبديلهاي LMR و روشهاي مبتني بر مدل مخلوط گاوسي (مدل آماري). در تمامي روشهاي ذكر شده براي انطباق زماني جفت كلمات يا جفت جملات متناظر دو گوينده (در مرحله يادگيري) از روش پيچش زماني پويا استفاده مي شود. در طي اين تحقيق ضمن بررسي روشهاي موجود، از تكنيك انطباق زماني DTW براي طراحي توابع تبديل جفت واجهاي متناظر دو گوينده (به جاي جفت كلمات يا جملات) استفاده مي شود. اين كار موجب انطباق بيشتر دو گوينده در كوچكترين واحد زباني (يعني واج) مي شود. همچنين به منظور كاهش خطا، از تبديلهاي خطي موقتي وابسته به واج در مرحله يادگيري استفاده مي شود. با اصلاحات مناسب ديگري كه در روش يادگيري و طراحي تبديلهاي خطي مورد نياز انجام شده، به عملكرد بسيار مناسبي در تبديل گفتار در مقايسه با روشهاي رايج نايل شده ايم.
|