سلام خسته نباشید. من چند تا سوال داشتم درباره ی mfcc:
1- اصولا این ضرایب به چه دردی می خورن؟ آیا برای استخراج ویژگی گوینده برای تشخیص هویتش یا به عبارت دیگه تشخیص گوینده ها از هم ، این ویژگی مناسبه؟ :smile:
2-- روند محاسبه ی این ضرایب مشخصه اول fft حساب می کنیم بعد فیلتر بانک اعمال می کنیم بعد لگاریتم بعد dct . ولی اصلا من مفهومش رو نمی فهمم. اصلا mfcc چیه که ما با اعمال این عملیات روی صوت بهش می رسیم؟ چیکار می کنه؟
3- اگه اومدم و برنامشو تو متلب نوشتم و جواب داد از کجا بهفمم این ضرایبی که میده درستن؟
ممنون می شم اگه کمکم کنید.
1- اصولا این ضرایب به چه دردی می خورن؟ آیا برای استخراج ویژگی گوینده برای تشخیص هویتش یا به عبارت دیگه تشخیص گوینده ها از هم ، این ویژگی مناسبه؟ :smile:
2-- روند محاسبه ی این ضرایب مشخصه اول fft حساب می کنیم بعد فیلتر بانک اعمال می کنیم بعد لگاریتم بعد dct . ولی اصلا من مفهومش رو نمی فهمم. اصلا mfcc چیه که ما با اعمال این عملیات روی صوت بهش می رسیم؟ چیکار می کنه؟

3- اگه اومدم و برنامشو تو متلب نوشتم و جواب داد از کجا بهفمم این ضرایبی که میده درستن؟
ممنون می شم اگه کمکم کنید.