پاسخ : شناسایی واج های مصوت با مدل Hmm
سلام.
4)شماره دو لینکی بود که سوال خودم بود.اونا رو که خونده بودم قبلا.الان منظورم اینه این اعداد چه ویژگی یی از صوت رو بیان میکنند؟
5)درمورد توضیحی که در مورد تشخیص واج فرمودید،فایل صوتی که من دارم،صدای تلفظ چند گوینده پشت سر هم هست(گوینده های مختلف دراین پروژه اهمیت ندارند.یعنی مستقل ازگوینده)الان باید برای هر گوینده جداگانه این فریم بندی رو انجام بدم؟یعنی این مهم هست که تلفظ واج هر گوینده چه زمانی طول کشیده؟(این به DTW مربوط میشه؟باید هم طول بشند؟)
از specgram تعداد نفرات تلفظ کننده را باید بشمرم؟(منظورم اینه که ببینم چند نفر تلفظ کردند که بعد برای هر نفر جداگانه فریم بندی کنم.)
برای تشخیص واج هم مثل کلمه باید بین دو تا سکوت قراربگیره؟ :sad:
فکر کنم خیلی بد گفتم :sad:
6)اگر مستقل از گوینده باشه،بردارهای ویژگی که توسط گوینده های یک واج یکسان بدست میاد،باید مشابه باشند،درسته؟
حالا اگر وابسته به گوینده باشه،چه اتفاقی میفته که این بردارها برای هر گوینده فرق میکنه؟
نوشته اصلی توسط هـادی
4)شماره دو لینکی بود که سوال خودم بود.اونا رو که خونده بودم قبلا.الان منظورم اینه این اعداد چه ویژگی یی از صوت رو بیان میکنند؟
5)درمورد توضیحی که در مورد تشخیص واج فرمودید،فایل صوتی که من دارم،صدای تلفظ چند گوینده پشت سر هم هست(گوینده های مختلف دراین پروژه اهمیت ندارند.یعنی مستقل ازگوینده)الان باید برای هر گوینده جداگانه این فریم بندی رو انجام بدم؟یعنی این مهم هست که تلفظ واج هر گوینده چه زمانی طول کشیده؟(این به DTW مربوط میشه؟باید هم طول بشند؟)
از specgram تعداد نفرات تلفظ کننده را باید بشمرم؟(منظورم اینه که ببینم چند نفر تلفظ کردند که بعد برای هر نفر جداگانه فریم بندی کنم.)
برای تشخیص واج هم مثل کلمه باید بین دو تا سکوت قراربگیره؟ :sad:
فکر کنم خیلی بد گفتم :sad:
6)اگر مستقل از گوینده باشه،بردارهای ویژگی که توسط گوینده های یک واج یکسان بدست میاد،باید مشابه باشند،درسته؟
حالا اگر وابسته به گوینده باشه،چه اتفاقی میفته که این بردارها برای هر گوینده فرق میکنه؟
دیدگاه