سلام.در مورد این مدل اطلاعاتی میخواستم و اینکه چگونه این کار انجام میشه؟
اطلاعیه
Collapse
No announcement yet.
شناسایی واج های مصوت با مدل Hmm
Collapse
X
-
لطفاً برای انجام پروژه های دانشجویی پیام خصوصی نفرستید.با تمام وجود گناه کردیم اما نه نعمتش را از ما گرفت نه گناهان ما را فاش کرد اطاعتش کنیم چه می کند؟"دکتر شریعتی"
لطفاً سوالاتی که در انجمن قابل طرح شدن هستند پیام خصوصی نکنید.
اگر جایی که ایستاده اید را نمی پسندید، عوضش کنید شما درخت نیستید!! "پاسکال"
یا به اندازه ی آرزوهایت تلاش کن یا به اندازه تلاشت آرزو کن. "شکسپیر"
-
پاسخ : شناسایی واج های مصوت با مدل Hmm
شما باید بردار ویژگی رو با توجه به مسأله و جنس داده تعیین کنید، بردار ویژگی استخراج شده برای مدل HMM با بردار ویژگی که در سایر روش های مثل شبکه عصبی یا SVM و ... استفاده میشه فرقی نداره (تنها تفاوت در اینه که طول بردار ویژگی برای HMM میتونه متغیر باشه)، این بردار ویژگی به عنوان مشاهده به ورودی HMM داده میشه.
TIMIT یک دیتابیس گفتار هست که میتونه برای شناسایی هم استفاده بشه.لطفاً برای انجام پروژه های دانشجویی پیام خصوصی نفرستید.با تمام وجود گناه کردیم اما نه نعمتش را از ما گرفت نه گناهان ما را فاش کرد اطاعتش کنیم چه می کند؟"دکتر شریعتی"
لطفاً سوالاتی که در انجمن قابل طرح شدن هستند پیام خصوصی نکنید.
اگر جایی که ایستاده اید را نمی پسندید، عوضش کنید شما درخت نیستید!! "پاسکال"
یا به اندازه ی آرزوهایت تلاش کن یا به اندازه تلاشت آرزو کن. "شکسپیر"
دیدگاه
-
پاسخ : شناسایی واج های مصوت با مدل Hmm
سلام
1)یعنی من اول باید برای6 واج مصوت موجود بردارهای ویا¾گیشون رو از طریق mfcc .LPCیا کپستروم و...استخراج کنم و بعد با مدلی که HMM در اختیار قرار میده تشخیص واج صورت بگیره؟درست فهمیدم؟
2)در صورتیکه از دیتابیس ها استفاده کنیم که دیگه بردارهای ویا¾ا¾ا¾ا¾ا¾ا¾ا¾ژگی استخراج شده هستند و فقط باید تشخیص بامدل
اماری صورت بگیره؟
یعنی منظورم اینه اگر از دیتابیسها استفاده کنیم چه فرقی میکنه(بجز اعتبارشون)؟دیگه اونها که بردار ویا¾گی لازم نداره استخراج کنیم نه؟
3)مثل پردازش تصویر کتاب یا منبعی وجود داره که دستورات متلب که در پردازش گفتار بکار میروند،عنوان شده باشه؟
دیدگاه
-
پاسخ : شناسایی واج های مصوت با مدل Hmm
نوشته اصلی توسط hasting_m3)مثل پردازش تصویر کتاب یا منبعی وجود داره که دستورات متلب که در پردازش گفتار بکار میروند،عنوان شده باشه؟
http://www.ee.ic.ac.uk/hp/staff/dmb/.../voicebox.html
1: اللهم صل علی محمد و آل محمد و عجل فرجهم و ...
2: دانش بهتره یا ثروت؟ بدون شعور هیچکدوم!
3: دلا معاش چنان کن که گر بلغزد پای *** فرشتهات به دو دست دعا نگه دارد (حافظ)
دیدگاه
-
پاسخ : شناسایی واج های مصوت با مدل Hmm
نوشته اصلی توسط hasting_mسلام
1)یعنی من اول باید برای6 واج مصوت موجود بردارهای ویا¾گیشون رو از طریق mfcc .LPCیا کپستروم و...استخراج کنم و بعد با مدلی که HMM در اختیار قرار میده تشخیص واج صورت بگیره؟درست فهمیدم؟
2)در صورتیکه از دیتابیس ها استفاده کنیم که دیگه بردارهای ویا¾ا¾ا¾ا¾ا¾ا¾ا¾ژگی استخراج شده هستند و فقط باید تشخیص بامدل
اماری صورت بگیره؟
یعنی منظورم اینه اگر از دیتابیسها استفاده کنیم چه فرقی میکنه(بجز اعتبارشون)؟دیگه اونها که بردار ویا¾گی لازم نداره استخراج کنیم نه؟
2) من دیتابیسی که بردارهای ویژگی استخراج شده باشن ندیدم ولی اگه بردارهای ویژگی موجود باشن میتونید این کارو بکنید و یک مرحله از کارتون کم میشه.لطفاً برای انجام پروژه های دانشجویی پیام خصوصی نفرستید.با تمام وجود گناه کردیم اما نه نعمتش را از ما گرفت نه گناهان ما را فاش کرد اطاعتش کنیم چه می کند؟"دکتر شریعتی"
لطفاً سوالاتی که در انجمن قابل طرح شدن هستند پیام خصوصی نکنید.
اگر جایی که ایستاده اید را نمی پسندید، عوضش کنید شما درخت نیستید!! "پاسکال"
یا به اندازه ی آرزوهایت تلاش کن یا به اندازه تلاشت آرزو کن. "شکسپیر"
دیدگاه
-
پاسخ : شناسایی واج های مصوت با مدل Hmm
نوشته اصلی توسط هـادی2) من دیتابیسی که بردارهای ویژگی استخراج شده باشن ندیدم ولی اگه بردارهای ویژگی موجود باشن میتونید این کارو بکنید و یک مرحله از کارتون کم میشه.
فیشر ایریس مگه خود بردار های ویژگی رو نشون نمیده؟؟اون بردار150*4مگه اون 4تا ویژگی برگها نبودند؟
دیدگاه
-
پاسخ : شناسایی واج های مصوت با مدل Hmm
سلام.ممنون
من مشکلم پیدا کردن فایل نیست.ازین فایلهاکه متاسفانه انگلیسی هم هستند زیاد دارم،اگر ممکنه سوال زیر رو برام جواب بدید:
3.همین لینکی که برای دستورات متلب برام فرستادید از کجا اومده؟از کجا پیدا کردین؟اون سایت چیه؟میشه تو این یک مورد!بجای ماهی خود ماهی گیری رو بهم یاد بدید؟
2.این دیتابیس TIMIT و یاFarsdat خود واجها رو دارند یا بردارهای ویژگی شوو رو؟
من برای پروژم باید حتما از دینابیس استفاده کنم؟
4.فایلایی که خوندم،در HMM از گسسته و پیوسته بودن،میگفت.تفاوت پیوسته و گسسته در چیه؟برای تشخیص جمله از مدل پیوسته استفاده میشه و تشخیص واج یا کلمه منفصل از گسسته؟؟؟
5.مهم ترین سوالم:از ویکی پدیادر مورد مدل HMMخوندم .و چیز خاصی هم دستگیریم نشد.
الان مدل آماری رو برای تشخیص واج من باید چجورررررررررری بدست بیارم.همش فرمولای ریاضی گفته آخه چجوری؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟
از یک فرمول چجوری من باید مدل یک واج رو بدست بیارم؟
چه ربطی به اونهمه فرمول داره آخه؟
دیدگاه
-
پاسخ : شناسایی واج های مصوت با مدل Hmm
نوشته اصلی توسط hasting_m3.همین لینکی که برای دستورات متلب برام فرستادید از کجا اومده؟از کجا پیدا کردین؟اون سایت چیه؟میشه تو این یک مورد!بجای ماهی خود ماهی گیری رو بهم یاد بدید؟
- دونستن زبان تخصصی
که خب معمولا دانشجویان ارشد یا زبانشون خوبه
یا مجبور میشن که خوب بشه!
- دونستن کلمات کلیدی
در اینجا چیه؟
speech, processing, matlab, command
- استفاده از موتور جستجو
مثه google و yahoo و bing
- در برخی موارد استفاده از:
"ف.ی.ل....ش.ک.ن"
- و نکته ی مهم:
داشتن صبر و حوصله در جستجو!
شاید برخی مواقع نیاز باشه تا 20 - 30 صفحه از جستجوها رو نگاه بکنی!
اما معمولا: جوینده یانده بود
در این مورد عبارت زیر رو در google جستجو کردم:
speech processing matlab command1: اللهم صل علی محمد و آل محمد و عجل فرجهم و ...
2: دانش بهتره یا ثروت؟ بدون شعور هیچکدوم!
3: دلا معاش چنان کن که گر بلغزد پای *** فرشتهات به دو دست دعا نگه دارد (حافظ)
دیدگاه
-
پاسخ : شناسایی واج های مصوت با مدل Hmm
سلام. امیدوارم توضیحات این تاپیک و فایلهایی که گذاشتم بتونه کمکت کنه.لطفاً برای انجام پروژه های دانشجویی پیام خصوصی نفرستید.با تمام وجود گناه کردیم اما نه نعمتش را از ما گرفت نه گناهان ما را فاش کرد اطاعتش کنیم چه می کند؟"دکتر شریعتی"
لطفاً سوالاتی که در انجمن قابل طرح شدن هستند پیام خصوصی نکنید.
اگر جایی که ایستاده اید را نمی پسندید، عوضش کنید شما درخت نیستید!! "پاسکال"
یا به اندازه ی آرزوهایت تلاش کن یا به اندازه تلاشت آرزو کن. "شکسپیر"
دیدگاه
-
پاسخ : شناسایی واج های مصوت با مدل Hmm
باز سوال دیگه ولی متفاوت
1)برای استخراج بردارها ویژگی در واج ها.مثلا من یه فایل دارم که افراد مختلف پشت سر هم حرف a رو تلفظ کردند.حالا ما که بردارهارو استخراج میکنیم،میاییم فریم بندی میکنیم.
تو هر فریم(مثلا512نقطه)لزوماصدای تلفظ کردن،یک نفر(داخل یک فریم) نیست درسته؟یعنی هر فریم مال یک نفر نیست؟ممکنه مال چند نفر باشه یا بالعکس چند تا فریم مال تلفظ واجِ یک نفر باشه.آری؟
بعبارت دیگه سوالم اینه که برای فریم بندیش باید ببینیم چند نفر تلفظ کرده!؟که به همون تعداد فریم تقسیم کنیم؟
2)یک نفر دیگه ای هم سوال پرسیده بود که کسی جواب نداده.همین بردارویژگی مفهومش چیه؟این اعداد چیو از صوت نشون میده؟
اگر ممکنه هر دو تا رو مجزا جواب بدین.یک دنیا سپاس
دیدگاه
-
پاسخ : شناسایی واج های مصوت با مدل Hmm
اینو برای استخراج ویژگی ها توسط mfccنوشتم.کجاش اشتباهه؟ :sad:
clear all
clc
N=512;
r=0.25*N;
Num_frame=10;
[data,fs,n]=wavread('e1.wav'
data=data'
%Select first 10 frame from file
for i=1:Num_frame
x(i,=data((i-1)*(N-r)+1:i*N-(i-1)*r);
y(i,1)=x(i,1);
%Pre_emphasis
for j=2:N
y(i,j)=x(i,j)-0.97*x(i,j-1);
end
%multiple by hamming window
y(i,=hamming(N)'.*y(i,
mfsc(?)=log(abs(1125*log(1+(fft(y(i,)/700))));
c=dct(mfsc,13)
end
size(mfsc)
size(c)
دیدگاه
-
پاسخ : شناسایی واج های مصوت با مدل Hmm
1) شما میخوای چه کاری انجام بدی؟
اگه تشخیص واج هست مثلاً این که واجی که داریم چی هست، در این صورت باید هر واج رو جدا کنید و ازش ویژگی استخراج کنید. مثلاً از واج a هر گوینده جدا بشه، بعد احتمالاً حذف سکوت لازم باشه و بعد فریم بندی (مثلاً هر 50 میلی ثانیه یک فریم با همپوشانی 50%) که از هر فریم یک بردار ویژگی استخراج میشه. تعداد عناصر بردارهای ویژگی باید مساوی باشه تا بعداً بشه اونها رو گروه بندی کرد(همون نمادسازی برای مدل مخفی مارکوف) ولی لازم نیست که تعداد فریم ها برای گوینده های مختلف یا واج های مختلف مساوی باشن.
2) در مورد ویژگی قبلاً یه جای دیگه توضیح دادم اگه پیدا کردم لینکشو میذارم.
3)الان MFCC یادم نیست ولی یه فایل که MFCC هم داخلشه توی انجمن گذاشتم که اونم باید بگردم لینکشو پیدا کنم. شاید این سوال رو دوستانی که بیشتر با صوت کار کردن بتونن جواب بدن.لطفاً برای انجام پروژه های دانشجویی پیام خصوصی نفرستید.با تمام وجود گناه کردیم اما نه نعمتش را از ما گرفت نه گناهان ما را فاش کرد اطاعتش کنیم چه می کند؟"دکتر شریعتی"
لطفاً سوالاتی که در انجمن قابل طرح شدن هستند پیام خصوصی نکنید.
اگر جایی که ایستاده اید را نمی پسندید، عوضش کنید شما درخت نیستید!! "پاسکال"
یا به اندازه ی آرزوهایت تلاش کن یا به اندازه تلاشت آرزو کن. "شکسپیر"
دیدگاه
-
پاسخ : شناسایی واج های مصوت با مدل Hmm
2- http://www.eca.ir/forum2/index.php?topic=74977.msg450390;topicseen#msg45039 0
3- http://www.eca.ir/forum2/index.php?topic=73917.msg440820#msg440820لطفاً برای انجام پروژه های دانشجویی پیام خصوصی نفرستید.با تمام وجود گناه کردیم اما نه نعمتش را از ما گرفت نه گناهان ما را فاش کرد اطاعتش کنیم چه می کند؟"دکتر شریعتی"
لطفاً سوالاتی که در انجمن قابل طرح شدن هستند پیام خصوصی نکنید.
اگر جایی که ایستاده اید را نمی پسندید، عوضش کنید شما درخت نیستید!! "پاسکال"
یا به اندازه ی آرزوهایت تلاش کن یا به اندازه تلاشت آرزو کن. "شکسپیر"
دیدگاه
دیدگاه