اطلاعیه

**eehadi** · 2014-08-22T10:50:09

پاسخ : ابعاد ورودی های شبکه عصبی برای سیگنال گفتار؟؟؟؟

سلام.
متوجه نشدم کلاس ها چی هستن ولی فکر می کنم اگه از شبکه عصبی معمولی استفاده می کنی 3*100 گره ورودی داری. چون سیگنال زمانی داری میتونی از TDNN هم استفاده کنی که در این شبکه گره ها، دارای ترتیب هستند و گره های دور از هم در لایه میانی با هم ارتباطی ندارند و برای کارهای صوت و دستنوشته و کلاً سیگنالهای زمانی/مکانی استفاده میشه. فقط نمیدونم میشه بیشتر از یک ویژگی داشت یا نه. در صورتی که فقط یک ویژگی بتونی بهش بدی میتونی از سه TDNN موازی استفاده کنی که هر کدوم برای یکی از ویژگی ها هستن و خروجی اون ها رو (کلاسها) رو به یک کلاسیفایر دیگه بدی.

**ya_montazar** · 2014-08-22T11:37:26

پاسخ : ابعاد ورودی های شبکه عصبی برای سیگنال گفتار؟؟؟؟

هفت کلاس احساس وجود داره. احساس در گفتار.
البته من تصور میکردم باید فریم بندی صورت بگیره اما ظاهرا ویژگی از کل سیگنال گرفته شده یعنی هر سیگنال ۳ ویژگی ازش گرفته شده.
اما در عین حال در صورتی که فریمآ‌بندی وجود داشت با وجود ۴۵۰ سیگنال ماتریس ورودی شبکه بنا به صحبت شما ۳۰۰*۴۵۰ میشد. یعنی ۳۰۰ گره ورودی.
این عد خیلی بزرگ نیست؟

oo:

**eehadi** · 2014-08-23T02:42:45

پاسخ : ابعاد ورودی های شبکه عصبی برای سیگنال گفتار؟؟؟؟

تعداد گره های ورودی و خروجی شبکه عصبی به مسأله شما بستگی داره و مثل تعداد لایه های مخفی یا تعداد گره های لایه مخفی نیست که خودتون تعیین کنید.
تعداد ورودی مساوی با طول بردار ویژگی است اگه فریم بندی نداشته باشی میشه فقط 3 گره و اگه فریم بندی داشته باشی میشه تعداد فریم ها ضرب در 3.
در صورتی که تعداد ورودی ها زیاد شد باید راهی پیدا کنی که تعدادش رو کم کنی مثلاً فریم ها رو بزرگ تر کنی یا از هر فریم تعداد کمتری ویژگی استخراج کنی یا ... .
معمولاً در تعیین پارامترهای شبکه عصبی استفاده از سعی و خطا راحت ترین راهه.

اطلاعیه

ابعاد ورودی های شبکه عصبی برای سیگنال گفتار؟؟؟؟

ابعاد ورودی های شبکه عصبی برای سیگنال گفتار؟؟؟؟

دیدگاه

دیدگاه

دیدگاه