با سلام خدمت دوستان محترم
فرض بفرمایید برای یکه مساله کلاسه بندی سیگنال گفتار برای استخراج ویژگی و پیش پردازش هر سیگنال داده رو به صد فریم تبدیل کردیم و از هر فریم سه ویژگی گرفتیم به عبارت دیگه به ازای هر فریم سه عدد به عنوان ویژگی اختصاص دادیم. حالا در دیتابیسمون برای هر کلاس سه گوینده که ۱۵ جمله مختلف رو ادا کرده اند وجود داره. یعنی برای مثلا کلاس یک ۱۵*۳ سیگنال وجود داره. هر سیگنال صد فریم و به هر فریم سه عدد نسبت میدهیم. الان دقیقا ورودیهای شبکه عصبی برای تشخیص چی هست و تعدادشون چقدره؟
oo:
فرض بفرمایید برای یکه مساله کلاسه بندی سیگنال گفتار برای استخراج ویژگی و پیش پردازش هر سیگنال داده رو به صد فریم تبدیل کردیم و از هر فریم سه ویژگی گرفتیم به عبارت دیگه به ازای هر فریم سه عدد به عنوان ویژگی اختصاص دادیم. حالا در دیتابیسمون برای هر کلاس سه گوینده که ۱۵ جمله مختلف رو ادا کرده اند وجود داره. یعنی برای مثلا کلاس یک ۱۵*۳ سیگنال وجود داره. هر سیگنال صد فریم و به هر فریم سه عدد نسبت میدهیم. الان دقیقا ورودیهای شبکه عصبی برای تشخیص چی هست و تعدادشون چقدره؟


دیدگاه