سلام.من میخوام کار تشخیص حروف دست خط گسسته الفبای فارسی رو با استفاده از درس پردازش تصویر و شناسایی آماری الگو انجام بدم.کسی میتونه بهم خط و مشیی بده؟
اطلاعیه
Collapse
No announcement yet.
شناسایی اماری الگو
Collapse
X
-
پاسخ : شناسایی اماری الگو
اول از همه اینا برام سوال هست :
1- باید استخراج ویزگی انجام بدم.تا جاییکه خاطرم هست هر چی تو درس شناسایی بود(GMM,SVM,KNN,PCA..( همش روش های دسته بندی بود.خب قبل از دسته بندی باید یه سری ویژگی ها ازینا استخراج بشه؟اینکار چجوری صورت میگیره؟؟
ویژگی ها توصیفیه.در حالیکه در کدنویسی باید عدد باشهارتباط این دو رو نمیفهمم.چجوری یک ویزگی به عدد تبدیل بشه.
2-و نیز چجوری مثلا میانگین و واریانس واینجور چیزها بعنوان ویژگی مطرح میشه؟؟!یعنی مثلا در حرف"ب" میانگین با حرف "س" متفاوته؟
3-این ویژگی ها رو چجوری انتخاب کنم و از کجا بفهمم کدوم یکی برای تشخیص بهتره؟؟
4-در مرحله بعدی classification.این classification با "خوشه بندی" چه فرقی داره؟؟ :cry:لطفا کمکم کتنید .سوالاتم خیلی مبتدیانه هست.
5- در مرحله بعدی که باید یک سری رو داده های آموزشی در نظر بگیریم و یک سری(30%داده ها) رو بعنوان داده های تست و ازروی این تقسیم بندی رو انجام بدیم و خطا رو بدست بیاریم.خب تا اینجا که میشه آموزش دادن به سیستم.سوال مهم دیگم اینه که چجوری این چیزی که آموزش دادیم ازش امتحان بگیریم؟؟؟؟؟؟؟؟؟؟؟؟؟؟یعنی دادن تصویر به سیستم و سوال کردن ازش که بپرسیم این حرف، کدومه؟؟
البته این سوالات این قسمت در مورد هر پروژه ای صدق میکنه و فعلا تخصصی نبود.
خواهش میکنم کسایی که میخونین و بلدین با زبون ساده برام جواب این 6تا سوالمو بدین :cry:
-
پاسخ : شناسایی اماری الگو
دوست عزیز
اول یک نگاهی به اینجا بکنی شاید بد نباشه
http://s6.picofile.com/file/8206848876/OCR.pdf.html
نگفته بودید از چه ابزاری استفاده میکنید و در چه مرحله ای هستید ....
ولی فکر میکنم شما قصد تشخیص نوری کاراکترهای فارسی با استفاده از شبکه های عصبی مصنوعی را داشته باشید ؟؟؟
سالها پیش من از روشی مشابه برای تشخیص نقظه های متن فارسی با برنامه نویسی مستقیم به زبان C استفاده کردم
روش کلی کار به این صورت بود که از 4 حالت رایج در نقطه گذاری زبان فارسی نمونه های زیادی اسکن و به صورت یک آرایه دو بعدی ذخیره میگردید ( فقط برای یک سایز از یک فونت )
سپس این آرایه با یک ارایه عددی منطبق میشد و به ازای موارد درست عددهای منطبق بر نقاط روشن در آرایه عددی افزایش و عددهای منطبق بر خانه های خاموش کاهش میافتند ... پس از مدتی آموزش این آرایه عددی قادر به تشخیص الگوهای آموزش داده شده بود ( با جمع مجموعه عددهای آرایه )
در این حالت برای هر الگو نیازمند داشتن یک آرایه عددی هستیم ولی مرحله تشخیص فقط یک جمع ساده میباشد
و این روش در حقیقت زیر بنا یک شبکه عصبی ساده یک لایه میباشد
متاسفانه در متلب قضیه بسیار پیچیده تر گردیده و شبکه های عصبی اکثرا دارای لایه های اضافی و الگوریتمهای بهینه سازی و آموزش و نرمالایز وزنها و ....
دیدگاه
-
پاسخ : شناسایی اماری الگو
نوشته اصلی توسط emitorدوست عزیز
اول یک نگاهی به اینجا بکنی شاید بد نباشه
http://s6.picofile.com/file/8206848876/OCR.pdf.html
نگفته بودید از چه ابزاری استفاده میکنید و در چه مرحله ای هستید ....
ولی فکر میکنم شما قصد تشخیص نوری کاراکترهای فارسی با استفاده از شبکه های عصبی مصنوعی را داشته باشید ؟؟؟
سالها پیش من از روشی مشابه برای تشخیص نقظه های متن فارسی با برنامه نویسی مستقیم به زبان C استفاده کردم
روش کلی کار به این صورت بود که از 4 حالت رایج در نقطه گذاری زبان فارسی نمونه های زیادی اسکن و به صورت یک آرایه دو بعدی ذخیره میگردید ( فقط برای یک سایز از یک فونت )
سپس این آرایه با یک ارایه عددی منطبق میشد و به ازای موارد درست عددهای منطبق بر نقاط روشن در آرایه عددی افزایش و عددهای منطبق بر خانه های خاموش کاهش میافتند ... پس از مدتی آموزش این آرایه عددی قادر به تشخیص الگوهای آموزش داده شده بود ( با جمع مجموعه عددهای آرایه )
در این حالت برای هر الگو نیازمند داشتن یک آرایه عددی هستیم ولی مرحله تشخیص فقط یک جمع ساده میباشد
و این روش در حقیقت زیر بنا یک شبکه عصبی ساده یک لایه میباشد
متاسفانه در متلب قضیه بسیار پیچیده تر گردیده و شبکه های عصبی اکثرا دارای لایه های اضافی و الگوریتمهای بهینه سازی و آموزش و نرمالایز وزنها و ....
من الان هنوز هیچ کار نکردم.فقط وقتی این درسو داشتیم در حد انجام تمرینات ساده اش کار کردم.فعلا فقط همین سوالاتم که ازین درس هست مد نظره.که میتونه برای تضخیص هر چیزی مورد استفاده قرار بگیره نه صرفا حروف.
اگر سوالامو کسی میتونه کمک :sad:
دیدگاه
-
پاسخ : شناسایی اماری الگو
نوشته اصلی توسط tonrarاول از همه اینا برام سوال هست :
1- باید استخراج ویزگی انجام بدم.تا جاییکه خاطرم هست هر چی تو درس شناسایی بود(GMM,SVM,KNN,PCA..( همش روش های دسته بندی بود.خب قبل از دسته بندی باید یه سری ویژگی ها ازینا استخراج بشه؟اینکار چجوری صورت میگیره؟؟
ویژگی ها توصیفیه.در حالیکه در کدنویسی باید عدد باشهارتباط این دو رو نمیفهمم.چجوری یک ویزگی به عدد تبدیل بشه.
2-و نیز چجوری مثلا میانگین و واریانس واینجور چیزها بعنوان ویژگی مطرح میشه؟؟!یعنی مثلا در حرف"ب" میانگین با حرف "س" متفاوته؟
3-این ویژگی ها رو چجوری انتخاب کنم و از کجا بفهمم کدوم یکی برای تشخیص بهتره؟؟
4-در مرحله بعدی classification.این classification با "خوشه بندی" چه فرقی داره؟؟ :cry:لطفا کمکم کتنید .سوالاتم خیلی مبتدیانه هست.
5- در مرحله بعدی که باید یک سری رو داده های آموزشی در نظر بگیریم و یک سری(30%داده ها) رو بعنوان داده های تست و ازروی این تقسیم بندی رو انجام بدیم و خطا رو بدست بیاریم.خب تا اینجا که میشه آموزش دادن به سیستم.سوال مهم دیگم اینه که چجوری این چیزی که آموزش دادیم ازش امتحان بگیریم؟؟؟؟؟؟؟؟؟؟؟؟؟؟یعنی دادن تصویر به سیستم و سوال کردن ازش که بپرسیم این حرف، کدومه؟؟
البته این سوالات این قسمت در مورد هر پروژه ای صدق میکنه و فعلا تخصصی نبود.
خواهش میکنم کسایی که میخونین و بلدین با زبون ساده برام جواب این 6تا سوالمو بدین :cry:
1- ویژگی ها رو شما باید تعریف کنی. ویژگی ها رو باید بشه به صورت عدد بیان کرد و سخت ترین و مهم ترین قسمت کار شناسایی الگو همین تعریف کردن ویژگی های خوب هست.
2- یک مثال برای همین حروف "ب" و "س" میزنم. فرض کن این حروف رو با استفاده از عملیات مورفولوژی نازک سازی کردی، حالا از سمت راست شروع به حرکت کن و به پیکسل بعدی یک بردار بکش و از پیسکل بعد به پیکسل بعد و همین طور تا آخر. البته احتمالاً یه مشکلاتی وجود داره و نیاز به یه مقدار ابتکار و قدرت برنامه نویسی داری. این بردارها رو در مرحله بعد نرمالیزه کن به 4 یا 8 جهت اصلیتر. حالا مثلاً یک ویژگی میتونه تعداد هر جهت باشه یا خود توالی بردارهای 4 یا 8 گانه یک ویژگی برای حروف به حساب میاد. باید یه مقدار فکر کنی و با توجه به اختلاف و شباهت های بین حروف و تنوع رسم الخطهای دیتابیس، ویژگی های تفکیک کننده استخراج کنی.
3- ممکنه یه تعداد ویژگی مثل مورد 2 خودت استخراج کنی ولی مهم ترین روش مراجعه به کار دیگران(مقالات) هست و استفاده از تجارب موفق. در نهایت باید این ویژگی ها رو تست کنی تا ازشون مطمئن بشی. ممکنه بعد از تست، تعدادی از ویژگی ها شبیه هم باشه و لازم باشه از بین ویژگی های شبیه فقط یکی رو انتخاب کنی تا بار محاسباتی کمتر بشه و احتمال متمایل شدن کلاسیفایر به یک ویژگی کم بشه. شاید لازم باشه مرحله انتخاب ویژگی تا تست رو چند مرحله بری و برگردی تا ویژگی های راضی کننده رو به دست بیاری.
4- خوشه بندی برای داده های بدون سرپرست استفاده میشه مثلاً بهت میگن اشیای یک عکس رو با توجه به رنگ یا شدت روشنایی به N تا خوشه دسته بندی کن. در این صورت شما نمونه ای برای مقایسه نداری ولی در طبقه بندی (Classification) تعدادی کلاس داری و تعدادی نمونه آموزشی که کلاسشون از قبل مشخصه و داده های جدید با توجه به شباهت با نمونه های آموزشی هر کلاس که از مقایسه ویژگی ها به دست میاد، باید در یکی از همین کلاسها قرار بگیرن.
5- از 60 تا 70 درصد نمونه های آموزشی برای آموزش کلاسیفایر استفاده کن و از بقیه برای تست.
6- فقط 5 تا سوال بود!لطفاً برای انجام پروژه های دانشجویی پیام خصوصی نفرستید.با تمام وجود گناه کردیم اما نه نعمتش را از ما گرفت نه گناهان ما را فاش کرد اطاعتش کنیم چه می کند؟"دکتر شریعتی"
لطفاً سوالاتی که در انجمن قابل طرح شدن هستند پیام خصوصی نکنید.
اگر جایی که ایستاده اید را نمی پسندید، عوضش کنید شما درخت نیستید!! "پاسکال"
یا به اندازه ی آرزوهایت تلاش کن یا به اندازه تلاشت آرزو کن. "شکسپیر"
دیدگاه
دیدگاه