با عرض سلام خدمت دوستان
من دارم روی موضوع Real-time object recognition using local features برای پایان نامه ام کار می کنم. می خوام این کار رو با روش SIFT انجام بدم.
کل کار را می توان به 3 بخش تقسیم کرد:
1- پیدا کردن Interest Region
2- درآوردن Descriptor ها
3- انجام مرحله Matching and Vocabulary Trees
برای قسمت اول می خواهم از
Distinctive Image Features from Scale-Invariant Keypoints (David G. Lowe 2004) استفاده کنم و برای قسمت دوم از PCA-SIFT استفاده کنم و برای قسمت سوم از Vocabulary Tree
(Scalable Recognition with a Vocabulary Tree_David Nist´er) استفاده کنم.
من فعلا دارم روی قسمت اول کار می کنم . من در این مرحله به چند مشکل برخورد کردم اگه ممکن است من را راهنمایی کنید ؟
1- همانطور که می دانید برای قسمت اول ما می آیم و تو چند مرحله (در هر اوکتاو) روی تصویر فیلتر گوسین اعمال می کنیم و سپس اونها رو 2 به 2 از هم کم می کنیم ( در اوکتاو بعدی ما تصویر رو نصف می کنیم و این مراحل رو انجام می دهیم) فرض کنیم ما 4 اکتاو داشته باشیم و در هر اکتاو هم 5 بار فیلتر گوسی را اعمال کنیم که با تفریق 2به 2، 4 تا DOG(Difference Of Gaussian) باقی می ماند. بعد از درآوردن این DOG ما باید کار Extrema Search را انجام دهیم. که این کار را باید در همسایگی 8 تای همان DOG و همسایگی 9 تایی DOG های همسایه انجام دهیم و یک اکسترمم و یک می نیمم پیدا کنیم. سوال؟ آیا باید این جستجو را برای همه پیکسل های هر DOG انجام دهیم یا نه ؟ یعنی از DOG اولی شروع کنیم و تا آخر ادامه دهیم؟ سوال بعدی ؟ بعد از پیدا کردن این می نیمم و اکسترمم باید یک threshold اعمال کنیم این threshold را بر چه اساسی اعمال می کنیم ؟
2- نقاط بدست آمده از مرحله قبل پایداری خوبی ندارند جهت بهبود این کار 2 کار زیر را انجام می دهند
• Reject Keypoint With Low Contrast
که برای اینکار این رابطه را محاسبه می کنند
[img]http://[/img]
سوال ؟ این رابطه را چگونه باید انجام داد؟
• استفاده از Hessian با سایز 2*2 . سوال این را هم چگونه محاسبه می کنند
من دارم روی موضوع Real-time object recognition using local features برای پایان نامه ام کار می کنم. می خوام این کار رو با روش SIFT انجام بدم.
کل کار را می توان به 3 بخش تقسیم کرد:
1- پیدا کردن Interest Region
2- درآوردن Descriptor ها
3- انجام مرحله Matching and Vocabulary Trees
برای قسمت اول می خواهم از
Distinctive Image Features from Scale-Invariant Keypoints (David G. Lowe 2004) استفاده کنم و برای قسمت دوم از PCA-SIFT استفاده کنم و برای قسمت سوم از Vocabulary Tree
(Scalable Recognition with a Vocabulary Tree_David Nist´er) استفاده کنم.
من فعلا دارم روی قسمت اول کار می کنم . من در این مرحله به چند مشکل برخورد کردم اگه ممکن است من را راهنمایی کنید ؟
1- همانطور که می دانید برای قسمت اول ما می آیم و تو چند مرحله (در هر اوکتاو) روی تصویر فیلتر گوسین اعمال می کنیم و سپس اونها رو 2 به 2 از هم کم می کنیم ( در اوکتاو بعدی ما تصویر رو نصف می کنیم و این مراحل رو انجام می دهیم) فرض کنیم ما 4 اکتاو داشته باشیم و در هر اکتاو هم 5 بار فیلتر گوسی را اعمال کنیم که با تفریق 2به 2، 4 تا DOG(Difference Of Gaussian) باقی می ماند. بعد از درآوردن این DOG ما باید کار Extrema Search را انجام دهیم. که این کار را باید در همسایگی 8 تای همان DOG و همسایگی 9 تایی DOG های همسایه انجام دهیم و یک اکسترمم و یک می نیمم پیدا کنیم. سوال؟ آیا باید این جستجو را برای همه پیکسل های هر DOG انجام دهیم یا نه ؟ یعنی از DOG اولی شروع کنیم و تا آخر ادامه دهیم؟ سوال بعدی ؟ بعد از پیدا کردن این می نیمم و اکسترمم باید یک threshold اعمال کنیم این threshold را بر چه اساسی اعمال می کنیم ؟
2- نقاط بدست آمده از مرحله قبل پایداری خوبی ندارند جهت بهبود این کار 2 کار زیر را انجام می دهند
• Reject Keypoint With Low Contrast
که برای اینکار این رابطه را محاسبه می کنند
[img]http://[/img]
سوال ؟ این رابطه را چگونه باید انجام داد؟
• استفاده از Hessian با سایز 2*2 . سوال این را هم چگونه محاسبه می کنند
دیدگاه