در این مقاله، روشی قدرتمند برای آشکارسازی صورت از زوایای مختلف با استفاده از ترکیب فیلترهای گابور و شبکه عصبی بیان میشود. در ابتدا رابطه ریاضی تولید فیلتر گابور مورد بررسی قرار میگیرد و در مرحله بعد با بررسی 75 بانک فیلتر مختلف، محدوده مقادیر پارامترهای مؤثر در تولید چکیده کامل
در این مقاله، روشی قدرتمند برای آشکارسازی صورت از زوایای مختلف با استفاده از ترکیب فیلترهای گابور و شبکه عصبی بیان میشود. در ابتدا رابطه ریاضی تولید فیلتر گابور مورد بررسی قرار میگیرد و در مرحله بعد با بررسی 75 بانک فیلتر مختلف، محدوده مقادیر پارامترهای مؤثر در تولید فیلتر گابور مشخص شده و سپس بهترین مقدار برای آنها به دست میآید. شبکه عصبی مورد استفاده در این مقاله از نوع پیشخور با روش بازگشتی است و بردار ورودی این شبکه عصبی از کانوالو تصویر با تنها یک فیلتر گابور با زاویه 2/ و فرکانس 2/ در حوزه فرکانس به دست میآید. الگوریتم پشنهادی در این مقاله روی 550 تصویر از 2 پایگاه تصویر فرت با پسزمینه ساده و مارکوس وبر با پسزمینه پیچیده آزمایش شده و دقت آشکارسازی آن به ترتیب 4/98% و 95% است. همچنین به کمک الگوریتم ویولا جونز ناحیه صورت را در 550 نمونه تصویر به دست آورده و مقایسهای بین نتایج به دست آمده از الگوریتم ویولاجونز و الگوریتم پیشنهادی آورده میشود.
پرونده مقاله
این مقاله روشی نوین برای آشکارسازی چندتایی صورت انسان از نمای روبهرو در تصاویر اینترنتی با پسزمینههای پیچیده را با تمرکز بر کاهش خطای آشکارسازی نمونههای غیر صورت به عنوان صورت بیان میکند. در روش ارائهشده از ترکیب شبکه عصبی چندلایه پیشخور با روش آموزش بازگشتی
و چکیده کامل
این مقاله روشی نوین برای آشکارسازی چندتایی صورت انسان از نمای روبهرو در تصاویر اینترنتی با پسزمینههای پیچیده را با تمرکز بر کاهش خطای آشکارسازی نمونههای غیر صورت به عنوان صورت بیان میکند. در روش ارائهشده از ترکیب شبکه عصبی چندلایه پیشخور با روش آموزش بازگشتی
و ویژگی انرژی فیلتر گابور در حوزه فرکانس استفاده شده است. در روش پیشنهادی این مقاله با معرفی پیشپردازشی جدید برای افزایش کیفیت ویژگی انرژی گابور، انجام دو مرحله پایش بر روی تصاویر ورودی و خروجی و همچنین استفاده از سه شاخص شناسایی اجزای صورت در خروجی انرژی گابور، خطای آشکارسازی نمونههای غیر صورت به عنوان صورت به شدت کاهش یافته است. در این مقاله پایگاه تصاویر جدیدی به نام RFD از تصاویر اینترنتی جمعآوری شده است که دارای 583 تصویر صورت غیر تکراری و 9961 تصویر غیر صورت در اندازه 168×192 است. دقت الگوریتم پیشنهادی در آشکارسازی صورت در این پایگاه تصاویر 16/88% و خطای آشکارسازی آن تنها 48 مورد معادل 48/0% است. این در حالی است که الگوریتم ویولاجونز در این پایگاه تصویر دارای 124 خطای آشکارسازی بوده و در نتیجه خطای آشکارسازی الگوریتم پیشنهادی نزدیک به 5/2 برابر بهتر از الگوریتم ویولاجونز میباشد.
پرونده مقاله