ارائه یک سیستم تشخیص چهره با انتخاب بهینهی ویژگیها مبتنی بر الگوریتم بهینهسازی فاخته
محورهای موضوعی : مهندسی برق و کامپیوترفرناز حسینی 1 * , حامد سپهرزاده 2
1 - گروه مهندسی کامپیوتر، دانشگاه فنی و حرفهای، ایران
2 - گروه مهندسی کامپیوتر، دانشگاه فنی و حرفهای، ایران
کلید واژه: تشخیص چهره, بهینهسازی ویژگیها, الگوریتم بهینهسازی فاخته, الگوریتم بهینهسازی,
چکیده مقاله :
تشخیص چهره، یک عمل تشخیص الگوست که بهطور خاص بر روی چهرهها انجام میشود و کاربردهای فراوانی در شناسایی کارتهای اعتباری، سیستمهای امنیتی و موارد دیگر دارد. ایجاد یک سیستم تشخیص چهره با دقت بالا، یک چالش بزرگ میباشد که در سالهای اخیر مورد توجه محققان مختلفی قرار گرفته است. فرایند استخراج ویژگی و طبقهبندی، دو مسئله مهم در سیستمهای تشخیص هستند که میتوانند در افزایش دقت تشخیص نقش بسزایی را ایفا کنند. با توجه به این موضوع در این مطالعه با درنظرگرفتن ویژگیهای ترکیبی و بهینهسازی الگوریتم فاخته، روشی برای بهبود میزان دقت در تشخیص چهره پیشنهاد شده است. در روش ارائهشده، هفت ویژگی از روی تصاویر موجود در پایگاه داده استخراج شده، سپس با بهدستآوردن بردار ویژگیِ مطلوب، مراحل مربوط به انتخاب ویژگی با استفاده از الگوریتم فاخته انجام میشود. روش پیشنهادی با نرمافزار Matlab پیادهسازی گردیده و با روشهای دیگر مورد مقایسه قرار گرفته است. نتایج مربوط به ارزیابی نشان میدهند که روش پیشنهادی توانسته عمل تشخیص بر روی تصاویر دو بانک داده ORL و FDBB را بهترتیب با دقت 00/93% و %12/95% انجام دهد. نتیجه بهدستآمده برای این معیار ارزیابی نسبت به سایر روشهای مقایسهشده از مقدار بالاتری برخوردار است.
Face recognition is a pattern recognition process that is specifically performed on faces. Face recognition has many applications in identifying credit cards, security systems, and other cases. Creating a face recognition system with high accuracy is a big challenge that has been the focus of various researchers in recent years. The feature extraction process and classification are two important issues in diagnosis systems that can play a significant role in increasing the accuracy of diagnosis. Considering this issue, in this study, taking into account the combined features and optimizing the cuckoo algorithm, a method to improve the accuracy of face recognition is proposed. In the presented method, seven features are extracted from the images in the database, and then by obtaining the feature vector, the steps related to feature selection are performed using the cuckoo algorithm. The proposed method has been implemented with MATLAB software and compared with other methods. The evaluation results show that the proposed method was able to perform the detection on the images of ORL and FDBB databases with 93.00% and 95.12% accuracy, respectively. The result obtained for this evaluation criterion has a higher value than other compared methods.
[1] A. Waqar, W. Tian, S. Ud Din, D. Iradukunda, and A. Aman Khan, "Classical and modern face recognition approaches: a complete review," J. of Multimedia Tools and Applications, vol. 80, no. 3, pp. 4825-4880, Jan. 2021.
[2] S. Koosha and M. Amini, "Machine learning and deep learning: a review of methods and applications," J. of World Information Technology and Engineering, vol. 10, no. 7, pp. 3897-3904, May 2023.
[3] ف. حسینی، ا. طبیب¬زاده لمر و سید مهدی میرکاظمی نیارق، "تشخیص چهره با داده¬های ناقص توسط شبکه عصبی کانولوشنی عمیق "(DCNN)، پذیرفته برای انتشار در مجله علمی محاسبات نرم، مرداد 1403.
[4] R. Mayank Kumar and D. Kumar Singh, "A comprehensive survey on techniques to handle face identity threats: challenges and opportunities," J. of Multimedia Tools and Applications, vol. 82, no. 2, pp. 1669-1748, Jan. 2023.
[5] G. Soumia, D. Benboudjema, and W. Pieczynski, "A new hybrid model of convolutional neural networks and hidden Markov chains for image classification," J. of Neural Computing and Applications, vol. 35, no. 24, pp. 17987-18002, Aug. 2023.
[6] N. Yifan and W. Deng, "Federated learning for face recognition with gradient correction," J. of Proc. of the AAAI Conf. on Artificial Intelligence, vol. 36, no. 2, pp. 1999-2007, Jun. 2023.
[7] R. Ramin, "Cuckoo optimization algorithm," J. of Applied Soft Computing, vol. 11, no. 8, pp. 5508-5518, Dec. 2023.
[8] A. Manar Abdulkareem, "Cuckoo search algorithm: review and its application," Tikrit J. of Pure Science, vol. 26, no. 2, pp. 137-144, Apr. 2021.
[9] D. Garg, P. Jain, K. Kotecha, P. Goel, and V. Varadarajan, "An efficient multi-scale anchor box approach to detect partial faces from a video sequence," J. of Big Data and Cognitive Computing, vol. 6, no. 1, pp. 1-9, Jan. 2022.
[10] H. Yan, X. Wang, Y. Liu, Y. Zhang, and H. Li, "A new face detection method based on Faster RCNN," J. of Physics: Conf. Series, vol. 1754, no. 1, Article ID: 012209, 5 pp., 2021.
[11] H. S. Avani, A. Turkar, and C. D. Divya, "Face detection and natural language processing system using artificial intelligence," In: G., Ranganathan, J., Chen, and A. Rocha, (eds) Inventive Communication and Computational Technologies, LNNS, vol. 89, pp. 773-780, 2020.
[12] S. Tangina, M. Delowar Hossain, N. Hasan Zead, N. Alam Sarker, and J. Fardoush, "A new approach for efficient face detection using bpv algorithm based on mathematical modeling," in Proc. of Int. Joint Conf. on Computational Intelligence, pp. 345-358, Dhaka, Bangladesh, 20-21 Nov. 2020.
[13] A. Seema and J. A. Kendule, "Face detection and recognition using combined DRLBP and sift features with fuzzy classifier," in Proc. of International Joint Conference on Advances in Computational Intelligence, pp. 133-143, 20-21 Nov. 2020.
[14] A. Elmahmudi and H. Ugail, "Deep face recognition using imperfect facial data," J. of Future Generation Computer Systems, vol. 99, no. 1, pp. 213-225, Oct. 2019.
[15] R. Vinothkanna and T. Vijayakumar, "Using contourlet transform based RBFN classifier for face detection and recognition," in Proc. Int. Conf. on ISMAC in Computational Vision and Bio-Engineering pp. 1911-1920, Palladam, India, May 2020.
[16] Z. Huiling and K. Lam, "Age-invariant face recognition based on identity inference from appearance age," J. of Pattern Recognition, vol. 76, no. 1, pp. 191-202, Apr. 2018.
[17] H. Sungeun, W. Im, J. Ryu, and H. S. Yang, "SSPP-DAN: deep domain adaptation network for face recognition with single sample per person," in Proc. IEEE Int. Conf. on Image Processing, pp. 825-829, Beijing, China, 17-20 Sept. 2017.
[18] A. Vinay, G. Kathiresan, D. Akhil Mundroy, H. Nihar Nandan, C. Sureka, K. Balasubramanya Murthy, and S. Natarajan, "Face recognition using filtered eoh-sift," J. of Procedia Computer Science, vol. 79, no. 1, pp. 543-552, Jan. 2016.
[19] S. Syed Afaq Ali, M. Bennamoun, and F. Boussaid, "Iterative deep learning for image set based face and object recognition," J. of Neurocomputing, vol. 174, no. 1, pp. 866-874, Jan. 2016.
[20] A. Wadhah, W. Elhamzi, I. Charfi, and M. Atri, "A hybrid feature extraction approach for brain MRI classification based on bag-of-words," J. of Biomedical Signal Processing and Control, vol. 48, no. 1, pp. 144-152, Feb. 2019.
[21] J. Brendan and H. S. Le, "Precision-recall versus accuracy and the role of large data sets," J. of Proc. of the AAAI Conf. on Artificial Intelligence, vol. 33, no. 1, pp. 4039-4048, Jul. 2019.
12 نشریه مهندسی برق و مهندسی کامپیوتر ایران، ب- مهندسی کامپیوتر، سال 22، شماره 1، بهار 1403
مقاله پژوهشی
ارائه یک سیستم تشخیص چهره با انتخاب بهینه ویژگیها
مبتنی بر الگوریتم بهینهسازی فاخته
فرناز حسینی و حامد سپهرزاده
چکیده: تشخیص چهره، یک عمل تشخیص الگوست که بهطور خاص بر روی چهرهها انجام میشود و کاربردهای فراوانی در شناسایی کارتهای اعتباری، سیستمهای امنیتی و موارد دیگر دارد. ایجاد یک سیستم تشخیص چهره با دقت بالا، یک چالش بزرگ میباشد که در سالهای اخیر مورد توجه محققان مختلفی قرار گرفته است. فرایند استخراج ویژگی و طبقهبندی، دو مسئله مهم در سیستمهای تشخیص هستند که میتوانند در افزایش دقت تشخیص نقش بسزایی را ایفا کنند. با توجه به این موضوع در این مطالعه با درنظرگرفتن ویژگیهای ترکیبی و بهینهسازی الگوریتم فاخته، روشی برای بهبود میزان دقت در تشخیص چهره پیشنهاد شده است. در روش ارائهشده، هفت ویژگی از روی تصاویر موجود در پایگاه داده استخراج شده، سپس با بهدستآوردن بردار ویژگیِ مطلوب، مراحل مربوط به انتخاب ویژگی با استفاده از الگوریتم فاخته انجام میشود. روش پیشنهادی با نرمافزار Matlab پیادهسازی گردیده و با روشهای دیگر مورد مقایسه قرار گرفته است. نتایج مربوط به ارزیابی نشان میدهند که روش پیشنهادی توانسته عمل تشخیص بر روی تصاویر دو بانک داده ORL و FDBB را بهترتیب با دقت %00/93 و %12/95 انجام دهد. نتیجه بهدستآمده برای این معیار ارزیابی نسبت به سایر روشهای مقایسهشده از مقدار بالاتری برخوردار است.
کلیدواژه: تشخیص چهره، بهینهسازی ویژگیها، الگوریتم بهینهسازی فاخته، الگوریتم بهینهسازی.
1- مقدمه
چهره نقش مهمی در شناسایی افراد و نمایش احساسات آنها در سطح جامعه دارد. توانایی انسان در تشخیص چهره2 قابل توجه است؛ از این رو انسان میتواند هزاران چهره یاد داده شده در طول عمرش را تشخیص دهد. این مهارت در مقابل تغییرات در شرایط دیداری مانند حالت چهره، سن و همچنین تغییر مدل ریش، مدل مو و عینک ایستادگی میکند [1]. تشخیص هویت انسان بر اساس چهره یکی از مسائل مهمی است که از سالیان گذشته ذهن بشر را به خود مشغول کرده است. امروزه با پیشرفت روزافزون فناوری اطلاعات و گسترش آن در بین مردم، نیاز به روشی برای تشخیص هویت افراد توسط یک ماشین بهجای انسان با استفاده از ویژگیهای بیومتریک به امری حیاتی تبدیل شده است [2]. اساس این روشها یکتابودن بعضی از ویژگیهای انسان مثل چهره، اثر انگشت، عنبیه، DNA و بسیاری از صفات دیگر است؛ اما بهدلیل استفاده زیاد از چهره برای شناسایی هویت یک فرد نسبت به صفات دیگر او، اطلاعات مورد نیاز راحتتر بهدست آمده و این کار باعث تشخیص چهره با دقت بالایی میشود [3]. سیستم تشخیص چهره یک سیستم بیومتریک3 است؛ یک سیستم بیومتریک با استفاده از ویژگی استخراجشده از چهره افراد
و مقایسه آن با الگوی ذخیرهشده در پایگاه داده، کار شناسایی را انجام میدهد. کارایی شناسایی چهره علاوه بر کاربردهایی مثل کنترل دسترسی و کنترل مدارک هویتی در زمینههایی نظیر بازیابی اطلاعات از پایگاه داده و چندرسانهای4 به اثبات رسیده است [4]. از مزایای سیستمهای تشخیص چهره، عدم نیاز به همکاری فرد میباشد که در کاربردهای امنیتی بسیار مورد توجه واقع شده است [5]. چالشهایی که در شناسایی و تشخیص چهره با آن مواجه هستیم، وضعیت چهره نسبت به دوربین، نورپردازی و همچنین روند طبیعی پیرشدن انسان یا پوششهایی نظیر کلاه یا عینک آفتابی میباشد [6]. وظیفه اصلی سیستم تشخیص چهره با وجود چنین چالشهایی، تشخیص درست هویت یک فرد است. کشف و شناسایی چهره در طول بیش از یک دهه گذشته تبدیل به یک حوزه فعال برای تحقیق در شناسایی الگوها شده است. در طول این مدت روشهایی پیشنهاد شدهاند و استانداردهایی نیز برای ارزیابی این روشها بهوجود آمدهاند؛ اما راهحلهای پیشنهادی علاوه بر بهبود قابل قبول در افزایش دقت، نیاز به سرعت بالای تشخیص دارند تا بتوانند چالش مربوط به سرعت و دقت بالای تشخیص را نیز رفع کنند.
راهبرد پیشنهادی این مطالعه، استفاده از الگوریتم بهینهسازی فاخته5 برای تشخیص چهره با ترکیبی از ویژگیهای بهینه است. بهینهسازی فاخته، یکی از الگوریتمهای فرااکتشافی و توسعهدادهشده برای حل مسائل بهینهسازی غیرخطی و مسائل بهینهسازی پیوسته محسوب میشود [7]. این الگوریتم از زندگی خانوادهای از پرندگان به نام فاخته الهام گرفته شده و بر اساس شیوه زندگی بهینه و ویژگیهای جالب این گونه از پرندگان، نظیر تخمگذاری و تولید مثل آنها ارائه گردیده است [8]. هدف اصلی در این مطالعه، ارائه راهکاری مبتنی بر الگوریتم بهینهسازی فاخته جهت افزایش دقت و کاهش خطا در سیستم تشخیص چهره است.
ساختار مقاله به این شکل است که در بخش دوم مروری بر تکنیکها و روشهای مختلف در تشخیص چهره مربوط به سالهای اخیر مورد بحث و بررسی قرار گرفته است. در بخش سوم روش پیشنهادی برای انتخاب بهینه ویژگیها توسط الگوریتم بهینهسازی فاخته مورد بحث قرار گرفته است. در بخش چهارم، نتایج بهدستآمده از روش پیشنهادی و نتیجهگیری و پیشنهادهای آتی نیز در بخش پنجم ارائه شده است.
2- پیشینه تحقیق
در دهههای اخیر تلاشهای زیادی بر روی تشخیص چهره صورت گرفته است. اکثر روشها از الگوریتمهایی استفاده میکنند که سعی در افزایش دقت و کاهش سرعت سیستم تشخیص دارند که در این بخش نمونههایی از این تکنیکها مورد بحث و بررسی قرار گرفته است.
در [9] سال 2021 یک روش تشخیص چهره مبتنی بر یادگیری عمیق با استفاده از استراتژی بخش جعبههای لنگر یا انکر باکسها6 ارائه شد. مدل پیشنهادی بر روی یک بانک داده استاندارد 7(FDBB) مورد آموزش و آزمون قرار گرفته و آزمایشهای گستردهای با معیارهای ارزیابی مختلف بر روی خروجیهای مدل پیشنهادی انجام شده است. نتایج نشان داد که مدل پیشنهادی قادر است چهره را در تصویر با دقت %08/94 بر روی مجموعه داده FDDB تشخیص دهد.
در [10] سال 2021 یک شبکه عصبی کانولوشنی برای تشخیص چهره در تصاویر پیچیده با انسداد جزئی صورت استفاده شده که هدف از این پژوهش بهبود تشخیص چهره است. روش پیشنهادی تعداد زیادی فریم پیشنهادی چهره را تولید میکند که توسط یک شبکه پیشنهادی منطقهای شناسایی میشوند. نتایج آزمایشها و مقایسات نشان میدهند که روش تشخیص چهره در این پژوهش بر روی مجموعه داده FDDB میتواند بهطور مؤثر از تشخیص نادرست تصاویر کلی و تشخیص نادرست چهرههای متعدد تحت انسداد جزئی و روشنایی ناهموار جلوگیری کرده
و در عین حال دارای دقت تشخیص و استحکام بالایی باشد. روش پیشنهادی قادر است چهره را با دقت %00/91 بر روی مجموعه داده FDDB تشخیص دهد.
آوانی و همکاران [11] در سال 2020، تشخیص چهره و سیستم پردازش زبان را با استفاده از هوش مصنوعی مورد مطالعه قرار دادند. هدف از این مقاله بررسی سیستمی مبتنی بر هوش مصنوعی است که چهرهها و سیستمی که زبان طبیعی را پردازش میکنند تشخیص میدهد. فرایند تشخیص چهره در این مطالعه دارای سه مرحله است: نمایش چهره، انتخاب ویژگی و طبقهبندی که مهمترین مرحله مربوط به استخراج و انتخاب ویژگی است.
سلطانا و همکاران [12] در سال 2020، روشی نوین را برای تشخیص مؤثر چهره با استفاده از الگوریتم 8BPV مبتنی بر مدلسازی ریاضی پیشنهاد کردند. در مطالعه آنها ابتدا مدل ریاضی الگوریتمهای مختلف تشخیص چهره مورد تجزیه و تحلیل قرار گرفته و سپس برای یافتن کارآمدترین مدل، مقایسهای بین آنها صورت گرفته است. در این مطالعه یک مدل جدید برای تشخیص چهره پیشنهاد شده که تصاویر انتگرال با الگوی باینری محلی 9(LBP) مقایسه گردیده و مقدار مقایسهشده بهعنوان مقدار آزمون پیشنهاد شده است.
اتوله و همکاران [13] در سال 2020، روشی مبتنی بر الگوی باینری محلی و ویژگیهای تبدیل ویژگی مستقل از مقیاس10 را با طبقهبند فازی جهت تشخیص چهره پیشنهاد کردند. هدف از انتخاب الگوی باینری محلی در این مطالعه، پاسخ سریع آن در روش تشخیص و حساسیت کمتر به نویز و تداخل است. مهمترین مرحله در روش پیشنهادی این مطالعه، استخراج و انتخاب ویژگی از تصویر ورودی است.
المحمودی و همکاران [14] در سال 2019، ایده تشخیص چهره با استفاده از اطلاعات جزئی صورت را توسط الگوریتم ماشین بردار پشتیبان بررسی کردند. در این مطالعه با استفاده از آزمایشهای جدید برای تست عملکرد یادگیری ماشین و تصاویر جزئی چهره با دستکاریهای دیگر در تصاویر مانند چرخش و بزرگنمایی، آموزش و تشخیص انجام شده است. محققان بهطور ویژه، میزان تشخیص را با توجه به قسمتهای مختلف صورت مانند چشمها، دهان، بینی و گونه مطالعه کردهاند و همچنین به بررسی تشخیص چهره با چرخش صورت و بزرگنمایی تصویر صورت پرداختهاند. آزمایشها بر اساس معماری مبتنی بر شبکه عصبی پیچشی پیشرفته با مدل Face-VGG آموزش دیده و از این طریق ویژگیهای بهینه استخراج شدهاند. همچنین از دو طبقهبند، شباهت کسینوسی و ماشینهای بردار برای بررسی نرخهای تشخیص استفاده شده است. نتایج نشان میدهند که بخشهای منحصربهفرد چهره مانند چشمها، بینیها و گونهها دارای نرخ تشخیص کم هستند؛ اما زمانی که بخشهای فردی صورت، ترکیب و بهعنوان شاخص معرفی میشوند، میزان تشخیص سریعاً افزایش مییابد.
وینوتکانا و همکاران [15] در سال 2018 با استفاده از تبدیل کانتورلت11 به همراه آنالیز تمایز خطی، روشی را برای تشخیص چهره پیشنهاد کردند. در روش ارائهشده برای طبقهبندی مؤثر از طبقهبند شبکه عصبی توابع شعاعی پایه استفاده گردیده است. در تکنیک ارائهشده، ویژگیهای استخراجشده موجب افزایش دقت طبقهبند شدهاند.
ژو و همکاران [16] در سال 2018، جهت حل مشكل تغییرات شكل و بافت چهره تحت تأثیر فرایند پیری در گذر زمان، یك مدل استنتاج هویتی بر مبنای یادگیری فضای سنی ارائه کردند. در این مطالعه هویت انسان و متغیرهای پیری با استفاده از آنالیز تفكیك خطی احتمالاتی بهطور همزمان مدلسازی شده و زیرمجموعه پیری بهطور مستقل با برچسبهای سنی ظاهرشده آموزش داده میشوند و زیرمجموعه هویت با الگوریتم انتظار تكرار میگردد. در روش پیشنهادی بهمنظور پیداكردن بهترین ویژگیها، الگوهای باینری محلی وزن و هیستوگرام گرادیان جهتدار استفاده شده است.
هانگ و همكاران [17] در سال 2017، یك روش جدید جهت
حل مشكل تشخیص در جمعآوری نمونه آموزشی از هر فرد و كمبود نمونههای آموزشی پیشنهاد کردند. در این روش ابتدا با استفاده از آشكارساز آدابوست، ناحیه چهره استخراج شده و سپس برای حل مشكل تكنمونهای تصویر، با استفاده از یك مدل چهره سهبعدی، تصاویر مصنوعی با انواع مختلف ایجاد میشوند. ویژگیهای تصاویر با استفاده از شبكه عصبی كانولوشنی استخراج و بردار ویژگیها برحسب دادههای ورودی كه برچسب دارند، توسط طبقهبند مشخص شده و دامنه منبع یا هدف پیشبینی میشود.
وینای و راجش [18] در سال 2016 از روشهای فیلترکردن توسط ویژگیهای دامنه فرکانسی برای تشخیص چهره از استفاده کردند. استفاده
[1] این مقاله در تاریخ 22 شهریور ماه 1400 دریافت و در تاریخ 27 تیر ماه 1402 بازنگری شد.
فرناز حسینی (نویسنده مسئول)، گروه مهندسی کامپیوتر، دانشگاه فنی و حرفهای، تهران، ایران، (email: f-hoseini@tvu.ac.ir).
حامد سپهرزاده، گروه مهندسی کامپیوتر، دانشگاه فنی و حرفهای، تهران، ایران،
(email: hsepehrzadeh@tvu.ac.ir).
[2] . Face Detection
[3] . Biometric
[4] . Multimedia
[5] . Cuckoo Optimization Algorithm
[6] . Anchor Boxes
[7] . http://vis-www.cs.umass.edu/fddb
[8] . Break Point Value
[9] . Local Binary Patterns
[10] . Scale-Invariant Feature Transform
[11] . Contourlet Transform
جدول 1: مطالعه مقایسهای روشهای ارائهشده.
ردیف | مرجع | سال چاپ | تکنیک استفادهشده | مزایا | معایب |
1 | [9] | 2021 | یادگیری عمیق | تشخیص با دقت بالا | پیچیدگی محاسباتی |
2 | [10] | 2021 | شبکه عصبی کانولوشنی | تشخیص با دقت بالا | عدم استفاده از پارامترهای کافی برای انتخاب ویژگیهای مؤثر |
3 | [11] | 2020 | هوش مصنوعی | تشخیص با دقت بالا و انتخاب ویژگیهای مؤثر | عدم استفاده از پایگاه دادههای استاندارد جهت ارزیابی روش ارائهشده |
4 | [12] | 2020 | مدلسازی ریاضی | ارائه دقت مناسب با تحلیل مدل ریاضی | پیچیدگی محاسباتی |
5 | [13] | 2020 | الگوی باینری محلی و ویژگیهای Sift با طبقهبند فازی | حساسیت کمتر به نویز و تداخل | عدم برتري تفكيك ابعاد، ميزان شناخت و زمان آموزش |
6 | [14] | 2019 | الگوریتم ماشین بردار پشتیبان | استفاده از پارامترهای ارزیابی متعدد برای تحلیل نتایج | دقت نسبتاً پایین در تشخیص چهره |
7 | [15] | 2018 | تبدیل کانتورلت | دقت بالای تشخیص | عدم استفاده از پارامترهای ارزیابی کافی |
8 | [16] | 2018 | استنتاج هويتي بر مبناي يادگيري فضاي سنی | تفکیک دقیق تصاویر ورودی چهره | زمان بالای آموزش شبکه |
9 | [17] | 2017 | شبكه عصبي كانولوشنی | دقت بالای تشخیص | پیچیدگی محاسباتی بالا |
10 | [18] | 2016 | فیلترکردن توسط ویژگیهای دامنه فرکانسی | استخراج ویژگیهای مؤثر | دقت پایین طبقهبند |
11 | [19] | 2016 | شبكههاي عصبي چندلايه تطبيقي | انتخاب ویژگی کارآمد | پیچیدگی محاسباتی بالا و عدم پیشپردازش |
از فیلترکردن باعث افزایش دقت انجام این فرایند شده و همچنین چهرهها را با قطعیت بیشتری تشخیص میدهد. روش پیشنهادی با بهدستآوردن مناطق مورد علاقه شروع شده و سپس فیلترها بر روی این مناطق اعمال میگردند. در مرحله بعد ویژگیهای مهم در چهرهها شناسایی شده و نهایتاً با استفاده از الگوریتم کارآمد نزدیکترین همسایه، ویژگیهای چهرهها و مناطق فیلترشده با هم انطباق داده میشوند.
شه و همكارن [19] در سال 2016 برای تشخیص چهره، روشی مبتنی بر شبكههای عصبی چندلایه تطبیقی را پیشنهاد کردند. در این روش، ویژگیهای ثابت سطح پایین توسط لایههای شبکه عصبی آموزش داده میشوند؛ سپس شبكه عصبی مصنوعی بهطور سلسلهمراتبی و بهصورت تكراری برای یادگیری ویژگیهای غیرخطی متمایز بر روی مجموعه تصاویر ورودی اعمال میگردند.
جدول 1 مزایا و معایب روشهای بیانشده در این بخش را نشان میدهد. اکثر روشهای ارائهشده از طبقهبندها برای بهبود دقت تشخیص چهره استفاده کردهاند.
3- روش پیشنهادی
در این بخش یک سیستم تشخیص چهره مبتنی بر الگوریتم بهینهسازی فاخته پیشنهاد میگردد. مراحل مختلفی برای سیستم پیشنهادی تشخیص چهره استفاده شده که مهمترین بخش مربوط به استخراج و انتخاب ویژگی بهینه است که در ادامه به مطالعه و بررسی هر یک از مراحل پرداخته میشود.
3-1 بارگذاری اطلاعات از بانک داده
در این مطالعه برای آموزش و تست روش پیشنهادی از دو بانک داده آزمایشگاه تحقیقاتی اولیوتی1 2(ORL) و FDDB استفاده شده است. بانک داده ORL شامل 400 تصویر از 40 شخص مختلف است که از هر شخص، 10 نمونه تصویر در بانک داده موجود است. از بین این مجموعه تصاویر، 200 تصویر مربوط به آموزش و 200 تصویر مربوط به تست میباشد که این مورد نیز در بانک داده مشخص شده است. علاوه بر اطلاعات فوق در بانک داده ORL برای هر تصویر، تعدادی نقاط حساس مشخص شده که این نقاط مربوط به چشم سمت چپ و راست، دماغ و لب هستند. مختصات نقاط حساس در تصویر عبارتند از چشم چپ نقطه ، چشم راست نقطه ، دماغ نقطه ، سمت چپ لب نقطه و سمت راست لب نقطه . شکل 1 تصاویر مربوط به نقاط حساس و بلوکبندی نقاط را نشان میدهد. در ادامه برای هر نقطه بیانشده یک بلوک در نظر گرفته میشود که برای هر یک از این بلوکها تعدادی ویژگی محاسبه میگردد.
3-2 استخراج ویژگیها
استخراج ویژگیها یکی از پرکاربردترین و چالشبرانگیزترین زمینهها برای بهبود نتایج طبقهبندی دادههای مختلف به حساب میآید و فرایندی است که در آن با انجام عملیاتی بر روی تمام دادهها، ویژگیهای بارز و تعیینکننده هر داده مشخص میشود. در این بخش ویژگیهایی که قادرند وجه تمایز الگوها را مشخص کنند، تعیین میگردند. ویژگیهای مناسب دو خاصیت مهم دارند که میتوان گفت اولاً همه الگوها متعلق به یک کلاس این ویژگیها را دارند و ثانیاً الگوهای متعلق به کلاسهای دیگر آن ویژگی را ندارند. بنابراین ویژگیها خصوصیات اشیایی هستند که بهعنوان ورودی طبقهبندیکننده بهکار میروند و طبقههای مختلف را تشکیل میدهند. ویژگی یک شیء در واقع یک الگوی ورودی را از الگوی دیگر تفکیک میکند. در روش پیشنهادی تعداد هفت ویژگی (انرژی، اینرسی، انتروپی، ، ، و ) [20] و [21] برای هر بلوک استخراج میشود. با محاسبه هفت ویژگی برای هر بلوک برداری به طول 35 ویژگی همانند آنچه در شکل 2 نمایش داده شده، ایجاد میگردد.
برای تمامی تصاویر موجود در مجموعه آموزش، مراحل مربوط به استخراج ویژگی انجام شده و نهایتاً یک جدول ویژگی شامل 35 ستون (ویژگی) و 200 سطر (تصاویر چهره) ایجاد میگردد. ستون آخر جدول ویژگی بهعنوان ستون هدف در نظر گرفته میشود. این ستون بیانکننده آن است که هر بردار ویژگی از جدول، مربوط به کدام کلاس (شخص) میباشد. در ادامه تعدادی از ویژگیهای غیرمؤثر جدول حذف گردیده و ویژگیهای بهتر انتخاب میشود.
شكل 1: تصاویر مربوط به نقاط حساس و بلوکبندی نقاط.
شكل 2: فرایند استخراج ویژگی در روش پیشنهادی.
3-3 انتخاب ویژگی بهینه مبتنی بر الگوریتم فاخته
فرایند انتخاب ویژگیهای مؤثر با استفاده از الگوریتم بهینهسازی فاخته در ادامه انجام میگیرد. فرایند اعمال الگوریتم بهینهسازی فاخته در شکل 3 آمده است. هدف اصلی در این مرحله، پیداکردن بهترین نمونه پاسخ مبتنی بر الگوریتم بهینهسازی فاخته (بهترین حالت قرارگیری اعداد صفر و یک در یک نمونه پاسخ) میباشد که برحسب آن، دقت طبقهبند افزایش پیدا کند. این فرایند بدین صورت است که ابتدا به تعداد جمعیت اولیه، پاسخ نمونه به طول 35 مطابق با بردار ویژگی بهصورت تصادفی و با مقادیر صفر و یک ایجاد میشود. در ادامه به تعداد حداکثر تعداد مراحل تعیین تعداد تخمها، تعیین شعاع تخمگذاری 3ELR، تخمگذاری، حذف تخمهای بد و مهاجرت انجام میگردد و نهایتاً با اتمام اجرای الگوریتم فاخته، رهبر فاخته یا همان بهترین نمونه پاسخ انتخاب میشود. برای تعیین تعداد تخمها برای هر نمونه پاسخ بین 5 تا 20 تخم در نظر گرفته شده و برای تعیین ELR از محاسبه شعاع تخم گذاری توسط (1) استفاده میشود.
(1)
که تعداد تخم فاخته، تعداد کل تخمها، حد بالا و حد پایین است. همچنین پارامتر عدد ثابت، حد بالا مقدار یک و حد پایین مقدار صفر در نظر گرفته شده است.
تخمگذاری: بر اساس مقدار بهدستآمده ELR، تعدادی از تخمهای فاخته تغییر مییابند و به عبارتی مقدار صفر و یک جابهجا میشود
و پس از تخمگذاری، مرحله مربوط به ارزیابی انجام میگردد (محاسبه تابع برازندگی).
حذف تخمهای بد: در این مرحله تخمهای غیربهینه (تخمهایی که مقدار تابع برازندگی آنها کمتر است) حذف میشوند. تخمهایی را که از نظر تابع برازندگی بهتر هستند بهعنوان فاخته در نظر گرفته و مراحل تکرار میشود (فاختهها مهاجرت کرده و تخمگذاری میکنند؛ تخمهایی
شكل 3: فلوچارت الگوریتم بهینهسازی فاخته.
که مد نظر نیستند حذف و تخمهای بهتر انتخاب میشوند) تا اینکه یک فاخته بهینه (یا پاسخ نمونه) انتخاب گردد.
در فرآیند مهاجرت، از الگوریتم KNN برای خوشهبندی فاختهها استفاده میشود. در ادامه متوسط برازندگی هر دسته محاسبه و هر دستهای که متوسط برازندگی بالاتری دارد انتخاب میشود. سپس از دسته منتخب، فاختهای را که مقدار برازندگی بیشتر باشد در نظر گرفته و بهعنوان فاخته رهبر انتخاب میشود. در ادامه تعدادی از صفر و یکهای فاخته رهبر را انتخاب و در کل فاختهها کپی میکنیم. نهایتاً تمام فاختهها به سمت فاختهای که از نظر تابع برازندگی بهتر است (فاخته رهبر) حرکت میکنند و با اتمام اجرای الگوریتم، بهترین فاخته یا همان بهترین نمونه پاسخ انتخاب میشود.
با زیادشدن تعداد ویژگیها، کارایی سیستم تشخیص در ابتدا افزایش پیدا میکند؛ اما از یک حد به بعد زیادشدن تعداد ویژگیها نهتنها کارایی سیستم را بهبود نمیبخشد، بلکه در بعضی مواقع باعث کاهش کارایی سیستم نیز میشود. این مسئله مشکل ابعاد بالا نامیده میشود که موجب پیچیدگی محاسباتی میگردد. علاوه بر این مشکل با زیادشدن تعداد ویژگیها نیاز به تعداد نمونه دادههای بیشتر نیز افزایش مییابد که این امر سبب افزایش پیچیدگی زمانی و مکانی مسئله میشود. هدف اصلی از انتخاب ویژگی، بهحداکثررساندن دقت طبقهبندی (یا همان کمکردن میزان خطای حاصل از طبقهبندی) و کمکردن تعداد ویژگیهاست. در این شرایط ویژگیهای نامناسب و افزونه که قدرت تمایز کمتری دارند حذف میشوند و تعدادی از ویژگیهایی که شامل اطلاعات مناسبی هستند و میتوانند بین کلاسهای الگو تمایز ایجاد کنند، باقی میمانند. بنابراین از
شكل 4: مثالی از حذف ویژگی در روش پیشنهادی.
تعداد ویژگیهای استخراجشده، بهترین ویژگیها انتخاب و در اولویت قرار میگیرند. در روش پیشنهادی برای کاهش ویژگی از الگوریتم بهینهسازی فاخته استفاده شده که در واقع بر روی ویژگیهای استخراجشده اعمال میگردد تا ابعاد ویژگی کاهش یابد. به بیان دیگر قبل از اعمال طبقهبند، ویژگیهای غیرمؤثر حذف میشوند. در ادامه با درنظرگرفتن بردارهای ویژگی و با استفاده از الگوریتم بهینهسازی فاخته، ویژگیهای مؤثر انتخاب میشود. هدف اصلی، حذف ویژگیهای ناکارآمد از جدول ویژگی جهت افزایش دقت طبقهبند است. قبل از انتخاب ویژگی متناظر با اعداد داخل هر بردار مقدار صفر یا یک قرار داده میشود. مقدار یک بیانکننده حذف ویژگی در بردار ویژگی متناظر و بالعکس مقدار صفر باقیماندن ویژگی در بردار است. شکل 4 مثالی از حذف ویژگی در بردار ویژگی را نشان میدهد که بر اساس مقادیر صفر و یک در نمونه پاسخ، ویژگیهایی از بردار ویژگی حذف یا باقی میمانند. همان طور که بیان شد مقدار یک در نمونه پاسخ به معنای حذف ویژگی و مقدار صفر به معنای باقیماندن ویژگی در بردار مورد نظر است.
3-4 طبقهبندی و اعتبارسنجی
الگوریتم KNN بهجای تقسیم مجموعه دادهها به یک مجموعه آموزش و یک مجموعه آزمون، از کل مجموعه داده بهعنوان مجموعه آموزش استفاده میکند. هنگامی که نتیجهای برای یک نمونه داده جدید مورد نیاز است، الگوریتم KNN از کل مجموعه دادهها برای یافتن نزدیکترین نمونهها به نمونه جدید یا تعداد نمونه مشابه با رکورد جدید استفاده میکند و سپس میانگین نتایج (بیشترین کلاس مکرر)
را برای یک مسئله طبقهبندی اعمال مینماید. مقدار توسط کاربر مشخص شده است. شباهت بین نمونهها با استفاده از معیارهایی مانند فاصله اقلیدسی و فاصله همینگ4 محاسبه میشود. بهطور خلاصه در روش پیشنهادی برای برآورد دقت اعتبارسنجی از الگوریتم KNN استفاده شده است. مقدار در الگوریتم KNN برابر 9 در نظر گرفته شده که بیانکننده انتخاب 9 همسایه نزدیک از بین بردارهای ویژگی مربوط به مجموعه آموزش است. با محاسبه فاصله اقلیدسی بین بردارهای ویژگی و نمونه پاسخ، 9 عدد از نزدیکترین همسایهها انتخاب میشوند. با بررسی کلاسهای (شماره فرد) مربوط به 9 کوتاهترین فاصله، کلاسهایی که بیشترین تکرار را داشته باشند مشخص میکنند که نمونه پاسخ مربوط به کدام کلاس است. همچنین نحوه محاسبه اعتبارسنجی به این صورت است که به تعداد بردارهای ویژگی از مجموعه آموزش، از میان امتیازهای (مثبت یا منفی) بهدستآمده، امتیازهای مثبت را در نظر گرفته و در آخر مجموع امتیازهای مثبت را بر تعداد کل رکوردها تقسیم میکند. مقدار بهدستآمده دقت طبقهبند را مشخص مینماید. شکل 5 مثالی از اعمال الگوریتم KNN با مقدار 3 براي پارامتر و تعداد 4 ویژگی با درنظرگرفتن کلاس (صفر/ یک) را نشان میدهد.
4- نتایج تجربی
پیادهسازی روش پیشنهادی با استفاده از نرمافزار Matlab نسخه 2019 انجام شده و نتایج روش پیشنهادی با معیارها و روشهای مختلف مورد ارزیابی و مطالعه قرار گرفته است. نتیجه بهدستآمده از آزمایشها روی بانک داده استاندارد در مقایسه با کارهای قبلی، نشاندهنده قابلیت بالای روش پیشنهادی جهت تشخیص چهره است. در ادامه نتایج تجربی حاصل از پیادهسازی روش پیشنهادی مورد مطالعه و ارزیابی قرار میگیرد.
4-1 معرفی بانک داده
بهمنظور نتیجهگیری مطلوبتر و بهبود تشخیص چهره در این تحقیق از تصاویر مربوط به بانک داده ORL استفاده شده است. جمعآوری این بانک با همکاری گروه مهندسی دانشگاه کمبریج5 و یک گروه گفتار، بینایی و رباتیک6 انجام شد. این بانک داده متشکل از 400 تصویر میباشد که از چهره 40 فرد مختلف (10 تصویر برای هر نفر) تهیه شده است. افراد مورد نظر یا از کارمندان شرکت الیوتی7 و یا از دانشجویان کمبریج میباشند. سن افراد بین 18 تا 81 سال است؛ اما اکثراً 20 تا 35ساله و 36 نفر از آنها مرد و 4 نفر از آنها زن هستند. در هنگام تهیه تصاویر از این افراد خواسته شده که روبهروی دوربین قرار بگیرند؛ بدون آنکه هیچ گونه محدودیتی روی حالت چهره آنان اعمال شود. خود افراد حالت چهرهشان را انتخاب نمودهاند؛ اما از آنان خواسته شده که فقط تا حد معینی سر خود را به چپ یا راست برگردانده یا کج کنند. تصاویر در زمانهای مختلف و با شرایط نوری متفاوت تهیه شدهاند؛ اما همه تصاویر در مقابل یک پرده تیره گرفته شده تا اثر پسزمینه حذف گردد و به عبارتی دیگر در این حالت نیاز به مرحله پیداکردن چهره در تصویر و حذف پسزمینه نیست. تصاویر بعضی افراد در دو حالت با عینک و بدون عینک تهیه شده است. تمام تصاویر بهصورت دستی برش خورده و با ابعاد از مقادیر
8 بیتی با سطح خاکستری 256 ذخیره شدهاند. برای اعمال به برنامه هر تصویر بهصورت یک آرایه بیتی (بیتی) درآمده است. شکل 6 نمونهای از تصاویر مربوط به بانک داده ORL را با حالات مختلف چهره نشان میدهد. تصاویر مربوط شامل تغییراتی از قبیل حالت چهره، تصاویر با عینک و بدون عینک، مقیاس و فاصله و چرخش زاویه سر را شامل میشوند.
بانک دادهی 8 FDDB مجموعهای از چهرههای برچسبگذاریشده از تصاویر چهره مختلف در یک بانک داده وسیع است. این بانک داده حاوی حاشیهنویسی برای 5171 چهره در مجموعهای از 2845 تصویر است که تصاویر آن دارای دو وضوح متفاوت با مقادیر و هستند. مجموعه داده شامل طیف وسیعی از چالشها از جمله زوایای مختلف و گاهی پیچیده، چهرههای خارج از فوکوس و چهرههایی با وضوح پایین است و از هر تصویر دو نمونه سطح خاکستری و رنگی در این بانک داده قرار دارد. چهرههای موجود در این بانک داده، پراكندگی بالایی در اندازه، جهت صورت و پوشش دارند. علاوه بر برچسب مكانی هر چهره در تصویر، چندین برچسب دیگر برای پوشش، وضوح و اندازه چهره نیز وجود دارد. بهطور معمول، تصاویر موجود در این بانک داده بر اساس برچسبهای اضافی ذكرشده به سه دسته آسان، متوسط و سخت
[1] . http://cam-orl.co.uk/facedatabase.html
[2] . The Olivetti Research Laboratory Face Dataset
[3] . Egg Laying Radius
[4] . Hamming Distance
[5] . Cambridge University Engineering Department
[6] . The Speech, Vision, and Robotics Group
[7] . Olivetti Co
[8] . Face Detection Dataset and Benchmark
شكل 5: مثالی از طبقهبندی توسط الگوریتم K-NN در روش پیشنهادی.
شكل 6: نمونهای از تصاویر مورد استفاده از بانک داده ORL.
دستهبندی میشوند. در این مطالعه، برخی از چهرههای این بانک داده حذف گردیده و از این رو تصاویر مورد استفاده در این پژوهش در دسته سخت جای میگیرند. بهبود تشخیص چهره در این مطالعه با توجه به گامهای مطرحشده در روش پیشنهادی به صورت مرحله به مرحله انجام شده است. از مجموعه تصاویر انتخابشده از این بانک داده، 70 درصد برای آموزش، 30 درصد برای آزمون یا تست و بخشی از تصاویر بهصورت تصادفی برای اعتبارسنجی انتخاب شدهاند كه این تعداد شامل 200 تصویر است. تصاویری که جهت آزمون شبکه كنار گذاشته میشوند در فرایند آموزش اولیه دخالتی ندارند. نکتهای که در شبیهسازی انجامشده باید به آن اشاره کرد، استخراج ویژگیهای مؤثر در بهبود کیفیت تصویر برای تشخیص بهینه با استفاده از الگوریتم بهینهسازی فاخته و تعداد تکرارهاست که باعث شده با افزایش تعداد تکرار که بالطبع هزینه بالاتر میرود، بهینگی محلی و قحطیزدگی اتفاق نیفتد. در ادامه شکل 7، نمونههایی از تصاویر بانک داده مورد استفاده و تغییرات تصویر را نمایش میدهد.
4-2 معیارهای ارزیابی
جهت ارزیابی روش پیشنهادی با سایر روشها از معیارهای دقت1، حساسیت2 و ویژگی3 استفاده شده است
(2)
(3)
(4)
دقت: معیار دقت بیانکننده تعداد تصاویری که بهدرستی بازیابی شدهاند نسبت به کل تصاویر است.
حساسیت: معیار حساسیت که در برخی از علوم، نرخ مثبت واقعی یا احتمال بازیابی صحیح نیز نامیده میشود، نسبتی از موارد مثبت است که نتیجه تست آنها را بهدرستی بهعنوان مثبت علامتگذاری میکند (مثلاً درصد افراد بیمار که بهدرستی شناخته شدهاند و این افراد واقعاً سالم نیستند).
ویژگی: به معنی نسبت تعداد نمونههای صحیح بازیابیشده به کل تعداد نمونههاست که سیستم چه بهصورت صحیح و چه بهصورت غلط بازیابی کرده است.
مثبت صحیح 4(TP): تعداد تصاویری که بهدرستی بازیابی شدهاند.
مثبت کاذب 5(FP): تعداد تصاویری که اشتباهاً مثبت بازیابی شدهاند.
منفی صحیح 6(TN): تعداد تصاویری که بهدرستی منفی بازیابی شدهاند.
منفی کاذب 7(FN): تعداد تصاویری که اشتباهاً منفی بازیابی شدهاند.
4-3 نتایج خروجی و مقایسات
در این بخش، نتایج حاصل از پیادهسازی روش پیشنهادی مورد مطالعه و ارزیابی قرار میگیرد. با توجه به نتایج پیادهسازی روش پیشنهادی،
[1] . Accuracy
[2] . Sensitivity
[3] . Specificity
[4] . True Positive
[5] . False Positive
[6] . True Negative
[7] . False Negative
شكل 7: نمونهای از تصاویر مورد استفاده از بانک داده FDDB.
جدول 2: نتایج مربوط به معیارهای دقت، حساسیت و ویژگی.
معیار ارزیابی | مقدار برحسب درصد برای بانک داده ORL | مقدار برحسب درصد برای بانک داده FDDB |
دقت | 00/93 | 12/95 |
حساسیت | 00/91 | 40/94 |
ویژگی | 00/94 | 07/95 |
بهدلیل کاهش بار محسباتی نسبت به سایر روشها و افزایش نرخ دقت تشخیص، این روش میتواند بهعنوان یک روش کارآمد برای شناسایی چهره مورد استفاده قرار گیرد. همان طور که پیشتر بیان گردید، برای پیادهسازی از دو بانک داده استاندارد ORL و FDDB استفاده شده است. یکی از اهداف اصلی روش پیشنهادی، انتخاب ویژگی بهینه با کاهش پیچیدگی محاسباتی میباشد. برای تعیین عملکرد سیستم از معیارهای ارزیابی استاندارد نیز استفاده شده که بیانگر میزان بهبود دقت تشخیص چهره است که با استفاده از این شاخصها میتوان میزان عملکرد روش پیشنهادی را نشان داد. جدول 2 نتایج پیادهسازی روش پیشنهادی را با درنظرگرفتن معیارهای دقت، حساسیت و ویژگی نشان میدهد. نتایج نهایی حاکی از عملکرد قابل قبول سیستم پیشنهادی برای تشخیص چهره است.
جدول 3 مقایسه نتایج مربوط به تشخیص چهره بدون انتخاب ویژگی و انتخاب ویژگی را بر اساس روش پیشنهادی (الگوریتم بهینهسازی فاخته) نشان میدهد. با توجه به نتایج بهدستآمده، روش پیشنهادی با بهینهسازی ویژگیهای استخراجشده از تصاویر توانسته به دقت و صحت بالاتری برای تشخیص چهره دست پیدا کند.
در ادامه، روش پیشنهادی با برخی از روشهای پایه در توصیف شناسایی چهره مقایسه میگردد. با توجه به نتایج پیادهسازی، روش پیشنهادی به این مهم دست یافته که میتواند با استخراج و انتخاب ویژگیهای کارآمد، دقت تشخیص چهره را افزایش دهد. جدول 4 مقایسه نتایج روش پیشنهادی را نسبت به دیگر روشهای تشخیص چهره با درنظرگرفتن پایگاه داده ORL نشان میدهد. با توجه به نتایج نمایش داده شده در جدول 5 و مقایسه معیار دقت برای دو بانک داده ORL و FDDB، روش پیشنهادی با صحت و دقت بالایی تشخیص چهره را انجام داده و میتواند بهعنوان روش مناسبی برای شناسایی چهرههای مختلف مطرح گردد.
5- نتیجهگیری و پیشنهادهای آتی
در سالهای اخیر، تشخیص چهره در زمینههای تحقیقاتی مرتبط با بیومتریک، شناسایی الگو، بینایی ماشین، کاربردهای تجاری و امنیتی بسیار مورد توجه قرار گرفته است. کارایی تشخیص چهره علاوه بر کاربردهای مرتبط با تعیین و مقایسه هویت نظیر کنترل دسترسی امور قضایی، صدور مجوزها و مدارک هویتی و نظارت در زمینههایی نظیر تعامل انسان و کامپیوتر، واقعیت مجازی، بازیابی اطلاعات از پایگاههای داده، چندرسانهای و سرگرمیهای کامپیوتری به اثبات رسیده است. شرایط ثبت تصویر نظیر وضعیت چهره نسبت به دوربین نورپردازی، حالتهای چهره و تعداد پیکسلها در ناحیه چهره و همچنین روند طبیعی پیرشدن انسان میتواند تغییرات زیادی را بر تصویر چهره انسان تحمیل کند. تغییرات دیگری هم ممکن است از طریق پوششهایی نظیر کلاه یا عینک آفتابی و موی صورت بهوجود آید. روند پیری در برخی افراد باعث کاهش یا افزایش وزن میشود که خود، بعد جدیدی بر تنوع و حالتهای مختلف چهره انسان میافزاید. دامنه تصاویر چهره بسیار وسیع بوده و چالش اصلی سیستمهای تشخیص چهره تعیین هویت یک فرد در عین وجود تمام این تنوعها و تفاوتها میباشد. صحت و دقت تشخیص تصاویر در بین تصاویر ورودی، از مسائلی است که در تشخیص چهره بسیار مورد توجه بوده و باید توسط محققین مورد توجه قرار گیرد. در اکثر مطالعات قبلی برای تشخیص چهره و افزایش دقت از روشهای مختلفی استفاده کردهاند. بهدلیل پیچیدگی محاسباتی و همچنین عدم کارایی مناسب در استخراج ویژگیها، اکثر روشها نتوانستهاند عملکرد بهتری را ارائه دهند. در این مطالعه، روشی مبتنی بر الگوریتم بهینهسازی فاخته برای تشخیص چهره پیشنهاد شد که هدف اصلی آن، انتخاب ویژگیهای مؤثر جهت افزایش دقت و کاهش پیچیدگی محاسباتی در تشخیص چهره است. روش پیشنهادی با استفاده از نرمافزار Matlab نسخه 2019 مورد پیادهسازی قرار گرفت و برای ارزیابی نتایج خروجی از معیارهای ارزیابی استاندارد بر روی یک بانک داده استاندارد استفاده شد. نتایج خروجی نشان داد که سیستم پیشنهادی با ایجاد مجموعه آموزش مناسب و سیستم دقیق بهتر از سایر روشهای همساختار عمل کرده و نیز سرعت این روش برای کاربردهای امنیتی مناسب است. نتایج حاصل با برخی از الگوریتمهای معرفیشده در بخش پیشینه تحقیق مقایسه گردید. با درنظرگرفتن مطالب بیانشده در این مطالعه برای کارهای آتی میتوان حالات احساسی کلیدی را برای سیستم پیشنهادی گسترش داد یا حالتهای احساسی ترکیبی ایجاد کرد؛ بهعنوان مثال حالت احساسی تعجب همراه با خوشحالی. همچنین برای ایجاد مجموعه آموزش بهتر و افزایش دقت طبقهبندی میتوان از سایر الگوریتمهای فراابتکاری با درنظرگرفتن روش آنالیز مؤلفههای مستقل استفاده نمود.
جدول 3: مقایسه نتایج تشخیص چهره با انتخاب ویژگی و بدون انتخاب ویژگی.
حالت انتخاب ويژگي | دقت | حساسیت | ویژگی |
با انتخاب ویژگی توسط روش پیشنهادی برای بانک داده ORL | 00/93% | 00/91% | 00/94% |
بدون انتخاب ویژگی برای بانک داده ORL | 00/51% | 00/50% | 00/53% |
با انتخاب ویژگی توسط روش پیشنهادی برای بانک داده FDDB | 12/95% | 40/92% | 07/95% |
بدون انتخاب ویژگی برای بانک داده FDDB | 00/90% | 67/89% | 26/92% |
جدول 4: مقایسه نتایج روش پیشنهادی با سایر روشهای تشخیص چهره برای بانک داده ORL.
معیار ارزیابی | مقدار برحسب درصد در روش پیشنهادی | مقدار برحسب درصد در هوش مصنوعی [11] | مقدار برحسب درصد در الگوی باینری محلی و ویژگیهای Sift با طبقهبند فازی [13] | مقدار برحسب درصد در |
دقت | 00/93 | 00/90 | 00/86 | 00/91 |
حساسیت | 00/91 | 00/84 | 00/84 | 00/90 |
ویژگی | 00/94 | 00/93 | 00/92 | 00/91 |
جدول 5: مقایسه دقت روش پیشنهادی با سایر روشهای تشخیص چهره مربوط به سالهای اخیر.
معیار ارزیابی: دقت | مقدار برحسب درصد برای بانک داده ORL | مقدار برحسب درصد برای بانک داده FDDB |
روش پیشنهادی | 00/93 | 12/95 |
یادگیری عمیق [9] | - | 08/94 |
شبکه عصبی کانولوشنی [10] | - | 00/91 |
هوش مصنوعی [11] | 00/90 | - |
الگوی باینری محلی و ویژگیهای Sift با طبقهبند فازی [13] | 00/86 | - |
شبکه عصبی کانولوشنی [17] | 00/91 | - |
مراجع
[1] A. Waqar, W. Tian, S. Ud Din, D. Iradukunda, and A. Aman Khan, "Classical and modern face recognition approaches: a complete review," J. of Multimedia Tools and Applications, vol. 80, no. 3,
pp. 4825-4880, Jan. 2021.
[2] S. Koosha and M. Amini, "Machine learning and deep learning: a review of methods and applications," J. of World Information Technology and Engineering, vol. 10, no. 7, pp. 3897-3904, May 2023.
[3] ف. حسینی، ا. طبیبزاده لمر و سید مهدی میرکاظمی نیارق، "تشخیص چهره با دادههای ناقص توسط شبکه عصبی کانولوشنی عمیق "(DCNN)، پذیرفته برای انتشار در مجله علمی محاسبات نرم، مرداد 1403.
[4] R. Mayank Kumar and D. Kumar Singh, "A comprehensive survey on techniques to handle face identity threats: challenges and opportunities," J. of Multimedia Tools and Applications, vol. 82,
no. 2, pp. 1669-1748, Jan. 2023.
[5] G. Soumia, D. Benboudjema, and W. Pieczynski, "A new hybrid model of convolutional neural networks and hidden Markov chains for image classification," J. of Neural Computing and Applications, vol. 35, no. 24, pp. 17987-18002, Aug. 2023.
[6] N. Yifan and W. Deng, "Federated learning for face recognition with gradient correction," J. of Proc. of the AAAI Conf. on Artificial Intelligence, vol. 36, no. 2, pp. 1999-2007, Jun. 2023.
[7] R. Ramin, "Cuckoo optimization algorithm," J. of Applied Soft Computing, vol. 11, no. 8, pp. 5508-5518, Dec. 2023.
[8] A. Manar Abdulkareem, "Cuckoo search algorithm: review and its application," Tikrit J. of Pure Science, vol. 26, no. 2, pp. 137-144, Apr. 2021.
[9] D. Garg, P. Jain, K. Kotecha, P. Goel, and V. Varadarajan, "An efficient multi-scale anchor box approach to detect partial faces from a video sequence," J. of Big Data and Cognitive Computing, vol. 6, no. 1, pp. 1-9, Jan. 2022.
[10] H. Yan, X. Wang, Y. Liu, Y. Zhang, and H. Li, "A new face detection method based on Faster RCNN," J. of Physics: Conf. Series, vol. 1754, no. 1, Article ID: 012209, 5 pp., 2021.
[11] H. S. Avani, A. Turkar, and C. D. Divya, "Face detection and natural language processing system using artificial intelligence," In: G., Ranganathan, J., Chen, and A. Rocha, (eds) Inventive Communication and Computational Technologies, LNNS, vol. 89, pp. 773-780, 2020.
[12] S. Tangina, M. Delowar Hossain, N. Hasan Zead, N. Alam Sarker, and J. Fardoush, "A new approach for efficient face detection using bpv algorithm based on mathematical modeling," in Proc. of Int. Joint Conf. on Computational Intelligence, pp. 345-358, Dhaka, Bangladesh, 20-21 Nov. 2020.
[13] A. Seema and J. A. Kendule, "Face detection and recognition using combined DRLBP and sift features with fuzzy classifier," in Proc. of International Joint Conference on Advances in Computational Intelligence, pp. 133-143, 20-21 Nov. 2020.
[14] A. Elmahmudi and H. Ugail, "Deep face recognition using imperfect facial data," J. of Future Generation Computer Systems, vol. 99,
no. 1, pp. 213-225, Oct. 2019.
[15] R. Vinothkanna and T. Vijayakumar, "Using contourlet transform based RBFN classifier for face detection and recognition," in Proc. Int. Conf. on ISMAC in Computational Vision and Bio-Engineering pp. 1911-1920, Palladam, India, May 2020.
[16] Z. Huiling and K. Lam, "Age-invariant face recognition based on identity inference from appearance age," J. of Pattern Recognition, vol. 76, no. 1, pp. 191-202, Apr. 2018.
[17] H. Sungeun, W. Im, J. Ryu, and H. S. Yang, "SSPP-DAN: deep domain adaptation network for face recognition with single sample per person," in Proc. IEEE Int. Conf. on Image Processing, pp. 825-829, Beijing, China, 17-20 Sept. 2017.
[18] A. Vinay, G. Kathiresan, D. Akhil Mundroy, H. Nihar Nandan,
C. Sureka, K. Balasubramanya Murthy, and S. Natarajan, "Face recognition using filtered eoh-sift," J. of Procedia Computer Science, vol. 79, no. 1, pp. 543-552, Jan. 2016.
[19] S. Syed Afaq Ali, M. Bennamoun, and F. Boussaid, "Iterative deep learning for image set based face and object recognition," J. of Neurocomputing, vol. 174, no. 1, pp. 866-874, Jan. 2016.
[20] A. Wadhah, W. Elhamzi, I. Charfi, and M. Atri, "A hybrid feature extraction approach for brain MRI classification based on bag-of-words," J. of Biomedical Signal Processing and Control, vol. 48,
no. 1, pp. 144-152, Feb. 2019.
[21] J. Brendan and H. S. Le, "Precision-recall versus accuracy and the role of large data sets," J. of Proc. of the AAAI Conf. on Artificial Intelligence, vol. 33, no. 1, pp. 4039-4048, Jul. 2019.
فرناز حسینی در سال 1368 متولد شده و در رشته کامپیوتر گرایش نرمافزار از مقطع کاردانی تا دکتری تحصیل نموده است. وی در سال 1387 از دانشگاه فنی و حرفهای واحد اردبیل با رتبه 1 در مقطع کاردانی فارغ التحصیل شده و در رشته مهندسی نرمافزار ادامه تحصیل داده و مدرک کارشناسی خود را در سال 1390 اخذ کرد. وی در همان سال برای ادامه تحصیل در مقطع کارشناسی ارشد پذیرفته شده و مدرک کارشناسی ارشد خود را در سال 1392 دریافت نمود. او در سال 1393 برای ادامه تحصیل در رشته مهندسی نرمافزار به عنوان دکترای تمام وقت پذیرفته شد و این مقطع را نیز در سال 1397 به پایان رساند. وی از سال 1394 تا 1399 به عنوان استادیار گروه مهندسی کامپیوتر دانشگاه شهریار آستارا مشغول به کار بوده و از سال 1399 به عنوان استادیار فنی به دانشگاه فنی و حرفهای پیوست. او از سال 1399 تا 1401 به عنوان رئیس مرکز دختران اردبیل فعالیت داشته و هماکنون به عنوان عضو هیأت علمی در این مرکز مشغول به کار میباشد. زمينههاي تحقيقاتي مورد علاقه ايشان عبارتند از: مهندسي نرم افزار، یادگیری عمیق، پردازش تصویر، پردازش موازي، سیستمهای فازی و یادگیری ماشین.
حامد سپهرزاده تحصیلات خود در مقاطع کارشناسی و کارشناسی ارشد را در رشته مهندسی کامپیوتر گرایش نرمافزار بهترتیب در سالهای 1388 و 1390 به اتمام رساند. همچنین در سال 1396 از دانشگاه علم صنعت ایران در مقطع دکتری در رشته مهندسی کامپیوتر گرایش نرمفزار فارغالتحصیل گردید. مقالههای متعددی از ایشان در حوزه شبکههای بیسیم، امنیت اطلاعات، امنیت سیستمهای سایبر- فیزیکی، و هوش مصنوعی در کنفرانسها و مجلات معتبر منتشر شده است. دکتر سپهرزاده در حال حاضر استادیار دانشگاه فنی و حرفهای است.