کنترل مد لغزشی مبتنی بر داده مبتنی بر شبکه عصبی بازگشتیتصویر برای عفونت :HIV یک رویکرد مقدار تکین
محورهای موضوعی : مهندسی برق و کامپیوتراشکان ضرغامی 1 , مهدی سیاهی 2 * , فریدون نوشیروان راحت آباد 3
1 - دانشكده مهندسي برق، دانشگاه آزاد اسلامی واحد تهران مرکز
2 - دانشکده مهندسي برق و کامپیوتر، دانشگاه آزاد اسلامی واحد علوم و تحقیقات
3 - دانشکده مهندسی پزشکی، دانشگاه آزاد اسلامی واحد علوم و تحقیقات
کلید واژه: کنترل مد لغزشی مبتنی بر داده, شبکه عصبی بازگشتی تصویر, رویکرد مقدار تکین, عفونت HIV,
چکیده مقاله :
در این مقاله، جبرانسازی عفونت HIV با استفاده از کنترل مد لغزشی مبتنی بر داده در تلفیق با شبکه عصبی بازگشتی تصویر مورد توجه قرار گرفته است. اهداف اصلی تعیین قوانین کنترلی بهگونهای است که نیازی به معادلات ریاضی عفونت HIV نباشد و محدودیت فیزیکی محرک نیز برآورده شود. این کار با توسعه مبانی کنترل تطبیقی مستقل از مدل صورت میگیرد که در آن از خطیسازی دینامیکی محلی مبتنی بر تخمین مشتق شبهجزئی برای توصیف رابطه بین ورودی و خروجی استفاده میشود. برای تعیین قانون کنترل، نخست یک شاخص عملکرد مبتنی بر تحقق شرط دسترسی نمایی زمان گسسته تعریف میشود. با تبدیل این شاخص به یک مسئله برنامهریزی مرتبه دوی مقید، دینامیک شبکه عصبی بازگشتی تصویر بر اساس نظریه تصویر استخراج میشود. به کمک معادله خروجی بهینهسازی، دینامیک حلقه بسته بهصورت صریح تعیین میگردد و تحلیل پایداری حلقه بسته به کمک رویکرد مقدار تکین مورد بررسی قرار میگیرد. نتایج شبیهسازی الگوریتم پیشنهادی در قیاس با یکی از جدیدترین رویکردهای کنترلی، نشاندهنده کیفیت بالای الگوریتم در هدایت دینامیک عفونت HIV به نقطه تعادل سالم در حضور عدم قطعیت مدل و اغتشاشات خارجی است.
In the present study, drug treatment of HIV infection is investigated using a Data-Driven Sliding Mode Control (DDSMC) combined with a Projection Recurrent Neural Network (PRNN). The major objective is to establish the control law that eliminates the need for HIV infection mathematical formulae and ensures that the physical limits of the actuator are reached. This is accomplished by creating the concepts of model-free adaptive control, in which the relation between input and output is described using local dynamic linearized models based on quasi-partial derivatives. To determine the DDSMC law, a performance index is first defined based on the fulfillment of a discrete-time exponential reaching condition. By turning this index into a quadratic programming problem, the dynamics of the PRNN are extracted based on projection theory. The closed-loop system is explicitly determined using the optimizer output equation and the closed-loop stability analysis is evaluated using the singular value approach. The simulation results reveal that the proposed algorithm has robust performance in conducting the state variables of HIV infection to the healthy equilibrium point in the face of model uncertainty and external disturbances when compared to one of the newest control techniques.
[1] R. V. Culshaw, S. Ruan, and R. J. Spiteri, "Optimal HIV treatment by maximising immune response," J. of Mathematical Biology, vol. 48, no. 5, pp. 545-562, 2004.
[2] D. Y. Lu, H. Y. Wu, N. S. Yarla, B. Xu, J. Ding, and T. R. Lu, "HAART in HIV/AIDS treatments: future trends," Infectious Disorders-Drug Targets, vol. 18, no. 1, pp. 15-22, 2018.
[3] A. Sharafian, A. Sharifi, and W. Zhang, "Fractional sliding mode based on RBF neural network observer: application to HIV infection mathematical model," Computers & Mathematics with Applications, vol. 79, no. 11, pp. 3179-3188, 1 Jun. 2020.
[4] Z. Zhang, J. Zhang, F. Cheng, and F. Liu, "A novel stability criteria of a class nonlinear fractional-order HIV-1 system with multiple delay," International J. of Control, Automation and Systems, vol. 17, no. 9, pp. 2274-2283, Sept. 2019.
[5] R. S. Butt, I. Ahmad, R. Iftikhar, and M. Arsalan, "Integral backstepping and synergetic control for tracking of infected cells during early antiretroviral therapy," IEEE Access, vol. 7, pp. 69447-69455, 2019.
[6] H. Jahanshahi, "Smooth control of HIV/AIDS infection using a robust adaptive scheme with decoupled sliding mode supervision," The European Physical J. Special Topics, vol. 227, no. 7, pp. 707-718, 2018.
[7] A. J. Anelone and S. K. Spurgeon, "Prediction of the containment of HIV infection by antiretroviral therapy-a variable structure control approach," IET Systems Biology, vol. 11, no. 1, pp. 44-53, Feb. 2017.
[8] P. S. Rivadeneira and C. H. Moog, "Impulsive control of single-input nonlinear systems with application to HIV dynamics," Applied Mathematics and Computation, vol. 218, no. 17, pp. 8462-8474, 1 May 2012.
[9] Y. Pei, N. Shen, J. Zhao, Y. Yu, and Y. Chen, "Analysis and simulation of a delayed HIV model with reaction-diffusion and sliding control," Mathematics and Computers in Simulation, vol. 212, pp. 382-405, Oct. 2023.
[10] D. Shi, S. Ma, and Q. Zhang, "Sliding mode dynamics and optimal control for HIV model," Mathematical Biosciences and Engineering, vol. 20, no. 4, pp. 7273-7297, 13 Feb. 2023.
[11] A. Izadbakhsh, A. A. Kalat, and S. Khorashadizadeh, "Observer-based adaptive control for HIV infection therapy using the Baskakov operator," Biomedical Signal Processing and Control, vol. 65, Article ID: 102343, Mar. 2021.
[12] N. H. Jo, "Robust drug treatment for HIV-1 infection model with completely unknown parameters," International J. of Control, Automation and Systems, vol. 17, no. 12, pp. 3113-3121, Dec. 2019.
[13] Y. Ding, Z. Wang, and H. Ye, "Optimal control of a fractional-order HIV-immune system with memory," IEEE Trans. on Control Systems Technology, vol. 20, no. 3, pp. 763-769, May 2011.
[14] H. D. Kwon, J. Lee, and S. D. Yang, "Optimal control of an age-structured model of HIV infection," Applied Mathematics and Computation, vol. 219, no. 5, pp. 2766-2779, Nov. 2012.
[15] H. Wang, et al., "A Caputo-Fabrizio fractional-order model of HIV/AIDS with a treatment compartment: sensitivity analysis and optimal control strategies," Entropy, vol. 23, no. 5, Article ID: e23050610, 2021.
[16] E. A. Hernandez-Vargas, P. Colaneri, and R. H. Middleton, "Optimal therapy scheduling for a simplified HIV infection model," Automatica, vol. 49, no. 9, pp. 2874-2880, Sept. 2013.
[17] A. E. Abharian, S. Z. Sarabi, and M. Yomi, "Optimal sigmoid nonlinear stochastic control of HIV-1 infection based on bacteria foraging optimization method," Biomedical Signal Processing and Control, vol. 10, pp. 184-191, Mar. 2014.
[18] P. Di Giamberardino and D. Iacoviello, "LQ control design for the containment of the HIV/AIDS diffusion," Control Engineering Practice, vol. 77, pp. 162-173, Aug. 2018.
[19] N. A. Reisi, S. H. Lakmesari, M. J. Mahmoodabadi, and S. Hadipour, "Optimum fuzzy control of human immunodeficiency virus type1 using an imperialist competitive algorithm," Informatics in Medicine Unlocked, vol. 16, Article ID: 100241, 2019.
[20] M. H. A. Biswas, M. M. Haque, and U. K. Mallick, "Optimal control strategy for the immunotherapeutic treatment of HIV infection with state constraint," Optimal Control Applications and Methods, vol. 40, no. 4, pp. 807-818, Jul./Aug. 2019.
[21] S. B. Chen, et al., "Antiretroviral therapy of HIV infection using a novel optimal type-2 fuzzy control strategy," Alexandria Engineering J., vol. 60, no. 1, pp. 1545-1555, Feb. 2021.
[22] E. Shamsara, Z. Afsharnezhad, and S. Effati, "Optimal drug control in a four‐dimensional HIV infection model," Optimal Control Applications and Methods, vol. 41, no. 2, pp. 469-486, Mar./ Apr. 2020.
[23] T. Jang, H. D. Kwon, and J. Lee, "Free terminal time optimal control problem of an HIV model based on a conjugate gradient method," Bulletin of Mathematical Biology, vol. 73, no. 10, pp. 2408-2429, Oct. 2011.
[24] P. Di Giamberardino and D. Iacoviello, "HIV infection control: a constructive algorithm for a state-based switching control," International J. of Control, Automation and Systems, vol. 16, no. 3, pp. 1469-1473, Jun. 2018.
[25] F. Sun and K. Turkoglu, "Estimation of CD4+T cell count parameters in HIV/AIDS patients based on real-time nonlinear receding horizon control," International J. of Control, Automation and Systems, vol. 16, no. 4, pp. 1805-1813, Aug. 2018.
[26] G. Pannocchia, M. Laurino, and A. Landi, "A model predictive control strategy toward optimal structured treatment interruptions in anti-HIV therapy," IEEE Trans. on Biomedical Engineering, vol. 57, no. 5, pp. 1040-1050, May 2010.
[27] D. Kinderlehrer and G. Stampacchia, An Introduction to Variational Inequalities and Their Applications, Society for Industrial and Applied Mathematics, 2000.
[28] Q. Liu and J. Wang, "A one-layer recurrent neural network with a discontinuous activation function for linear programming," Neural Computation, vol. 20, no. 5, pp. 1366-1383, May 2008.
[29] Y. Xia and J. Wang, "A bi-projection neural network for solving constrained quadratic optimization problems," IEEE Trans. on Neural Networks and Learning Systems, vol. 27, no. 2, pp. 214-224, Feb. 2015.
[30] A. Golbabai and S. Ezazipour, "A projection-based recurrent neural network and its application in solving convex quadratic bilevel optimization problems," Neural Computing and Applications, vol. 32, no. 8, pp. 3887-3900, Apr. 2020.
[31] Y. Xia, J. Wang, and W. Guo, "Two projection neural networks with reduced model complexity for nonlinear programming," IEEE Trans. on Neural Networks and Learning Systems, vol. 31, no. 6, pp. 2020-2029, Jun. 2019.
[32] Y. Yang and X. Xu, "The projection neural network for solving convex nonlinear programming," in Proc. Int. Conf. on Intelligent Computing, Springer, pp. 174-181, Qingdao, China, 21-24 Aug. 2007.
[33] Q. Liu and J. Wang, "A projection neural network for constrained quadratic minimax optimization," IEEE Trans. on Neural Networks and Learning Systems, vol. 26, no. 11, pp. 2891-2900, Nov. 2015.
[34] Y. Zhang, S. Chen, S. Li, and Z. Zhang, "Adaptive projection neural network for kinematic control of redundant manipulators with unknown physical parameters," IEEE Trans. on Industrial Electronics, vol. 65, no. 6, pp. 4909-4920, Jun. 2017.
[35] M. Yang, Y. Zhang, and H. Hu, "Posture coordination control of two-manipulator system using projection neural network," Neurocomputing, vol. 427, pp. 179-190, Feb. 2021.
[36] Z. Li, H. Xiao, C. Yang, and Y. Zhao, "Model predictive control of nonholonomic chained systems using general projection neural networks optimization," IEEE Trans. on Systems, Man, and Cybernetics: Systems, vol. 45, no. 10, pp. 1313-1321, Oct. 2015.
[37] N. H. Jo and Y. Roh, "A two-loop robust controller for HIV infection models in the presence of parameter uncertainties," Biomedical Signal Processing and Control, vol. 18, pp. 245-253, Apr. 2015.
[38] H. Shim, N. H. Jo, H. Chang, and J. H. Seo, "A system theoretic study on a treatment of AIDS patient by achieving long-term non-progressor," Automatica, vol. 45, no. 3, pp. 611-622, Mar. 2009.
[39] Z. Hou and S. Xiong, "On model-free adaptive control and its stability analysis," IEEE Trans. on Automatic Control, vol. 64, no. 11, pp. 4555-4569, Nov. 2019.
[40] H. Du, X. Yu, M. Z. Chen, and S. Li, "Chattering-free discrete-time sliding mode control," Automatica, vol. 68, pp. 87-91, Jun. 2016.
[41] Y. Xia and J. Wang, "A general methodology for designing globally convergent optimization neural networks," IEEE Trans. on Neural Networks, vol. 9, no. 6, pp. 1331-1343, Nov. 1998.
[42] S. Liu and J. Wang, "A simplified dual neural network for quadratic programming with its KWTA application," IEEE Trans. on Neural Networks, vol. 17, no. 6, pp. 1500-1510, Nov. 2006.
[43] S. Skogestad and I. Postlethwaite, Multivariable Feedback Control: Analysis and Design, New York: Wiley, vol. 2, 2007.
[44] C. D. Meyer, Matrix Analysis and Applied Linear Algebra, vol. 71, SIAM, 2000.
[45] M. J. Mahmoodabadi and S. H. Lakmesari, "Adaptive sliding mode control of HIV-1 infection model," Informatics in Medicine Unlocked, vol. 25, Article ID: 100703, 2021.
نشریه مهندسی برق و مهندسی کامپیوتر ایران، الف- مهندسی برق، سال 21، شماره 4، زمستان 1402 229
مقاله پژوهشی
کنترل مد لغزشی مبتنی بر داده مبتنی بر شبکه عصبی بازگشتی
تصویر برای عفونت HIV: یک رویکرد مقدار تکین
اشکان ضرغامی، مهدی سیاهی و فریدون نوشیروان راحتآباد
چکیده: در این مقاله، جبرانسازی عفونت HIV با استفاده از کنترل مد لغزشی مبتنی بر داده در تلفیق با شبکه عصبی بازگشتی تصویر مورد توجه قرار گرفته است. اهداف اصلی تعیین قوانین کنترلی بهگونهای است که نیازی به معادلات ریاضی عفونت HIV نباشد و محدودیت فیزیکی محرک نیز برآورده شود. این کار با توسعه مبانی کنترل تطبیقی مستقل از مدل صورت میگیرد که در آن از خطیسازی دینامیکی محلی مبتنی بر تخمین مشتق شبهجزئی برای توصیف رابطه بین ورودی و خروجی استفاده میشود. برای تعیین قانون کنترل، نخست یک شاخص عملکرد مبتنی بر تحقق شرط دسترسی نمایی زمان گسسته تعریف میشود. با تبدیل این شاخص به یک مسئله برنامهریزی مرتبه دو مقید، دینامیک شبکه عصبی بازگشتی تصویر بر اساس نظریه تصویر استخراج میشود. به کمک معادله خروجی بهینهسازی، دینامیک حلقه بسته بهصورت صریح تعیین میگردد و تحلیل پایداری حلقه بسته به کمک رویکرد مقدار تکین مورد بررسی قرار میگیرد. نتایج شبیهسازی الگوریتم پیشنهادی در قیاس با یکی از جدیدترین رویکردهای کنترلی، نشاندهنده کیفیت بالای الگوریتم در هدایت دینامیک عفونت HIV به نقطه تعادل سالم در حضور عدم قطعیت مدل و اغتشاشات خارجی است.
کلیدواژه: کنترل مد لغزشی مبتنی بر داده، شبکه عصبی بازگشتی تصویر، رویکرد مقدار تکین، عفونت HIV.
1- مقدمه
کنترل بیماری 2HIV یکی از مسائل چالشبرانگیز در طی چند دهه اخیر است. یکی از مهمترین دلایل جبرانسازی عفونت HIV، جلوگیری از بروز بیماری 3AIDS است. عدم جبرانسازی عفونت HIV موجب تضعیف سیستم امینی بدن در گذر زمان شده و برای بیماران مبتلا به AIDS میتواند بسیار تهدیدآمیز باشد. در چنین شرایطی، غلظت سلولهای معیوب بهتدریج افزایش یافته و این متناظر با کاهش غلظت سلولهای سالم و افزایش تعداد ویروسهای آزاد است. بخشی از سلولهای سالم که عموماً به سلولهای کمککننده معروف هستند، نقشی حیاتی در حمله به ویروسهای HIV را بر عهده دارند. این سلولها سیگنالهایی را به سلولهای پاسخ ایمنی برای مقابله با هجوم ویروسها و افزایش سلولهای معیوب ارسال میکنند [1].
عموم تحقیقات انجامگرفته در این حوزه معطوف به معرفی مدلهای تحلیلی در چارچوب ریاضیاتی با هدف توسعه تکنیکهای درمانی مؤثر است. یکی از مهمترین رویکردهای تحلیلی برای توصیف مبتنی بر درمان HIV، درمان ضد رتروویروسی بسیار فعال 4(HAART) میباشد که
در آن از مهارکنندههای ترانس کریپتاز معکوس 5(RTI) برای مهار معکوس فعالیت ترانس کریپتاز و جلوگیری از انتقال سلول به سلول و مهارکنندههای پروتئاز 6(PI) برای مهار تولید ویروس پیشسازهای پروتئین و جلوگیری از تولید ویریونها توسط سلولهای آلوده استفاده میشود. در این داروی ترکیبی، RTI برای کاهش نرخ عفونت سلولهای سالم از ویروسهای آزاد و PI برای کاهش رشد سلولهای ویروسی از سلولهای معیوب استفاده میشود [2].
با کنترل مؤثر تزریق دارو میتوان بهطور غیرمستقیم، غلظت سلولهای سالم در پلاسمای خون را با کاهش نرخ عفونت افزایش داد که این کار منجر به کاهش غلظت سلولهای ویروسی در پلاسمای خون میشود. در طول یک دهه اخیر، برنامههای کنترلی متعددی مبتنی بر مدل ریاضیاتی HIV با مرتبههای مختلف برای دستیابی به شیوه درمانی مؤثر مبتنی بر تزریق صحیح دارو توسعه یافته و در عموم تحقیقات انجامشده، قابلیت اندازهگیری غلظت سلولهای سالم ضروری است؛ در حالی که غلظت سلولهای معیوب و تعداد ویروسهای آزاد میتواند به شیوهای مناسب تخمین زده شود.
مدل دینامیکی عفونت HIV ماهیتی غیرخطی داشته و شامل عدم قطعیت پارامتری یا غیرپارامتری است. تکنیکهای کنترل فیدبک غیرخطی از جمله راهکارهای درمان مؤثر این عفونت بهویژه در حضور عدم قطعیتهای مدل هستند. در [3] از یک رؤیتگر مد لغزشی در تلفیق با شبکه عصبی تابع پایه شعاعی برای تخمین بخش غیرخطی دینامیک مرتبه کسری عفونت HIV استفاده شده است. شرط پایداری رؤیتگر به کمک تئوری لیاپانوف تعیین گردیده و الگوریتم ارائهشده قادر به تضمین پایداری زمان محدود است. در [4]، دینامیک HIV بهصورت معادلات دیفرانسیل مرتبه کسری توصیف شده است. تحلیل پایداری مجانبی با استفاده تکنیک لیاپانوف- کراووسکی با و بدون تأخیر متغیر با زمان انجام شده است.
در [5] با تعریف متغیر ماکرو مبتنی بر سیگنالهای خطا، قانون کنترل کمکی برای کاهش بار ویروس بهدست آمده و بهعلاوه، کنترل پسگام انتگرالی برای جبرانسازی سلولهای ویروسی نیز طراحی شده است؛ بهطوری که پایداری نمایی سیستم حلقه بسته تضمین میشود. اما مسئله قوام سیستم نسبت به عدم قطعیت یا اغتشاشات خارجی مورد بررسی
قرار نگرفته است. در [6] از ترکیب کنترل مد لغزشی و کنترلکننده PI برای تولید میزان تزریق داروی صحیح به یک مدل HIV مرتبه پنج استفاده شده است. بهرههای PI به شیوهای تطبیقی و با مقدار لحظهای سطح لغزش بهروز میشوند. قانون کنترل مد لغزشی بر اساس رویکرد تفکیکشده و برای چهار متغیر حالت نخست استخراج میگردد و برای جبرانسازی اثرات چترینگ از تکنیک لایه مرزی استفاده شده است. تضمین پایداری حلقه بسته با ترکیب دو الگوریتم کنترلی بحث نشده و رویکرد حذف چترینگ با کاهش دقت عملکردی همراه است.
در [7]، شرط قابل دسترسبودن با هدف مهار عفونت HIV به کمک الگوریتم کنترل مد لغزشی مورد بررسی قرار گرفته که این کار با یافتن شرط وجود مد لغزشی بر اساس متغیرهای حالت HIV صورت گرفته است. سپس به کمک دادههای آزمایشگاهی، پارامترهای مجهول شرط مذکور به کمک تکنیک درونیابی مکعبی تکهای خطی تخمین زده میشوند. در [8]، مدل دینامیکی HIV بهصورت یک سیستم کنترل ضربهای با تحقق شروط دسترسیپذیری و کنترلپذیری توصیف شده است. سپس از تکنیک خطیسازی ضربهای برای استخراج قانون کنترل فیدبک ضربهای، استفاده و شرایط لازم و کافی برای تضمین پایداری حلقه بسته تعیین شده است.
در [9]، یک مدل واکنش ایمنی (انتشار تأخیری ویروس) برای بررسی استفاده از کنترل لغزشی و چندپایداری در تنظیم اثر درمانی HIV پیشنهاد گردیده است. این مقاله وجود و ثبات تعادلها، انشعاب فضایی Hopf، دامنه لغزشی و دوشاخههای گره مرزی را بررسی میکند. سپس از طریق شبیهسازیها، اثرات آستانه درمانی، دامنه لغزشی و چندپایداری بر درمان HIV، ارزیابی و آستانه درمانی مناسب برای بیماران آلوده با پارامترهای فیزیولوژیکی مشخص تعیین شده است.
در [10]، مدلی ریاضی برای دینامیک و کنترل انتقال HIV ارائه گردیده که بر این اساس، رویکردی آستانهای برای کنترل سلولها و ویروسهای آلوده پیشنهاد شده است؛ بهطوری که تعداد کل سلولهای آلوده بدن از حد آستانه تحمل معینی فراتر نرود. همچنین یک استراتژی کنترل بهینه برای بهحداقلرساندن غلظت سلولها و ویروسهای آلوده
با حداقل هزینه کنترلی معرفی گردیده است. نوآوری اصلی این مقاله توسعه یک تابع کنترل تکهای خطی برای مدل HIV با انتقال سلول به سلول، تجزیه و تحلیل دینامیک حالت لغزشی و نشاندادن اثربخشی استراتژیهای کنترلی از طریق شبیهسازیهای عددی است.
عموم روشهای فیدبک غیرخطی ارائهشده به مدل ریاضیاتی HIV کاملاً وابسته هستند و نیاز به آگاهی از پارامترهای توصیفکننده مدل دارند؛ در حالی که این پارامترها از شخصی به شخص دیگر متفاوت است. بهعلاوه، مسائلی چون محدودیت سیگنال کنترلی و حداقل هزینه کنترلی بررسی نشدهاند.
یکی از تکنیکهای مورد استفاده برای جبرانسازی عفونت HIV، استفاده از تکنیک خطیسازی ورودی- خروجی برای تعیین قانون کنترل به شیوهای تحلیلی است. در عموم این رویکردها، قانون فیدبک خروجی در تلفیق با یک رؤیتگر حالت برای تخمین متغیرهای حالت غیرقابل اندازهگیری بهدست میآید. در [11] ابتدا به کمک تکنیک خطیسازی ورودی- خروجی، دینامیک اصلی به مدل فضای حالت جدید شامل عدم قطعیت تبدیل میشود. سپس یک رؤیتگر حالت مبتنی بر عملگر بسکاکو7 با هدف تخمین متغیرهای حالت غیرقابل اندازهگیری طراحی شده است. ترم عدم قطعیت به کمک تعدادی توابع پایه به فرم رگرسیون توصیف میشود که در آن ضرایب مجهول به شیوهای تطبیقی بهروز میشوند. نشان داده شده که این رؤیتگر، کرانداری نهایتاً یکنواخت را تضمین میکند. قانون کنترل به کمک تخمین ترم بردار حالت و ترم عدم قطعیت تعیین میشود.
در [12] ابتدا کنترل نامی مبتنی بر تکنیک خطیسازی فیدبک برای یک مدل مرتبه سه HIV استخراج میشود. سپس با فرض دراختیارداشتن غلظت ویروس، متغیرهای حالت به کمک یک رؤیتگر حالت غیرخطی تخمین زده میشوند و نهایتاً از یک جبرانساز اغتشاش برای مواجهه با عدم قطعیتهای پارامتری استفاده شده است. شرایط پایداری حلقه بسته به کمک نظریه اختلال تکین مورد بررسی قرار گرفته است. حساسیت
به تغییرات مدل در رویکردهای مبتنی بر خطیسازی بالاست و وابستگی به ماهیت تغییرپذیر نقاط تعادل عفونت HIV نیز چالشی مهم به شمار میآید. بهعلاوه، تضمین کرانداری سیگنال کنترلی به شیوهای تحلیلی بحث نشده است.
مهمترین و پرکاربردترین روش کنترلی برای تزریق مؤثر دارو و جبرانسازی عفونت HIV، رویکردهای مبتنی بر کنترل بهینه هستند. اساس طراحی، تعریف یک شاخص عملکرد مناسب بر مبنای اهداف عملکردی از پیش تعیینشده و کمینهسازی آن با روشی مناسب است. در [13] با هدف کمینهکردن مقادیر سلولهای معیوب و ویروسهای آزاد و حداقل هزینه کنترلی در یک بازه زمانی محدود، یک شاخص عملکرد تعریف شده است. با استخراج شرایط بهینگی، قانون کنترل به شیوهای بازگشتی و با حل دستهای از معادلات جبری تعیین میشود. رویکرد حل مسئله بهینه زمانبر بوده و با پیچیدگی زیادی همراه است. در [14] شاخص عملکردی با هدف کمینهسازی هزینه کنترل و جمعیت ویروسها، تعریف و شرایط بهینگی به کمک مقادیر مرزی استخراج شده است. سپس دینامیک بهینه به کمک تکنیک گسستهسازی بهدست آمده و جواب بهینه به کمک اصل حداقل پونتریاگین تعیین شده است. مشکل اساسی این روش، عدم ارائه روشی سامانمند برای حل مسئله بهینهسازی و پیچیدگی حل آن است.
در [15]، یک استراتژی کنترل بهینه برای مدل مرتبه کسری HIV با یک بخش درمان ارائه شده است. ابتدا شرایط لازم برای کنترل بهینه بیماری با استفاده از کنترل میزان تماس افراد مستعد و عفونی، کنترل میزان ART جمعیت بخش تحت درمان و کنترل میزان تغییرات در عادات جنسی افراد مستعد بهدست آمده است. سپس شبیهسازیهای لازم برای چهار استراتژی با استفاده از یک طرح کسری سهمرحلهای آدامز- باشفورث انجام شده است. نتایج شبیهسازیها نشان میدهند که بهترین استراتژی، استفاده از تمامی تلاشهای کنترلی بهطور همزمان است. کنترلکننده بهینه پیشنهادشده در کنترل بیماری مؤثر بوده و میتواند در مطالعات آینده به یک کنترلکننده حلقه بسته تبدیل شود تا عملکرد آن در مقابله با خطاهای مدلسازی، عدم قطعیتها و اختلالات خارجی افزایش یابد.
در [16] مدل دینامیکی HIV بهصورت یک سیستم سوئیچشده، توصیف و ثابت میشود که قانون کنترل بهینه یکتایی مبتنی بر جواب بهینه پونتریاگین وجود دارد. سپس شرایط وجود جواب بهینه بررسی گردیده و نشان داده میشود که هر جواب، معرف یک مد لغزشی است. همچنین فضای نامتغیر مثبت متناظر با جواب پونتریاگین، تعیین و در نتیجه، قانون کنترل بهینه کلیدزنی استخراج شده است. رویکرد ارائهشده با درنظرگرفتن فرضیات محدودکننده زیادی توسعه یافته و ممکن است که منجر به بروز چترینگ شود.
در [17] قانون کنترل بهینه با هدف اجتناب سلولهای معیوب از تولید ذرات ویروس با تعریف شاخص عملکرد انتگرالی بهدست آمده است. سیگنال کنترلی، ماهیتی غیرخطی با پارامترهای تصادفی دارد که متغیرهای آن به کمک الگوریتمی بازگشتی مبتنی بر ارزیابی مونتکارلو تعیین میشوند. روش ارائهشده قادر به جبرانسازی HIV در حضور عدم قطعیت پارامتری است. در [18] از شاخص عملکرد خطی مرتبه دو برای تعیین قوانین کنترل بهینه مدل مرتبه پنج HIV استفاده شده است. برای حل مسئله بهینهسازی، ابتدا دینامیک اصلی حول نقطه تعادل خطی خود خطی شده و سپس کنترل فیدبک بهینه با حل مسئله ردیابی 8LQ بهدست میآید. متغیر غیرقابل دسترس دینامیک خطیشده به کمک یک رؤیتگر حالت تخمین زده میشود. در [19] جبرانسازی دینامیک عفونت HIV به کمک کنترل فازی مبتنی بر موتور استنتاج ضرب، فازیگر تکین و فازیزدای میانگین مرکز انجام شده است. با تعریف تابع هدف مناسب، متغیرهای طراحی سیستم فازی به کمک الگوریتم رقابت امپریالیستی بهصورت بهینه تعیین میشوند. قانون کنترل نهایی معرف مجموع وزندار خروجیهای سیستم فازی است. در [20] شاخص عملکرد انتگرالی با هدف بیشینهسازی تعداد سلولهای سالم و حداقلکردن هزینه کنترلی متناظر با مقدار بهینه تزریق دارو تعریف گردیده است. شرایط بهینگی به کمک تابع همیلتونیان و اصل حداکثر، تعیین و تحلیل مسئله بهینه در حضور محدودیت حالت انجام شده است. نهایتاً قوانین کنترل بهینه با درنظرگرفتن تعدادی فرض محدودکننده استخراج شدهاند.
در [21]، یک استراتژی جدید بهینه کنترل فازی نوع 2 برای درمان ضد رتروویروسی عفونت HIV پیشنهاد شده است. سیستم کنترلی برای افزایش تعداد سلولهای سالم، کاهش تعداد سلولها و ویروسهای آلوده و درنظرگرفتن عواملی مانند هزینه دارو، عوارض جانبی و اهمیت سرعت درمان طراحی گردیده است. در این مقاله همچنین استراتژیهای کنترل مختلفی که برای سیستمهای ایمنی HIV اعمال شدهاند، از جمله کنترل پسگام، کنترل بهینه و کنترلکنندههای فازی مورد بحث قرار گرفتهاند.
در [22] ابتدا تحلیل پایداری مدل بدون درمان HIV بر اساس نقاط تعادل سیستم بررسی شده و سپس از تکنیک دوشاخهشدن و اصل حداقل پونتریاگین برای استخراج قوانین کنترلی استفاده گردیده است. این کار با بررسی شرط وجود دوشاخگی حول یک نقطه تعادل پارامتری انجام گرفته است. در [23] بر روی مسئله کنترل ردیابی بهینه مدل مرتبه شش HIV تمرکز شده و ابتدا شاخص عملکرد مناسب، تعریف و شرایط کافی برای بهینگی سیستم بررسی گردیده است. سپس با تعریف تابع لاگرانژ و شرط وجود زمان ترمینال بهینه، قانون کنترل نهایی استخراج شده است. در [24] قوانین کنترلی با معرفی یک شاخص عملکرد انتگرالی بهدست میآیند که هدف اصلی در آن، کمینهسازی تعداد سلولهای معیوب است. بهمنظور کاهش پیچیدگی ناشی از توابع وابسته به حالت، فضای حالت به نواحیای با توابع ثابت تکهای خطی متعلق به هر ناحیه پارتیشنبندی میشود. متغیر تأثیرگذار در هر ناحیه، تعداد سلولهای معیوب است. سپس شرایط بهینگی شاخص عملکرد به کمک اصل همیلتونیان، بررسی و جواب کنترلی بهینه در بازه زمانی محدود تعیین شده است.
در [25] با درنظرگرفتن مدل دینامیکی HIV بهعنوان سیستم راهانداز، یک سیستم پاسخ کنترلشونده تعریف شده و سپس با تعریف خطای همزمانسازی بین دو سیستم، قانون تطبیق پارامترهای نامعلوم بهدست آمده است. قانون کنترل به کمک تکنیک کنترل افق رو به عقب غیرخطی زمان حقیقی تعیین میشود. این کار با تعریف یک شاخص عملکرد انتگرالی و حل آن به کمک تابع همیلتونیان و استخراج شرایط بهینگی انجام میگیرد. نهایتاً از روش جاروب رو به عقب برای یافتن جواب بهینه استفاده شده است. در [26] از کنترل مدل پیشبین برای تعیین قانون کنترل بهینه عفونت HIV استفاده گردیده است. ابتدا با تعریف متغیرهای حالت، مدل بسطیافته استخراج میشود و سپس مسئله کنترل بهینه افق محدود با درنظرگرفتن محدودیت کنترلی معرفی شده است. تعیین جواب بر مبنای تکنیک وقفههای درمانی ساختاریافته صورت میگیرد که بهطور قابل توجهی موجب بهبود مصونیت نسبت به HIV میشود. مهمترین مشکل رویکردهای کنترل بهینه در ادبیات موضوع، وابستگی صریح آنها به دینامیک HIV است؛ بهطوری که وجود جواب بهینه در صورت تغییر پارامترهای توصیفکننده HIV یا بروز عدم قطعیتهای غیرساختاریافته با دشواری همراه است. بهعلاوه، رویکردی مؤثر برای درنظرگرفتن محدودیت کنترلی ارائه نشده است.
در این مقاله، الگوریتم کنترل بهینه مستقل از مدل مبتنی بر تکنیک خطیسازی دینامیکی و کنترل مد لغزشی ارائه میشود که در آن، قانون کنترل بهینه به کمک شبکه عصبی بازگشتی تصویر بهعنوان بهینهسازی عددی تعیین میگردد. این شبکهها بر اساس نظریه نامساوی تغییرات برای حل یک مسئله بهینهسازی مقید استخراج میشوند [27]. از مهمترین مسائل بهینهسازی که توسط PRNNها حل شدهاند میتوان به برنامهریزی خطی [28]، برنامهریزی مرتبه دو [29] و [30]، برنامهریزی غیرخطی [31] و [32] و بهینهسازی min-max [33] اشاره کرد. بهعلاوه، این شبکهها بهطور گستردهای در حوزه رباتیک [34] و [35] و کنترل مدل پیشبین [36] استفاده شدهاند. بدین منظور، نخست مدلهای دینامیکی خطیسازیشده محلی بر حسب مشتقات شبهجزئی بهعنوان پارامترهای طراحی تنها به کمک دادههای ورودی و خروجی معرفی میشوند و سپس با طرح شاخص عملکرد مناسب، قوانین تطبیق پارامتر بهدست میآیند. در ادامه، شاخص عملکرد کنترلی بر مبنای شروط دسترسی نمایی زمان گسسته، تعریف و به یک مسئله برنامهریزی مرتبه دو مقید تبدیل میشود. برای حل 9CQP، مدل دینامیکی و جبری 10PRNN استخراج میگردد. تحلیل پایداری حلقه بسته به کمک رویکرد مقدار تکین و با استخراج دینامیک حلقه بسته به کمک معادله خروجی بهینهساز عددی انجام میگیرد.
نوآوریهای الگوریتم پیشنهادی بهصورت زیر خلاصه میشود:
• توسعه کنترل مد لغزشی مبتنی بر خطیسازی دینامیکی محلی
• توسعه شبکه عصبی بازگشتی تصویر برای حل آنلاین برنامهریزی مرتبه دو
• تضمین پایداری حلقه بسته به کمک رویکرد مقدار تکین
• عدم وابستگی به مدل ریاضیاتی عفونت HIV
• استخراج قانون کنترل بهینه مبتنی بر دادههای ورودی- خروجی
جدول 1: مقادیر عددی پارامترهای HIV [37].
پارامتر | مقدار |
| 295 |
| 182/0 |
| 00000389/0 |
| 02/1 |
| 5890 |
| 24 |
• درنظرگرفتن حداقل هزینه کنترلی
ساختار مقاله به این شرح است که در بخش دوم، مدل تحلیلی HIV معرفی و عملکرد آن حول نقاط تعادل خود بررسی میشود. بخش سوم شامل توصیف عفونت HIV بر حسب مدلهای خطیسازی محلی، طرح مسئله کنترل مد لغزشی بهینه با تشکیل یک مسئله برنامهریزی مرتبه دو مقید و حل آن به کمک PRNN است. تحلیل پایداری حلقه بسته در بخش چهارم آمده و نتایج شبیهسازی و نتیجهگیری به ترتیب در بخشهای پنجم و ششم مطرح میشوند.
2- مدل ریاضی عفونت HIV
مدل دینامیکی درمان عفونت HIV به کمک معادلات دیفرانسیلی زیر قابل توصیف است [37]
(1)
که در آن ، و به ترتیب معرف غلظت سلولهای T سالم، غلظت سلولهای T معیوب و غلظت ذرات ویروسهای آزاد هستند. پارامتر و بهترتیب معرف نرخ تولید و نرخ مرگ طبیعی سلولهای سالم میباشند. بهعلاوه، سلولهای سالم هنگام اندرکنش با ویروسها با نرخ آلوده میشوند؛ سلولهای معیوب با نرخ میمیرند و ذرات ویروس با نرخ ایجادشده و با نرخ از بین میروند.
مقادیر نامی پارامترهای HIV در جدول 1 آمده است. این پارامترها بر اساس دادههای مربوط به آزمایشهای بالینی به شیوهای مناسب تخمین زده شدهاند.
مطابق با (1)، دو نوع متفاوت داروی ضد ویروسی برای درمان عفونت HIV شامل RTI و PI در نظر گرفته میشود. تزریق این دارو در معادلات دینامیکی با متغیرهای و بیان شده که مقادیری بین صفر و یک را اختیار میکنند. در واقع مقادیر صفر و یک به ترتیب به معنی بدون دارو و داروی کامل هستند. داروی RTI با جلوگیری از رونویسی معکوس HIV منجر به مهار ویروس در آلودهکردن سلولهای جدید میشود؛ در حالی که داروی PI با مهار آنزیمهای پروتئاز ویروسی، از قطع زنجیرههای پروتئینی که منجر به تولید ذرات ویروس غیرعفونی میشوند، ممانعت میکند.
نکته 1: از آنجا که داروی PI دینامیک ویروس را تحت تأثیر قرار میدهد، نیاز به مدل دقیقتر و کاملتری از دینامیک ذرات ویروس آزاد برای استفاده از این نوع دارو است. به همین دلیل در بسیاری از تحقیقات، تنها داروی RTI بهعنوان سیگنال کنترلی در نظر گرفته شده و از داروی PI صرف نظر میشود و به عبارت دیگر است [38]؛ در نتیجه، دینامیک عفونت HIV بهصورت زیر بازنویسی میشود
(2)
برای توسعه برنامه کنترلی، نخست لازم است که نقاط تعادل دینامیک عفونت HIV وقتی هیچ درمان دارویی وجود ندارد، تعیین شود. این کار با حل معادلات جبری در شرایط حالت دائم انجام میگیرد که در آن، نرخ تغییرات متغیرهای حالت صفر است. در این صورت (2) بهصورت زیر خلاصه میشود
(3)
که ، و به ترتیب مقدار حالت دائم غلظت سلولهای سالم، غلظت سلولهای معیوب و غلظت ذرات ویروس آزاد هستند. بهعلاوه مقدار حالت دائم سیگنال کنترلی است. با حل معادلات جبری (3)، نقاط تعادل عفونت HIV بهصورت زیر هستند
(4)
مطابق با (4)، دینامیک داخلی عفونت HIV شامل دو نقطه تعادل سالم و معیوب است. بر اساس مقادیر عددی پارامترهای HIV، نقاط تعادل برابر با و هستند. بدیهی است که هدف اصلی، هدایت متغیرهای حالت عفونت HIV به سمت نقطه تعادل سالم از هر شرایط اولیه است. این به معنی تزریق بهینه دارو به کمک یک برنامه کنترلی مناسب با هدف دستیابی به حداکثر غلظت سلولهای سالم و حداقل غلظت سلولهای معیوب و ذرات ویروس آزاد است.
نقطه تعادل معیوب به وضعیتی اطلاق میشود که در آن، ویروس HIV بهطور مداوم در جمعیت حضور دارد و بدن نمیتواند بهطور کامل
با آن مبارزه کند. این وضعیت ممکن است که به علت عدم اثربخشی درمانهای موجود، مقاومت به داروها، نقض تطابق درمانی یا دلایل دیگری باشد. نقطه تعادل معیوب میتواند انتشار بیماری را بیشتر کند و موجب افزایش میزان ابتلا به HIV در جمعیتهای مختلف شود.
رفتار حلقه باز دینامیک عفونت HIV به ازای شرایط اولیه مختلف در شکل 1 نشان داده است. با توجه به شکل، دینامیک داخلی HIV ماهیتاً تمایل به همگرایی به نقطه تعادل معیوب دارد. این نشاندهنده لزوم طراحی یک سیستم کنترلی با هدف تزریق کارآمد دارو برای هدایت متغیرهای حالت HIV به سمت نقطه تعادل سالم است.
3- کنترل مد لغزشی تطبیقی مستقل از داده
در این بخش، مراحل تعیین قانون کنترل مد لغزشی بهینه مقید بر مبنای رویکرد کنترل تطبیقی مستقل از مدل و شبکه عصبی بازگشتی تصویر ارائه میشود. الگوریتم پیشنهادی بهطور کلی از پنج بخش اساسی زیر تشکیل گردیده است:
• معرفی مدلهای داده خطیسازیشده دینامیکی
• تخمین مشتقات شبهجزئی به شیوهای بازگشتی
• تعریف شاخص عملکرد با هدف تحقق شرط دسترسی نمایی
شکل 1: همگرایی متغیرهای حالت HIV به نقطه تعادل معیوب به ازای شرایط اولیه مختلف.
• تشکیل مسئله برنامهریزی مرتبه دو مقید
• استخراج مدل دینامیکی و جبری شبکه عصبی بازگشتی تصویر
رویکرد پیشنهادی مستقل از مدل ریاضیاتی عفونت HIV بوده و تنها بر اساس دادههای ورودی و خروجی، تزریق بهینه دارو را تعیین میکند.
3-1 مدلهای داده خطیسازیشده دینامیکی
یکی از رویکردهای قدرتمند برای توسعه مدلهای مبتنی بر داده، کنترل تطبیقی مستقل از مدل است. این روش مبتنی بر استخراج مدلهای داده خطیسازی دینامیکی بر اساس نرخ تغییرات لحظهای ورودی و خروجی میباشد. پارامتر اساسی در این مدلها مفهومی به نام مشتق شبهجزئی است که تخمین صحیح آن، اهمیت بالایی در توصیف صحیح رفتار یک سیستم دینامیکی دارد.
در حالت کلی، فرض میشود که دینامیک عفونت HIV را میتوان بهصورت یک سیستم غیرخطی چندخروجی- تکورودی مجهول که وابسته به اطلاعات گذشته ورودی و خروجی است، توصیف کرد. به عبارت دیگر [39]
(5)
که در آن و بهترتیب بردار متغیرهای حالت و سیگنال کنترلی، و بهترتیب مرتبههای نامعلوم خروجی و ورودی و یک تابع غیرخطی نامعلوم است.
فرض 1: مشتق جزئی مؤلفههای بردار نسبت به متغیرهای حالت پیوسته است.
فرض 2: مدل دینامیکی (5) شرط لیپشیتز11 تعمیمیافته زیر را برای برقرار میکند
(6)
و یک ثابت مثبت است و نیز دو متغیر و معرف شبهمرتبههای سیستم هستند.
با تعریف و با فرض ، و ، دینامیک (5) را میتوان به فرم مدل دینامیکی مرتبه کامل زیر تبدیل کرد [39]
(7)
و معرف بردار شبهگرادیان است. در این مقاله فرض میشود که و است و در نتیجه، دینامیک (7) بهصورت مدل دینامیکی فرم بسته زیر خلاصه میشود
(8)
که و معرف مشتق شبهجزئی است.
بهمنظور شناسایی صحیح (8)، پارامترهای مشتقات شبهجزئی باید به کمک یک الگوریتم تخمین پارامتر مناسب بهطور لحظهای تعیین شوند. برای این منظور، شاخص عملکرد زیر را در نظر بگیرید
(9)
که معرف نرخ همگرایی است. هدف از کمینهسازی رابطه فوق، تخمین صحیح مشتق شبهجزئی بهگونهای است که دینامیک (8) رفتار دینامیک عفونت HIV را بهدرستی توصیف کند.
با فرض ، (9) را میتوان بهصورت زیر بازنویسی کرد
(10)
رابطه فوق را میتوان بهصورت زیر بسط داد
(11)
با مشتقگیری از (11) نسبت به نرخ تغییرات مشتقات شبهجزئی داریم
(12)
پس الگوریتم تخمین مشتق شبهجزئی معرف رابطه بازگشتی زیر است
(13)
که ثابتهای مثبت هستند. در ادامه، طرح مسئله کنترل مد لغزشی بهینه مقید بر اساس مدلهای خطیسازیشده دینامیکی (8) بیان میشود.
3-2 کنترل مد لغزشی بهینه مقید
کنترل مد لغزشی یکی از ابزارهای قدرتمند برای تحقق اهداف عملکردی بهویژه در حضور عدم قطعیت مدل و اغتشاشات خارجی است. هدف اصلی در این روش، هدایت متغیرهای حالت از هر شرایط اولیه به روی سطح لغزش و باقیماندن بر روی آن است. این کار با تحقق شرط دسترسی که تضمینکننده پایداری حلقه بسته نیز است صورت میگیرد. ابتدا سطوح لغزش زیر را در نظر بگیرد
(14)
که در آن معرف مؤلفههای بردار نقطه تعادل سالم است. در ادامه، شروط دسترسی نمایی زمان گسسته بهصورت زیر تعریف میشوند [40]
(15)
که در آن زمان نمونهبرداری و و پارامترهای طراحی مثبت هستند. با جایگذاری (14) در (15) میتوان نوشت
(16)
که در آن و هستند. از طرفی (16) به کمک (8) بهصورت زیر بازنویسی میشود
(17)
رابطه فوق در فرم بردار ماتریسی بهصورت زیر خلاصه میشود
(18)
که در آن
برای تحقق شرط دسترسی (18) که مبتنی بر مدل خطیسازیشده دینامیکی است، شاخص عملکرد زیر تعریف میشود
(19)
که ماتریس وزنی مثبت معین دلخواه و متغیر مؤلفه وزنی کنترلی است که نقشی اساسی در کنترل دامنه سیگنال کنترلی بر عهده دارد. با کمینهسازی رابطه فوق، دو هدف اصلی شامل برآوردهشدن شرط دسترسی و حداقل هزینه کنترلی برآورده میشود. مطابق با (8)، معادله دینامیکی خطیسازی برای هر متغیر حالت از مرتبه 1 است و بدان معناست که با محاسبه تفاضلی هر متغیر حالت برای یک گام به جلو میتوان سیگنال کنترلی را مشاهده کرد. به همین دلیل، سطوح لغزش در (14) تابعی از متغیر حالت در لحظه فعلی هستند؛ بهگونهای که با محاسبه (15) به سهولت میتوان سیگنال کنترلی را در (17) مشاهده کرد.
نکته 2: متغیر بهینهسازی در شاخص عملکرد (19)، نرخ تغییرات سیگنال کنترلی است که باید در یک فضای مقید تعیین شود. برای نیل به این هدف، اطلاعات لحظهای سطوح لغزش بهعلاوه تخمین مشتقات شبهجزئی مورد نیاز است. با بسط (19) خواهیم داشت
(20)
ترم سوم (20) وابستگی صریح به متغیر بهینهسازی ندارد و گرادیان آن نسبت به این متغیر صفر است. بهعلاوه، متناظر با تحقق شرط دسترسی، این ترم کمینه شده و در نتیجه با صرف نظر از ترم سوم (20) و تعریف متغیرهای زیر
میتوان نوشت
(21)
از طرفی با توجه به اینکه سیگنال کنترلی بین صفر و یک است، کران بالا و پایین متغیر بهینهسازی بهصورت زیر تعیین میشود
(22)
در نتیجه، شاخص عملکرد کنترلی مقید بهصورت زیر قابل بیان است
(23)
رابطه (22) برنامهریزی مرتبه دو مقید در فضای بسته است.
نکته 3: مؤلفه وزنی همواره مثبت معین و در نتیجه، متغیر بهینهسازی در (22) متعلق به فضایی محدب است. بهعلاوه، تابع که میتواند مقادیر مثبت و منفی را اختیار کند، تأثیری بر محدببودن فضای بهینهسازی ندارد و موجب آفست در جواب بهینه میشود.
باید یادآور شد که مسئله بهینه (23) همواره از ناپایداری عددی اجتناب میکند و این به دلیل ضریب وزنی است که باعث غیرصفرشدن میشود. برای تعیین جواب بهینه (23) از شبکه عصبی بازگشتی تصویر استفاده میگردد که در ادامه به آن اشاره شده است.
3-3 شبکه عصبی بازگشتی تصویر
برای حل عددی برنامهریزی مرتبه دو مقید (23) از الگوریتمهای بهینهسازی مختلفی میتوان استفاده کرد. عوامل زیادی در انتخاب یک بهینهساز عددی دخالت دارند که از جمله آنها میتوان به سرعت همگرایی بالا، قابلیت پیادهسازی زمان حقیقی و تضمین پایداری داخلی اشاره کرد. شبکه عصبی بازگشتی تصویر بهعنوان ابزاری قدرتمند برای حل کلاس وسیعی از مسائل مختلف بهینهسازی مقید در طول دو دهه اخیر شناخته شدهاند. آنها ساختار سادهای دارند، به سهولت قابل پیادهسازی هستند، عموم آنها از تضمین همگرایی برخوردار بوده و سرعت بالایی در تعیین جواب بهینه دارند. مسئله مهم دیگر اینکه برخی از انواع این شبکهها، ابزاری کنترلمحور هستند که میتوانند برای تحلیل پایداری حلقه بسته مورد استفاده قرار بگیرند. بر اساس (24)، تابع هزینه و بردار نامساوی قیود بهصورت زیر بیان میشوند
(24)
بر مبنای شرایط بهینگی 12KKT، بردار جواب بهینه (23) در فضای مقید است، اگر و فقط اگر روابط زیر برآورده شوند [41]
(25)
که معرف متغیر تصمیمگیری است و نقشی اساسی در برآوردهشدن قیود کنترلی دارد. با استفاده از (24)، (25) بهصورت زیر بازنویسی میشود
(26)
با تعریف متغیر میتوان نوشت
(27)
با توجه به نقش متغیر تصمیمگیری در فعالسازی قیود میتوان نشان داد که رابطه زیر بین جواب بهینه و متغیر برقرار است [38]
(28)
با تعریف عملگر تصویر زیر برای عددی دلخواه
(29)
رابطه (28) را میتوان بر مبنای رابطه تصویر زیر توصیف کرد
(30)
هدف عملگر تصویر یافتن برداری در فضای مقید است که نزدیکترین فاصله را با جواب بهینه داشته باشد.
لم 1: جواب بهینه مسئله CQP در (23) است اگر و فقط اگر در رابطه تصویر زیر صدق کند [41]
(31)
که در آن معرف ثابتی دلخواه است. با توجه به (27) و لم 1 میتوان نتیجه گرفت که جواب بهینه (30) نیز میباشد. حال معادله دینامیکی زیر را در نظر بگیرید
(32)
که معرف نرخ همگرایی است. چنانچه دینامیک (32) پایدار مجانبی باشد (یعنی به نقطه تعادل خود همگرا شود)، در این صورت رابطه سمت آن به مبدأ همگرا میگردد که بدان معناست که همگرایی مجانبی (32) متناظر با برقراری (31) است. به عبارت دیگر، جواب بهینه CQP با تضمین پایداری مجانبی دینامیک (32) حاصل میشود. با توجه به آنکه فرمولبندی الگوریتم پیشنهادی در فضای زمان گسسته انجام گرفته است، دینامیک (32) در فرم زمان گسسته زیر میتواند توصیف شود
(33)
که در آن است. از طرفی با استفاده از (27)، جواب بهینه کنترلی بهصورت زیر بهدست میآید
(34)
در نتیجه، مدل دینامیکی و جبری شبکه عصبی بازگشتی تصویر بهصورت زیر قابل بیان است
(35)
نکته 4: دلیل اصلی نامگذاری معادلات فوق به PRNN این است که ایده اصلی توسعه آنها برگرفته از شبکه عصبی هوپفیلد میباشد که در آن، یک تابع هزینه مقید یا غیرمقید را میتوان در قالب تابع انرژی هوپفیلد نوشت. در نتیجه، همواره یک شبکه هوپفیلد وجود دارد که نقاط تعادل آن نشاندهنده جوابهای مسئله بهینهسازی مقید یا غیرمقید است. ساختار شبکههای PRNN نیز بهگونهای است که همگرایی به نقاط تعادل آنها متناظر با یافتن جواب بهینه مسئله بهینهسازی اولیه است. همچنین باید یادآور شد عملگر تصویر، نقش تابع فعالسازی را بر عهده داشته و متغیر حالت شبکه معرف متغیر تصمیمگیری برای برآوردهکردن قیود است.
لم 1: فرض کنید معرف عملگر تصویر در (31) باشد. در این صورت برای متغیر دلخواه ، رابطه زیر بین جواب بهینه و متغیر تصمیمگیری بهینه برقرار است [42]
(36)
لم 2: اگر یک مجموعه محدب بسته باشد، نامساوی زیر برای دو متغیر دلخواه برقرار است [42]
(37)
قضیه 1: مدل دینامیکی PRNN در (35) همگرای مجانبی به نقطه تعادل خود است اگر شرط زیر بین نرخ همگرایی شبکه عصبی و مؤلفه وزنی CQP برقرار شود
اثبات: با توجه به اینکه پایدار مجانبی PRNN به معنی همگرایی دینامیک آن به نقطه تعادل خود است، تابع لیاپانوف زیر را در نظر بگیرید
(38)
نرخ تغییرات تابع فوق برابر است با
(39)
با جایگذاری (35) در (38) داریم
(40)
با سادهسازی رابطه فوق میتوان نوشت
(41)
ابتدا با تعریف متغیرهای و ، (37) بهصورت زیر بازنویسی میشود
(42)
به کمک (36) میتوان نتیجه گرفت
(43)
رابطه فوق را بهصورت زیر در نظر بگیرید
(44)
رابطه (44) بهصورت زیر بسط مییابد
(45)
بر اساس (34) میتوان رابطه زیر را نتیجه گرفت
(46)
به کمک (46)، (45) را میتوان بهصورت زیر خلاصه کرد
(47)
با کمی تغییرات در (47) میتوان نوشت
(48)
چنانچه رابطه زیر برقرار شود
(49)
تساوی زیر را میتوان نتیجه گرفت
(50)
و به این معناست که ؛ بنابراین PRNN با برقراری شرط (49) همگرای مجانبی به نقطه تعادل خود است. رابطه (49) نشان میدهد که با انتخاب مقادیر نسبتاً کوچک برای نرخ همگرایی PRNN میتوان همگرایی مجانبی آن را تضمین کرد. بهعلاوه باید یادآور شد که متناظر با همگرایی متغیر حالت شبکه عصبی به نقطه تعادل خود، خروجی معادله جبری آن یعنی نرخ تغییرات سیگنال کنترلی نیز به مقدار بهینه خود متمایل میشود. در ادامه، شرایط پایداری حلقه بسته الگوریتم کنترلی پیشنهادی به کمک رویکرد مقدار تکین برای یک سیستم دینامیکی زمان- گسسته مورد بررسی قرار میگیرد.
قضیه 2: دینامیک عفونت HIV در قالب یک سیستم حلقه بسته با مدل دینامیکی فرم بسته (8) و معادلات دینامیکی و جبری PRNN در (35) پایدار داخلی است اگر و فقط اگر شرط زیر بین پارامترهای طراحی برقرار شود
اثبات: با درنظرگرفتن ، دینامیک حلقه بسته عفونت HIV با تلفیق مدلهای دینامیکی خطیسازی به فرم بسته (8) و معادله جبری PRNN در (35) بهصورت زیر بهدست میآید
(51)
که است. با استفاده از در (20) میتوان نوشت
(52)
با توجه به (14) میتوان نوشت
(53)
که بردار نقطه تعادل سالم است؛ بنابراین دینامیک داخلی حلقه بسته پایدار مجانبی است اگر قدر مطلق مقادیر ویژه ماتریس حلقه بسته زیر کمتر از یک شوند
(54)
که معرف بزرگترین مقدار ویژه یک ماتریس و معرف ماتریس واحد است.
نکته 3: علاوه بر دینامیک داخلی (53)، سه ترم دیگر نیز وجود دارند که باید بررسی شوند. از آنجا که همگرایی مجانبی PRNN ثابت شده است، ترم وابسته به متغیر حالت PRNN بهطور مجانبی پایدار است. ترم وابسته به بردار نقطه تعادل سالم در شرایط حالت دائم مورد بررسی قرار میگیرد و نهایتاً از ترم وابسته عملگر کلیدزنی برای بهبود قوام حلقه بسته استفاده میشود.
برای یک ماتریس دلخواه ، رابطه زیر بین بزرگترین مقدار ویژه آن ، کوچکترین مقدار تکین آن و بزرگترین مقدار تکین آن برقرار است [43]
(55)
بنابراین (54) بهصورت زیر بازنویسی میشود
(56)
به کمک رابطه زیر
(57)
میتوان نوشت
(58)
با تعریف ماتریس ، (56) بهصورت زیر ساده میشود
(59)
رابطه زیر برای یک ماتریس دلخواه برقرار است [44]
شکل 2: بلوک دیاگرام کنترل مد لغزشی مستخرج از داده مبتنی بر شبکه عصبی بازگشتی تصویر.
(60)
بنابراین خواهیم داشت
(61)
با توجه به رابطه زیر برای دو ماتریس دلخواه و
(62)
رابطه (61) بهصورت زیر قابل بیان است
(63)
به کمک رابطه زیر برای دو ماتریس دلخواه و
(64)
رابطه (61) بهصورت زیر بازنویسی میشود
(65)
بر اساس ارتباط بین (61) و (65) میتوان نتیجهگیری کرد که
(66)
با جایگذاری در (66) و درنظرگرفتن و خواهیم داشت
(67)
که در آن یک متغیر اسکالر مثبت است. رابطه فوق نشان میدهد که پارامترهای طراحی برای تضمین پایداری داخلی، وابسته به مقدار لحظهای بردار مشتقات شبهجزئی وابسته هستند. بهعلاوه چنانچه به اندازه کافی کوچک انتخاب شود، میتوان نتیجه گرفت شرط پایداری حلقه بسته آن است که انتخاب شود. به عبارت دیگر، مؤلفه وزنی شاخص عملکرد نقش چندانی در تضمین پایداری داخلی عفونت HIV بر اساس مدلهای دینامیکی خطیسازی فرم بسته ندارد. همان طور که از معادله حلقه بسته (53) میتوان دریافت، ترم کلیدزنی با هدف مواجهه با اثرات عدم قطعیت در نظر گرفته شده و بر این اساس، اگر فرض شود که عدم قطعیت مدل با بردار توصیف گردد، در این صورت میتوان رابطه زیر را برای جبرانسازی اثرات عدم قطعیت در نظر گرفت
(68)
با فرض معلومبودن کران بالای مؤلفههای عدم قطعیت مدل داریم
(69)
که در آن و کران بالای عدم قطعیت است. با فرض همگرایی مجانبی متغیر حالت شبکه عصبی، معادله حلقه بسته (53) در شرایط حالت دائم بهصورت زیر بیان میشود
(70)
رابطه فوق نشان میدهد که الگوریتم پیشنهادی بدون هیچ شرایط خاصی روی پارامترهای طراحی، قادر به حذف خطای حالت و همگرایی متغیرهای حالت به نقطه تعادل سالم میشود.
در الگوریتم پیشنهادی، تعیین پارامترهای کنترلی با تحقق شرط پایداری داخلی سیستم حلقه بسته یعنی (54) انجام میشود و بدان معناست که نیازی به اثبات پایداری حلقه بسته به شیوه دیگر (مثلاً تعریف تابع لیاپانوف جدید) نیست. همگرایی مجانبی شبکه عصبی نیز بهعنوان یکی از اجزای اصلی سیستم کنترلی اثبات گردید.
بلوک دیاگرام الگوریتم کنترلی پیشنهادی در شکل 2 آمده که در آن، بلوک مدلهای دینامیکی خطیسازی فرم بسته، نقش تعیین بردار مشتقات شبهجزئی را بر عهده دارند. به کمک سطح لغزش، تخمین لحظهای مشتقات شبهجزئی و تنظیم صحیح پارامترهای طراحی، قانون کنترل بهینه مقید بر اساس معادلات دینامیکی و جبری PRNN تعیین میشود.
4- نتایج شبیهسازی
در این بخش، عملکرد الگوریتم پیشنهادی در هدایت متغیرهای حالت دینامیک HIV به سمت نقطه تعادل سالم از دیدگاههایی چون رفتار گذرا و حالت دائم، دامنه تغییرات سیگنال کنترلی و مواجهه با اثرات عدم قطعیت مورد ارزیابی قرار میگیرد. همان طور که از تحلیل رفتار حلقه باز سیستم میتوان دریافت در شرایط ورودی صفر، متغیرهای حالت تمایل
به همگرایی به نقطه تعادل عفونت دارند و در نتیجه فرض میگردد
که مقادیر حالت دائم دینامیک HIV در شرایط ورودی صفر بهعنوان شرایط اولیه در برنامه کنترلی حلقه بسته هستند. در ابتدا عملکرد نامی مورد بررسی قرار میگیرد و پارامترهای طراحی برای جبرانسازی عفونت HIV در شرایط نامی بهصورت زیر انتخاب شدهاند
همان طور که از شکل 3 میتوان دریافت، پاسخهای حلقه بسته بهطور مجانبی به سمت نقطه تعادل سالم هدایت شدهاند. غلظت سلولهای سالم بعد از گذشت حدود 25 روز به بیشینه مقدار خود همگرا شده است؛ در حالی که دو متغیر دیگر یعنی غلظت سلولهای معیوب و ذرات ویروس
شکل 3: پاسخ حلقه بسته عفونت HIV در شرایط نامی.
شکل 4: میزان تزریق بهینه دارو در شرایط نامی.
شکل 5: کران بالای نرخ همگرایی PRNN.
آزاد کمتر از 10 روز به کمینه مقدار خود همگرا شدهاند. در واقع، زمان نشست غلظت سلولهای سالم بهمراتب بیشتر از دو متغیر دیگر میباشد و بیانگر این است که دینامیک HIV ماهیتاً دارای دو دینامیک کند و سریع است. از طرفی، فراجهش یا فروجهش نامطلوبی در پاسخهای مورد نظر دیده نمیشود و دقت عملکرد الگوریتم کنترلی در شرایط حالت دائم مطلوب است.
با توجه به شکل 4، سیگنال کنترلی یعنی میزان تزریق مؤثر دارو
با گذشت زمان از مقدار اولیه صفر به مقدار حالت دائم حدود 45/0
شکل 6: تغییر مشتقات شبهجزئی در برنامه کنترلی پیشنهادی.
شکل 7: تخمین متغیرهای حالت دینامیک HIV به کمک مدلهای دینامیکی خطیسازی محلی.
میل نموده است. این نشان میدهد که الگوریتم کنترلی قادر به تعیین مقدار بهینه کنترلی با وجود محدودیت از پیش تعیینشده است. از طرفی متغیر حالت شبکه عصبی PRNN در این شکل بهطور مجانبی به مقدار صفر همگرا شده که دلالت بر پایداری بهینهساز عددی توسعهیافته در
این مقاله دارد. با توجه به قضیه 1، شرط پایداری PRNN تحقق رابطه است. شکل 5 معرف کران بالای نرخ همگرایی PRNN است که نشان میدهد این پارامتر باید مقادیری کمتر از 2 را اختیار کند. یکی از مهمترین پارامترهای الگوریتم کنترلی پیشنهادی، مشتقات شبهجزئی بهعنوان متغیرهای وابسته به زمان هستند. الگوریتم کنترلی تنها به کمک این پارامترهای تطبیقی و بدون نیاز به معادلات ریاضی عفونت HIV قادر به تحقق اهداف عملکردی است.
تغییرات مشتقات شبه جزئی در شکل 6 با شرایط اولیه مشاهده میشود که وابسته به تغییرات متغیرهای حالت دینامیک HIV به مقادیر حالت دائم مختلف همگرا شدهاند.
نحوه تغییرات این پارامترهای طراحی باید بهگونهای باشد که مدلهای دینامیکی خطیسازیشده محلی بتوانند رفتار دینامیک سیستم را بهدرستی دنبال نمایند. برای بررسی این مسئله، تخمین متغیرهای حالت دینامیک HIV را بر اساس (8) بهصورت زیر در نظر بگیرید
(71)
شکل 7 نشان میدهد که مدلهای دینامیکی خطیسازی محلی با دقت
شکل 8: کران بالای ضرایب وزنی شروط دسترسی.
شکل 9: تابع هزینه معرف مسئله برنامهریزی مرتبه دو مقید (23).
عملکرد خوبی قادر به ردیابی رفتار متغیرهای حالت دینامیک HIV هستند. این مسئله از اهمیت بالایی در طراحی قوانین کنترل مستخرج از داده برخوردار است؛ زیرا عملکرد سیستم کنترلی کاملاً وابسته به دقت عملکرد حلقه تخمین مشتقات شبهجزئی و توصیف صحیح دینامیک HIV بر اساس مدلهای دینامیکی خطیسازی محلی است.
مسئله مهم دیگری که در این بخش باید به آن اشاره شود، تضمین پایداری حلقه بسته با توجه به شرط (67) است. پارامترهای تأثیرگذار در تضمین پایداری، ضرایب وزنی سطوح لغزش در شرط لغزشی نمایی زمان گسسته هستند و کران بالای این پارامترها وابسته به مقدار لحظهای مشتقات شبهجزئی است. شکل 8 نشان میدهد که تغییرات کران بالای ، مقادیر بسیار بزرگی اختیار کرده و لذا محدودیتی برای این پارامترهای طراحی وجود ندارد. دلیل اصلی این دامنه تغییرات بزرگ آن است که مقادیر لحظهای مشتقات شبهجزئی به هم نزدیک بوده و این باعث میشود که کوچکترین مقدار تکین ماتریس خیلی نزدیک به صفر گردد؛ لذا کران بالای ضرایب وزنی شروط دسترسی خیلی بزرگ میشوند. این نشان میدهد چنانچه مقدار اولیه مشتقات جزئی برابر یا نزدیک به هم انتخاب شوند، پایداری حلقه بسته به سهولت تضمین میشود. بهعلاوه، شکل 9 همگرایی تابع هزینه ارائهشده در (23) به مبدأ را نشان میدهد و این بیانگر کیفیت عملکرد بالای الگوریتم پیشنهادی در کمینهسازی مسئله برنامهریزی مرتبه دو مقید است.
شکل 10: پاسخ غلظت سلولهای سالم در الگوریتم پیشنهادی و روش ASMC [45] در حضور عدم قطعیت.
شکل 11: پاسخ غلظت سلولهای معیوب در الگوریتم پیشنهادی و روش ASMC [45] در حضور عدم قطعیت.
در ادامه این بخش، مسئله قوام حلقه بسته با درنظرگرفتن عدم قطعیت پارامتری در متغیر مورد ارزیابی قرار میگیرد. بر این اساس، فرض میشود که این متغیر از روز پنجاهم به بعد به مقدار 000035/0 کاهش مییابد. بهعلاوه، نتایج شبیهسازی برای اعتبارسنجی بهتر الگوریتم پیشنهادی با کنترل مد لغزشی تطبیقی (ASMC) ارائهشده در [45] مقایسه میگردد. همان طور که در شکل 10 مشاهده میشود با بروز عدم قطعیت، غلظت سلولهای سالم با فروجهشی گذرا همراه میگردد و بعد از حدود 20 روز دوباره به بیشینه مقدار خود همگرا میشود. این نشان میدهد که الگوریتم پیشنهادی بهخوبی قادر به حفظ عملکرد کنترلی در حضور عدم قطعیت است و میتواند در مدت زمان نسبتاً مطلوبی، اثرات عدم قطعیت را جبران کند. از طرفی رفتار این متغیر برای ASMC با افت عملکرد شدیدی در هنگام بروز عدم قطعیت همراه است. پاسخ گذرای
هر دو الگوریتم کنترلی تا حد زیادی با یکدیگر مشابه میباشد. با وجود تغییرات شدید متغیر مذکور، سرعت جبرانسازی روش ASMC تا حدی بیشتر از الگوریتم پیشنهادی است.
نتایج مشابهی در مورد غلظت سلولهای معیوب در شکل 11 و مقدار ویروسهای آزاد در شکل 12 برای الگوریتم پیشنهادی در قیاس با روش ASMC مشاهده میشود. میتوان دریافت که در هر دو مورد، الگوریتم پیشنهادی از سرعت پاسخ گذراي بهتري برخوردار است.
شکل 12: پاسخ ذرات ویروسهای آزاد در الگوریتم پیشنهادی و روش ASMC [45] در حضور عدم قطعیت.
جدول 2: مقایسه کمی روش پیشنهادی و الگوریتم ASMC [45].
ویژگی | روش پیشنهادی | الگوریتم ASMC [45] |
زمان نشست | 10 روز | 30 روز |
فراجهش بعد از بروز عدم قطعیت | %13 | %36 |
زمان جبرانسازی عدم قطعیت | 25 روز برای متغیر نخست | 15 روز برای متغیر نخست |
15 روز برای متغیر دوم | 15 روز برای متغیر دوم | |
12 روز برای متغیر سوم | 15 روز برای متغیر سوم | |
چترینگ در خروجی ناشی از عدم قطعیت | ندارد | دارد |
اشباع سیگنال کنترلی | ندارد | دارد |
چترینگ در سیگنال کنترلی | ندارد | دارد |
دامنه تغییرات متغیرهای مذکور در روش ASMC خیلی شدیدتر از الگوریتم پیشنهادی است. سرعت جبرانسازی الگوریتم پیشنهادی برای دفع اثرات عدم قطعیت حدود 10 روز است که تقریباً مشابه با روش ASMC میباشد. دامنه تغییرات سیگنال کنترلی در شکل 13 بیانگر این مطلب است که الگوریتم پیشنهادی به دلیل تعیین قوانین کنترلی با کمینهسازی یک شاخص عملکرد بهینه مقید، حتی در حضور عدم قطعیت نیز مقادیر بین صفر و یک را اختیار کرده است. بهعلاوه، سیگنال مذکور از یکنواختی مطلوبی برخوردار بوده و از نواحی بحرانی اجتناب کرده است.
در حالی که سیگنال کنترلی در روش ASMC با بروز عدم قطعیت به مقادیر نزدیک یک نزدیک شده و با تغییرات شدیدی همراه است. بنابراین رویکرد پیشنهادی بهمراتب کیفیت عملکرد بالاتری در تضمین قوام حلقه بسته دارد و علاوه بر عدم وابستگی به معادلات ریاضی دینامیک HIV، قادر به تعیین مقدار بهینه قانون کنترلی با وجود محدودیت از پیش تعیینشده است. مقایسه کمی بین الگوریتم کنترلی پیشنهادی و روش کنترلی پیشنهادشده در [45] در جدول 2 آمده است.
در این بخش و بهطور خلاصه، عملکرد الگوریتم پیشنهادی با ارائه نتایج شبیهسازی مرتبط با اجزای مختلف سیستم حلقه بسته، ارزیابی شد. همگرایی به نقطه تعادل سالم هم در شرایط نامی و هم در حضور عدم قطعیت انجام گردید. بهعلاوه، سیگنال کنترلی در شرایط مختلف بدون چترینگ بوده و دچار اشباع نمیشود. الگوریتم تخمین مشتقات شبهجزئی با دقت مطلوبی قادر به تخمین مؤلفههای مشتق شبهجزئی است.
شکل 13: سیگنال کنترلی در الگوریتم پیشنهادی و روش ASMC [45] در حضور عدم قطعیت.
روش پیشنهادی قادر به دفع اثر اغتشاش در بازه زمانی مناسب بوده و اثرات چترینگ در خروجی مدل وجود ندارد. نتایج شبیهسازی از دیدگاه زمان نشست، چترینگ خروجیهای مدل، فراجهش، زمان جبرانسازی اثر عدم قطعیت، اشباع و چترینگ سیگنال کنترلی دلالت بر کیفیت بالای الگوریتم پیشنهادی در مقایسه با رویکرد ارائهشده در [45] دارد.
5- نتیجهگیری
در این مقاله، الگوریتم کنترل مستخرج از داده با ترکیب کنترل مد لغزشی بهینه مقید و شبکه عصبی بازگشتی تصویر برای جبرانسازی عفونت HIV توسعه یافت. به کمک مدلهای دینامیکی خطیسازی محلی که وابسته به تخمین لحظهای مشتقات شبهجزئی است، نیازی به آگاهی از معادلات ریاضی دینامیک HIV نیست و تنها به کمک دادههای ورودی و خروجی میتوان اهداف کنترلی را تحقق بخشید. بهمنظور تعیین میزان تزریق دارو در محدوده صفر و یک، مسئله برنامهریزی مرتبه دو مقید بر اساس مدلهای دینامیکی خطیسازی محلی تشکیل شد؛ بهطوری که سیگنال کنترلی بهینه با کمینهسازی آن بهدست میآید. از طرفی، شاخص عملکرد بر اساس برآوردهشدن شروط دسترسی نمایی زمان گسسته تعریف شد تا بتوان قوام حلقه بسته را بهبود بخشید. شبکه عصبی بازگشتی تصویر، نقش بهینهساز عددی را برای تعیین قانون کنترل بهینه مقید بر عهده داشت. نتایج شبیهسازی نشان دادند که الگوریتم پیشنهادی در شرایط نامی قادر به هدایت متغیرهای حالت HIV به نقطه تعادل سالم با سرعت گذرا و دقت حالت دائم مطلوب است. الگوریتم پیشنهادی از سرعت همگرایی بالا، ساختار ساده و کیفیت بالایی در تحقق اهداف عملکردی برخوردار است. روش پیشنهادی در قیاس با الگوریتم کنترل مد لغزشی تطبیقی، عملکرد حلقه بسته خیلی بهتری را در حضور عدم قطعیت پارامتری دارد. بهعلاوه، دامنه سیگنال کنترلی در روش پیشنهادی با یکنواختی مطلوبی همراه بوده، همواره در محدوده صفر و یک میباشد و از نواحی بحرانی اجتناب کرده است.
مراجع
[1] R. V. Culshaw, S. Ruan, and R. J. Spiteri, "Optimal HIV treatment by maximising immune response," J. of Mathematical Biology,
vol. 48, no. 5, pp. 545-562, 2004.
[2] D. Y. Lu, H. Y. Wu, N. S. Yarla, B. Xu, J. Ding, and T. R. Lu, "HAART in HIV/AIDS treatments: future trends," Infectious Disorders-Drug Targets, vol. 18, no. 1, pp. 15-22, 2018.
[3] A. Sharafian, A. Sharifi, and W. Zhang, "Fractional sliding mode based on RBF neural network observer: application to HIV infection mathematical model," Computers & Mathematics with Applications, vol. 79, no. 11, pp. 3179-3188, 1 Jun. 2020.
[4] Z. Zhang, J. Zhang, F. Cheng, and F. Liu, "A novel stability criteria of a class nonlinear fractional-order HIV-1 system with multiple delay," International J. of Control, Automation and Systems, vol. 17, no. 9, pp. 2274-2283, Sept. 2019.
[5] R. S. Butt, I. Ahmad, R. Iftikhar, and M. Arsalan, "Integral backstepping and synergetic control for tracking of infected cells during early antiretroviral therapy," IEEE Access, vol. 7, pp. 69447-69455, 2019.
[6] H. Jahanshahi, "Smooth control of HIV/AIDS infection using a robust adaptive scheme with decoupled sliding mode supervision," The European Physical J. Special Topics, vol. 227, no. 7, pp. 707-718, 2018.
[7] A. J. Anelone and S. K. Spurgeon, "Prediction of the containment of HIV infection by antiretroviral therapy-a variable structure control approach," IET Systems Biology, vol. 11, no. 1, pp. 44-53, Feb. 2017.
[8] P. S. Rivadeneira and C. H. Moog, "Impulsive control of single-input nonlinear systems with application to HIV dynamics," Applied Mathematics and Computation, vol. 218, no. 17, pp. 8462-8474, 1 May 2012.
[9] Y. Pei, N. Shen, J. Zhao, Y. Yu, and Y. Chen, "Analysis and simulation of a delayed HIV model with reaction-diffusion and sliding control," Mathematics and Computers in Simulation, vol. 212, pp. 382-405, Oct. 2023.
[10] D. Shi, S. Ma, and Q. Zhang, "Sliding mode dynamics and optimal control for HIV model," Mathematical Biosciences and Engineering, vol. 20, no. 4, pp. 7273-7297, 13 Feb. 2023.
[11] A. Izadbakhsh, A. A. Kalat, and S. Khorashadizadeh, "Observer-based adaptive control for HIV infection therapy using the Baskakov operator," Biomedical Signal Processing and Control, vol. 65, Article ID: 102343, Mar. 2021.
[12] N. H. Jo, "Robust drug treatment for HIV-1 infection model with completely unknown parameters," International J. of Control, Automation and Systems, vol. 17, no. 12, pp. 3113-3121, Dec. 2019.
[13] Y. Ding, Z. Wang, and H. Ye, "Optimal control of a fractional-order HIV-immune system with memory," IEEE Trans. on Control Systems Technology, vol. 20, no. 3, pp. 763-769, May 2011.
[14] H. D. Kwon, J. Lee, and S. D. Yang, "Optimal control of an age-structured model of HIV infection," Applied Mathematics and Computation, vol. 219, no. 5, pp. 2766-2779, Nov. 2012.
[15] H. Wang, et al., "A Caputo-Fabrizio fractional-order model of HIV/AIDS with a treatment compartment: sensitivity analysis and optimal control strategies," Entropy, vol. 23, no. 5, Article ID: e23050610, 2021.
[16] E. A. Hernandez-Vargas, P. Colaneri, and R. H. Middleton, "Optimal therapy scheduling for a simplified HIV infection model," Automatica, vol. 49, no. 9, pp. 2874-2880, Sept. 2013.
[17] A. E. Abharian, S. Z. Sarabi, and M. Yomi, "Optimal sigmoid nonlinear stochastic control of HIV-1 infection based on bacteria foraging optimization method," Biomedical Signal Processing and Control, vol. 10, pp. 184-191, Mar. 2014.
[18] P. Di Giamberardino and D. Iacoviello, "LQ control design for the containment of the HIV/AIDS diffusion," Control Engineering Practice, vol. 77, pp. 162-173, Aug. 2018.
[19] N. A. Reisi, S. H. Lakmesari, M. J. Mahmoodabadi, and S. Hadipour, "Optimum fuzzy control of human immunodeficiency virus type1 using an imperialist competitive algorithm," Informatics in Medicine Unlocked, vol. 16, Article ID: 100241, 2019.
[20] M. H. A. Biswas, M. M. Haque, and U. K. Mallick, "Optimal control strategy for the immunotherapeutic treatment of HIV infection with state constraint," Optimal Control Applications and Methods, vol. 40, no. 4, pp. 807-818, Jul./Aug. 2019.
[21] S. B. Chen, et al., "Antiretroviral therapy of HIV infection using a novel optimal type-2 fuzzy control strategy," Alexandria Engineering J., vol. 60, no. 1, pp. 1545-1555, Feb. 2021.
[22] E. Shamsara, Z. Afsharnezhad, and S. Effati, "Optimal drug control in a four‐dimensional HIV infection model," Optimal Control Applications and Methods, vol. 41, no. 2, pp. 469-486, Mar./
Apr. 2020.
[23] T. Jang, H. D. Kwon, and J. Lee, "Free terminal time optimal control problem of an HIV model based on a conjugate gradient method," Bulletin of Mathematical Biology, vol. 73, no. 10, pp. 2408-2429, Oct. 2011.
[24] P. Di Giamberardino and D. Iacoviello, "HIV infection control: a constructive algorithm for a state-based switching control," International J. of Control, Automation and Systems, vol. 16, no. 3, pp. 1469-1473, Jun. 2018.
[25] F. Sun and K. Turkoglu, "Estimation of CD4+T cell count parameters in HIV/AIDS patients based on real-time nonlinear receding horizon control," International J. of Control, Automation and Systems, vol. 16, no. 4, pp. 1805-1813, Aug. 2018.
[26] G. Pannocchia, M. Laurino, and A. Landi, "A model predictive control strategy toward optimal structured treatment interruptions in anti-HIV therapy," IEEE Trans. on Biomedical Engineering, vol. 57, no. 5, pp. 1040-1050, May 2010.
[27] D. Kinderlehrer and G. Stampacchia, An Introduction to Variational Inequalities and Their Applications, Society for Industrial and Applied Mathematics, 2000.
[28] Q. Liu and J. Wang, "A one-layer recurrent neural network with a discontinuous activation function for linear programming," Neural Computation, vol. 20, no. 5, pp. 1366-1383, May 2008.
[29] Y. Xia and J. Wang, "A bi-projection neural network for solving constrained quadratic optimization problems," IEEE Trans. on Neural Networks and Learning Systems, vol. 27, no. 2, pp. 214-224, Feb. 2015.
[30] A. Golbabai and S. Ezazipour, "A projection-based recurrent neural network and its application in solving convex quadratic bilevel optimization problems," Neural Computing and Applications, vol. 32, no. 8, pp. 3887-3900, Apr. 2020.
[31] Y. Xia, J. Wang, and W. Guo, "Two projection neural networks with reduced model complexity for nonlinear programming," IEEE Trans. on Neural Networks and Learning Systems, vol. 31, no. 6, pp. 2020-2029, Jun. 2019.
[32] Y. Yang and X. Xu, "The projection neural network for solving convex nonlinear programming," in Proc. Int. Conf. on Intelligent Computing, Springer, pp. 174-181, Qingdao, China, 21-24
Aug. 2007.
[33] Q. Liu and J. Wang, "A projection neural network for constrained quadratic minimax optimization," IEEE Trans. on Neural Networks and Learning Systems, vol. 26, no. 11, pp. 2891-2900, Nov. 2015.
[34] Y. Zhang, S. Chen, S. Li, and Z. Zhang, "Adaptive projection neural network for kinematic control of redundant manipulators with unknown physical parameters," IEEE Trans. on Industrial Electronics, vol. 65, no. 6, pp. 4909-4920, Jun. 2017.
[35] M. Yang, Y. Zhang, and H. Hu, "Posture coordination control
of two-manipulator system using projection neural network," Neurocomputing, vol. 427, pp. 179-190, Feb. 2021.
[36] Z. Li, H. Xiao, C. Yang, and Y. Zhao, "Model predictive control
of nonholonomic chained systems using general projection neural networks optimization," IEEE Trans. on Systems, Man, and Cybernetics: Systems, vol. 45, no. 10, pp. 1313-1321, Oct. 2015.
[37] N. H. Jo and Y. Roh, "A two-loop robust controller for HIV infection models in the presence of parameter uncertainties," Biomedical Signal Processing and Control, vol. 18, pp. 245-253, Apr. 2015.
[38] H. Shim, N. H. Jo, H. Chang, and J. H. Seo, "A system theoretic study on a treatment of AIDS patient by achieving long-term non-progressor," Automatica, vol. 45, no. 3, pp. 611-622, Mar. 2009.
[39] Z. Hou and S. Xiong, "On model-free adaptive control and its stability analysis," IEEE Trans. on Automatic Control, vol. 64,
no. 11, pp. 4555-4569, Nov. 2019.
[40] H. Du, X. Yu, M. Z. Chen, and S. Li, "Chattering-free discrete-time sliding mode control," Automatica, vol. 68, pp. 87-91, Jun. 2016.
[41] Y. Xia and J. Wang, "A general methodology for designing globally convergent optimization neural networks," IEEE Trans. on Neural Networks, vol. 9, no. 6, pp. 1331-1343, Nov. 1998.
[42] S. Liu and J. Wang, "A simplified dual neural network for quadratic programming with its KWTA application," IEEE Trans. on Neural Networks, vol. 17, no. 6, pp. 1500-1510, Nov. 2006.
[43] S. Skogestad and I. Postlethwaite, Multivariable Feedback Control: Analysis and Design, New York: Wiley, vol. 2, 2007.
[44] C. D. Meyer, Matrix Analysis and Applied Linear Algebra, vol. 71, SIAM, 2000.
[45] M. J. Mahmoodabadi and S. H. Lakmesari, "Adaptive sliding mode control of HIV-1 infection model," Informatics in Medicine Unlocked, vol. 25, Article ID: 100703, 2021.
اشکان ضرغامی تحصيلات خود را در مقاطع كارشناسي مهندسی برق-قدرت و كارشناسي ارشد مهندسی برق– کنترل بهترتيب در سالهاي 1392 و 1395 از دانشگاه آزاد اسلامی واحد ساوه به پايان رسانده است و هم اكنون دانشجوی دکتری مهندسی برق– کنترل دانشگاه آزاد اسلامی واحد تهران مرکزی می باشد. زمينههاي تحقيقاتي مورد علاقه ايشان عبارتند از: کنترل سیستمهای غیرخطی، شبکههای هوشمند و مدلسازی سیستمها.
مهدی سیاهی در سال 1380 مدرك كارشناسي مهندسي برق– الکترونیک را از دانشگاه یزد و در سال 1382 مدرك كارشناسي ارشد مهندسي برق– کنترل را از دانشگاه صنعتی شاهرود دريافت نمود. پس از آن به دوره دكتراي مهندسي برق– کنترل در دانشگاه صنعتی شاهرود وارد گرديد و در سال 1387 موفق به اخذ درجه دكترا در مهندسي برق– کنترل از دانشگاه مذكور گرديد. دكتر سیاهی از سال 1383 تا کنون در دانشگاه آزاد اسلامی مشغول به فعالیت بوده و در حال حاضر عضو هيأت علمي دانشكده مهندسی مکانیک، برق و کامپیوتر واحد علوم و تحقیقات تهران ميباشد. زمينههاي علمي مورد علاقه نامبرده شامل موضوعاتي مانند سیستم های کنترل تحمل پذیر عیب، تشخیص و شناسایی خطا، مدلسازی سیستمهای بیولوژیکی، رباتيك و ... ميباشد.
فریدون نوشیروان راحت آباد به ترتیب در سالهای 1381 و 1383 مدرك كارشناسي و کارشناسی ارشد مهندسي برق گرایش مهندسی پزشکی را از دانشگاه آزاد اسلامی واحد علوم و تحقیقات دريافت نمود. پس از آن به دوره دكتراي مهندسي پزشکی– بیوالکتریک در دانشگاه آزاد اسلامی واحد علوم و تحقیقات وارد گرديد و در سال 1391 موفق به اخذ درجه دكترا در مهندسي پزشکی– بیوالکتریک از دانشگاه مذكور گرديد. دكتر نوشیروان از سال 1385 تا کنون در دانشگاه آزاد اسلامی مشغول به فعالیت بوده و در حال حاضر عضو هيأت علمي دانشكده مهندسی پزشکی واحد علوم و تحقیقات تهران ميباشد. زمينههاي علمي مورد علاقه نامبرده شامل موضوعاتي مانند کنترل سیستمهای عصبی عضلانی، آشوب در سیستمهای بیولوژییکی و ... ميباشد.
[1] این مقاله در تاریخ 2 دی ماه 1401 دریافت و در تاریخ 22 مرداد ماه 1402 بازنگری شد.
اشکان ضرغامی، دانشكده مهندسي برق، دانشگاه آزاد اسلامی، واحد تهران مرکز، تهران، ايران، (email: ashkan.zarghami@outlook.com).
مهدی سیاهی (نویسنده مسئول)، دانشکده مهندسي برق و کامپیوتر،
دانشگاه آزاد اسلامی، واحد علوم و تحقیقات، تهران، ايران،
(email: mehdi.siahi@srbiau.ac.ir).
فریدون نوشیروان راحتآباد، دانشکده مهندسی پزشکی، دانشگاه آزاد اسلامی، واحد علوم و تحقیقات، تهران، ، ايران، (email: nowshiravan@gmail.com).
[2] . Human Immunodeficiency Virus
[3] . Acquired Immune Deficiency Syndrome
[4] . Highly Active Antiretroviral Therapy
[5] . Reverse Transcriptase Inhibitor
[6] . Protease Inhibitor
[7] . Baskakov
[8] . Linear Quadratic
[9] . Constrained Quadratic Programming
[10] . Projection Recurrent Neural Network
[11] . Lipschitz
[12] . Karush-Kuhn-Tucker