مرکز منطقه ای اطلاع رسانی علوم و فناوری فصلنامه مهندسی برق و مهندسی کامپيوتر ايران 16823745 22 3 2024 12 31 Multi-Agent Deep Reinforcement Learning-Based Decentralized Computation Offloading in Mobile Edge Computing برون‌سپاری محاسبات غیرمتمرکز مبتنی بر یادگیری تقویتی عمیق چندعامله در رایانش لبه همراه 151 168 fa آتوسا دقایقی دانشگاه دولتی قم محسن نیک رای دانشگاه قم 2023 10 4 <p style="text-align: left;">It is hardly possible to support latency-sensitive and computational-intensive applications for mobile devices with limited battery capacity and low computing resources. The development of mobile edge computing and wireless power transfer technologies enable mobile devices to offload computing tasks to edge servers and harvest energy to extend their battery lifetime. However, computation offloading faces challenges such as the limited computing resources of the edge server, the quality of the available communication channel, and the limited time for energy harvesting. In this paper, we study the joint problem of decentralized computation offloading and resource allocation in the dynamic environment of mobile edge computing. To this end, we propose a multi-agent deep reinforcement learning-based offloading scheme that considers the cooperation between mobile devices to adjust their strategies. To be specific, we propose an improved version of the multi-agent deep deterministic policy gradient algorithm by employing the features of clipped double Q-learning, delayed policy update, target policy smoothing, and prioritized experience replay. The simulation results reveal that the proposed offloading scheme has better convergence performance than other baseline methods and also reduces the average energy consumption, average processing delay and task failure rate.</p> <p>پشتیبانی از برنامه&zwnj;های کاربردی حساس به تأخیر و نیازمند محاسبات سنگین برای دستگاه&zwnj;های همراه با ظرفیت باتری محدود و منابع محاسباتی کم به&zwnj;سختی امکان&zwnj;پذیر است. توسعه فناوری&zwnj;های رایانش لبه همراه و انتقال توان بی&zwnj;سیم به دستگاه&zwnj;های همراه امکان می&zwnj;دهند تا وظایف محاسباتی خود را به سرورهای لبه برون&zwnj;سپاری کنند و انرژی را برای افزایش طول عمر باتری خود برداشت کنند. با این حال برون&zwnj;سپاری محاسبات با چالش&zwnj;هایی مانند منابع محاسباتی محدود سرور لبه، کیفیت کانال ارتباطی موجود و زمان محدود برای برداشت انرژی مواجه است. ما در این مقاله مسئله مشترک برون&zwnj;سپاری محاسبات و تخصیص منابع غیرمتمرکز را در محیط پویای رایانش لبه همراه مطالعه می&zwnj;کنیم. برای این منظور یک طرح برون&zwnj;سپاری مبتنی بر یادگیری تقویتی عمیق چندعامله را پیشنهاد می&zwnj;دهیم که همکاری بین دستگاه&zwnj;های همراه را برای تنظیم استراتژی&zwnj;هایشان در نظر می&zwnj;گیرد. به طور خاص، ما یک نسخه بهبودیافته الگوریتم گرادیان سیاست قطعی عمیق چندعامله را با به&zwnj;کارگیری ویژگی&zwnj;های clipped double Q-learning، به&zwnj;روزرسانی با تأخیر سیاست، هموارسازی سیاست هدف و بازپخش تجربه اولویت&zwnj;بندی&zwnj;شده پیشنهاد می&zwnj;دهیم. نتایج شبیه&zwnj;سازی نشان می&zwnj;دهند طرح برون&zwnj;سپاری پیشنهادی، عملکرد همگرایی بهتری نسبت به سایر روش&zwnj;ها دارد و همچنین میانگین مصرف انرژی، میانگین تأخیر پردازش و نرخ شکست وظیفه را کاهش می&zwnj;دهد.</p>

http://ijece.org/fa/Article/Download/44275