论文笔记

每日论文

A Dynamic Service Placement Based on Deep Reinforcement Learning in Mobile Edge Computing-2023.4.2

不行

这篇论文考虑的主要有用户迁移然后服务要跟着迁移,这里还考虑一个服务只专门服务一个用户,跟我的背景差别很大啊

State = [r,u],r是剩余存储能力,u是用户当前位置

Action 是 多个服务迁移如:服务v迁移到服务w

reward也因此别人直接用某个公式做奖励了,我觉得不好借鉴

奖励 r 由多个移动用户的平均延迟反馈与 r 进行比较来衡量image-20230403211230255

Online Microservice Orchestration for IoT via Multiobjective Deep Reinforcement Learning 2023.4.2


论文笔记
http://yoursite.com/2023/04/21/每日论文/
作者
Fars
发布于
2023年4月21日
许可协议