论文笔记
每日论文
A Dynamic Service Placement Based on Deep Reinforcement Learning in Mobile Edge Computing-2023.4.2
不行
这篇论文考虑的主要有用户迁移然后服务要跟着迁移,这里还考虑一个服务只专门服务一个用户,跟我的背景差别很大啊
State = [r,u],r是剩余存储能力,u是用户当前位置
Action 是 多个服务迁移如:服务v迁移到服务w
reward也因此别人直接用某个公式做奖励了,我觉得不好借鉴
奖励 r 由多个移动用户的平均延迟反馈与 r 进行比较来衡量
Online Microservice Orchestration for IoT via Multiobjective Deep Reinforcement Learning 2023.4.2
论文笔记
http://yoursite.com/2023/04/21/每日论文/