您当前所在位置: 首页 > 首发论文
筛选条件

时间

领域

全部

计算机科学技术(7)

电子、通信与自动控制技术(6)

工程与技术科学基础学科(1) 显示更多>>

中医学与中药学(0) 临床医学(0) 交通运输工程(0) 体育科学(0) 信息科学与系统科学(0) 农学(0) 冶金工程技术(0) 力学(0) 动力与电气工程(0) 化学(0) 化学工程(0) 图书馆、情报与文献学(0) 土木建筑工程(0) 地球科学(0) 基础医学(0) 天文学(0) 安全科学技术(0) 心理学(0) 教育学(0) 数学(0) 机械工程(0) 材料科学(0) 林学(0) 核科学技术(0) 水产学(0) 水利工程(0) 测绘科学技术(0) 物理学(0) 环境科学技术(0) 生物学(0) 畜牧科学、动物医学(0) 矿山工程技术(0) 管理学(0) 纺织科学技术(0) 经济学(0) 能源科学技术(0) 航空航天科学技术(0) 药学(0) 预防医学与卫生学(0) 食品科学技术(0)

学术评议

实时热搜榜

SiC42376

人工智能37159

基因28612

数据挖掘18385

Bcl-215127

我的筛选 >
2003-2021 全部
为您找到包含“Deep Reinforcement learning”的内容共14

张宇轩,孙耀华

2020-04-27

Reinforcement Learning, DRL)的中断补偿算法。基于与网络环境的交互,每个补偿基站利用一个 DRL 模型根据小区局部状态进行天线下倾角和用户功率调整,同时根据小区的性能进行补偿策略的更新,最终实现仅

北京邮电大学信息与通信工程学院,北京 100876,北京邮电大学网络技术研究院,北京 100876

#电子、通信与自动控制技术#

0评论(0 分享(0)

LI Yanjiang,WANG Chensheng,YANG Guang,JING Xueliang,LI Yangguang,QIAN Zhixuan

Deep reinforcement learning (DRL) shows great performance in solving decision-making problems, in

2019-11-26

Jiangsu Province Key Research Project on Industry Prospect and Common Key Technologies (BE2016032

Wuxi Science and Technology Development Project on Industry Prospect and Common Technology (CGE02G1609

School of Automation, Beijing University of Posts and Telecommunications, Beijing, 100876,School of Automation, Beijing University of Posts and Telecommunications, Beijing, 100876,School of Automation, Beijing University of Posts and Telecommunications, Beijing, 100876,School of Automation, Beijing University of Posts and Telecommunications, Beijing, 100876,School of Automation, Beijing University of Posts and Telecommunications, Beijing, 100876,School of Automation, Beijing University of Posts and Telecommunications, Beijing, 100876

#Computer Science and Technology#

0评论(0 分享(0)

GAO Huihui,ZHAO Zhongyuan

this paper, we studied the Deep Reinforcement Learning (DRL) based content caching scheme in wireless

2020-12-30

the School of Information and Communication Engineering, Beijing University of Posts and Telecommunications, Beijing;the School of Information and Communication Engineering, Beijing University of Posts and Telecommunications, Beijing,

#Electrics, Communication and Autocontrol Technology#

0评论(0 分享(0)

黄阳明,邝坚

2021-01-04

现在的商品推荐系统常建立在用户数据已充分获取,且其行为特征在长期时间内都不会发生改变的基础上。但用户和推荐系统往往会发生持续且密切的交互行为,从而更好的揭示当前用户的行为特征,为推荐系统进行精准推荐提供更多的依据。针对这一问题,本文主要做了一下两方面工作。第一,本文设计并实现了多元素逼近状态机制和动作分组机制。多元素逼近状态机制使得获取相近状态奖励值时有更多的凭证,也能获得更相近的状态元素。动作分组机制是收集同一动作为一组,减少对每一个状态的计算量。第二,本文对商品推荐系统进行了扩展和优化的研究,系统能支持多次的深度强化学习推荐算法模块的更新和落实,设计并实现了支持用户登录,商品推荐,用户商品操作,用户操作记录的商品推荐系统。?????

School of Computer, Beijing University of Posts and Telecommunications, Beijing,10086,School of Computer, Beijing University of Posts and Telecommunications, Beijing,10086

#计算机科学技术#

0评论(0 分享(0)

程百川,刘丹谱

2019-03-28

移动边缘计算在移动网络边缘提供计算资源。为了减少执行时延,计算密集型任务可以从用户设备卸载到移动边缘服务器。当考虑到任务动态到达情况下,如何分配计算与无线网络资源是保障服务质量的关键问题之一。为了最小化多用户任务执行时延,本文联合优化计算卸载决策与无线资源、计算资源分配,提出一种基于深度强化学习的深度策略梯度算法。仿真结果表明提出的算法在不同的用户数、计算能力以及无线信道带宽下均能获得更低的任务执行总时延。

Beijing Key Laboratory of Network System Architecture and Convergence, Beijing University of Posts and Telecommunications, Beijing 100876;Beijing Laboratory of Advanced Information Network, Beijing University of Posts and Telecommunications, Beijing 100876,Beijing Key Laboratory of Network System Architecture and Convergence, Beijing University of Posts and Telecommunications, Beijing 100876;Beijing Laboratory of Advanced Information Network, Beijing University of Posts and Telecommunications, Beijing 100876

#电子、通信与自动控制技术#

0评论(0 分享(0)

吴世成,孟祥武

2021-07-14

近年来,随着用户的偏好和新闻特征的快速变化,个性化新闻推荐系统面临着很大的挑战。为了提高推荐系统的性能,基于深度学习的新闻推荐系统模型已经有了快速的发展。但是,它依旧存在一些问题。第一,模型具有低效的采样率并且难以设计出好的收益函数;第二,在深度学习模型中,很少会考虑到用户访问序列。这些问题使得推荐性能很低。在本篇中,将深度学习与用户访问序列因子相结合,重新设计待推荐项目计算的评分标准。此外,本篇整合大众偏好来解决用户访问序列稀疏性问题。最后在NewsREEL平台提供的数据集和从网易新闻爬虫获取的数据集上进行了实验,实验结果表明本篇提出的模型能够有效提高推荐系统的性能。?

Beijing Key Laboratory of Intelligent Telecommunications Software and Multimedia (Beijing University of Posts and Telecommunications), Beijing 100876,Beijing Key Laboratory of Intelligent Telecommunications Software and Multimedia (Beijing University of Posts and Telecommunications), Beijing 100876

#计算机科学技术#

0评论(0 分享(0)

周灵叶

2021-04-26

随着无人机及其相关技术的日渐成熟,无人机作为空中基站被广泛应用于通信领域为地面用户提供通信服务。在诸多通信场景中,具有高机动性和自由性的无人机基站,可根据通信需求调整自身位置,通过移动提高通信质量,为无线通信场景提供辅助和扩展,研究通信场景中的无人机路径规划问题,对促进无线通信网络集成具有重要意义。本文首先分析了现有路径规划方法的优势和不足,其次根据通信场景中任务的需求,选择了基于深度强化学习的路径规划方法进行分析,最后针对深度强化学习方法的动作粗粒度问题,引入了行动者-批评家(Actor-Critic,AC)框架,将离散动作空间转化为连续动作空间,细化动作粒度,增大动作空间使得解空间增大,更逼近最优路径解。仿真结果表明,本文提出的优化方法效果优于基准方法。

School of Computer Science, Beijing University of Posts and Telecommunications, Beijing 100876

#计算机科学技术#

0评论(0 分享(0)

周能,刘晓平

2019-03-15

深度增强学习将深度学习的感知能力和增强学习的决策能力相结合,在智能控制,机器人控制及预测分析等领域有广泛应用空间。本文将AGV动态避障问题置于深度增强学习框架下,利用场景中物体位置和速度等可采集信息,采用MADDPG深度增强学习框架进行训练,利用经验回放机制和分散执行、集中评估的训练模式,以及设计合理的奖励函数,使得AGV在动态环境下有一定的自主避障能力。

School of Automation, Beijing University of Posts and Telecommunications, Beijing 100876,School of Automation, Beijing University of Posts and Telecommunications, Beijing 100876

#电子、通信与自动控制技术#

0评论(0 分享(0)

刘一鸣,胡铮

2020-05-12

强化学习广泛应用于系统决策等人工智能领域,凭借强大的性能优势,能够解决大量复杂场景下的智能体决策问题,具有很高的研究价值和意义。但是奖励的稀疏和延迟阻碍了智能体的策略学习,尽管目前出现的好奇心探索有利于增强智能体的学习能力,但是好奇心奖励的构造方式有待进一步改善。本文基于于智能体的好奇心探索,提出基于方向好奇心的强化学习算法,设计方向探测器,利用先验知识指导智能体的探索方向,规避风险探索对奖励信号进行衰减处理,并且在Atari的游戏场景中进行实验,最后取得了更高的得分。

北京邮电大学信息与通信工程学院,北京邮电大学信息与通信工程学院

#计算机科学技术#

0评论(0 分享(0)

SHI Hao,ZHANG Xiaohang,ZHANG Xiaohang

This paper proposes limit order is a more intelligent and profitable way to trade stock. When a bad market order is executed, trader will encounter certain loss since the bad decision makes trader stuck in bad price position. A Limit order is superior to market order in such way that it always give the trader a better price position. We use a customized deep continuous Q learning algorithm to pricing limit order and trade stocks in discrete time steps. Experiments on NSC market data show our strategy is better than market order strategy and our algorithm is more suitable for our problem.

2017-12-07

NSFC Foundation ( G011203

Department of Economics and Management, Beijing University of Posts and Telecommunications, Beijing 100876,Department of Economics and Management, Beijing University of Posts and Telecommunications, Beijing 100876,Department of Economics and Management, Beijing University of Posts and Telecommunications, Beijing 100876

#Computer Science and Technology#

0评论(0 分享(0)