您当前所在位置: 首页 > 学者
在线提示

恭喜!关注成功

在线提示

确认取消关注该学者?

邀请同行关闭

只需输入对方姓名和电子邮箱,就可以邀请你的同行加入中国科技论文在线。

真实姓名:

电子邮件:

尊敬的

我诚挚的邀请你加入中国科技论文在线,点击

链接,进入网站进行注册。

添加个性化留言

已为您找到该学者8条结果 成果回收站

上传时间

2009年02月12日

【期刊论文】马尔可夫决策过程基于TD(0)学习和性能势的NDP优化1)

韩江洪, 袁继彬, 唐昊

第二十三届中国控制会议论文集,808~812,-0001,():

-1年11月30日

摘要

在Markov性能势基础上讨论了一种基于强化学习的马尔可夫决策过程(MDP)优化方法。本文通过MDP的一个一致化链和Markov性能势的神经元网络逼近,重点研究了Critic模式下的一种神经元动态规划(NDP)优化方法,给出了用于平均代价准则和折扣代价准则MDP优化的参数化TD(0)学习规则和参数改进公式,并讨论了基于性能势的逼近策略迭代算法。文中最后给出一个数值仿真实例,实验结果表明平均准则下的NDP优化方法足折扣准则当折扣因子趋近于零的极限情况。

马尔可夫决策过程, 性能势, TD(, 0), 学习, 神经元动态规划

上传时间

2009年02月12日

【期刊论文】连续时间Markov控制过程的平均代价最优鲁棒控制策略

韩江洪, 唐昊, 高隽

中国科学技术大学学报,2004,34(2):19~25,-0001,():

-1年11月30日

摘要

在Markov性能势基础上,研究了一类转移速率不确定但受紧集约束的遍历连续时间Markov控制过程(CTMCP)的鲁棒控制问题。根据系统的遍历性,平均代价Poisson方程的解可被看作是性能势的一种定义。在平均代价准则下,优化控制的目标是选择一个平稳策略使得系统在参数最坏取值下能获得最小无穷水平平均代价,据此论文给出了求解最优鲁棒控制策略的策略迭代(PI)算法,并详细讨论了算法的收敛性。

Markov性能势, 连续时间Markov控制过程, 鲁棒控制策略, 策略迭代

上传时间

2009年02月12日

【期刊论文】嵌入式信息家电系统中蓝牙子系统的研究与开发

韩江洪, 段玲琳, 张建军, 王景华

系统仿真学报,2004,16(12):2825~2827,-0001,():

-1年11月30日

摘要

描述了在家庭中利用蓝牙散射网实现对信息家电集中控制的解决方案,对其中最具代表性的最小微微网单元——蓝牙子系统的具体实现做了详细阐述。充分考虑到家电的处理器资源限制和敏感的成本因素,该子系统使用特定的应用层协议来解决仅支持微微网的蓝牙设备在散射网中通讯的问题、家电注册问题以及非对等层通信问题。

蓝牙, 散射网, 信息家电, 主机控制器接口, 逻辑链路控制和适配协议

上传时间

2009年02月12日

【期刊论文】基于实例的Web Cache体系结构与通信协议的研究

韩江洪, 王炯, 魏振春

计算机工程与应用,2004,31,1~4,-0001,():

-1年11月30日

摘要

大规模Cache系统的研究与设计有助于进一步提高用户访问Internat的速度,并真正缓解因为World Wide Web的迅速发展对网络带宽和处理能力带来的巨大压力。论文着眼于体系结构和通信协议的特点对典型Cache系统进行了归纳与分类;并通过基于实例的分析,逐次对比了它们在资源共享与协同工作方面的技术特点和性能;最后,总结了制约系统设计的各种关键因素,并对该领域的发展方向做了初步的总结。

网络缓存, 体系结构, 通信协议, 命中率

上传时间

2009年02月12日

【期刊论文】二进神经网络中汉明球的逻辑意义及一般判别方法

韩江洪, 陆阳, 魏臻, 高隽

计算机研究与发展,2002,39(1):79~86,-0001,():

-1年11月30日

摘要

剖析二进神经元的逻辑意义对二进神经网络的规则提取是十分重要的。在布尔空间中,汉明球是一种线性可分的空间结构,如何从汉明球中提取出具有清晰逻辑意义的规则是二进神经网络研究中的一个问题。通过对MofN规则表达形式的扩展,分析了汉明球的逻辑意义,提出了表达汉明球逻辑意义的LEM规则和GEM规则方法,并且讨论了汉明球和汉明补球的等价性。另一个重要的结果是证明了二进神经元和汉明球等价的充要条件,从而建立了判别汉明球的一般方法。

二进神经网络, 汉明球, 规则提取

合作学者

  • 韩江洪 邀请

    合肥工业大学,安徽

    尚未开通主页