已为您找到该学者8条结果 成果回收站
韩江洪, 段玲琳, 张建军, 王景华
系统仿真学报,2004,16(12):2825~2827,-0001,():
-1年11月30日
描述了在家庭中利用蓝牙散射网实现对信息家电集中控制的解决方案,对其中最具代表性的最小微微网单元——蓝牙子系统的具体实现做了详细阐述。充分考虑到家电的处理器资源限制和敏感的成本因素,该子系统使用特定的应用层协议来解决仅支持微微网的蓝牙设备在散射网中通讯的问题、家电注册问题以及非对等层通信问题。
蓝牙, 散射网, 信息家电, 主机控制器接口, 逻辑链路控制和适配协议
-
34浏览
-
0点赞
-
0收藏
-
0分享
-
165下载
-
0
-
引用
韩江洪, 陆阳, 魏臻
自动化学报,2003,29(2):234~241,-0001,():
-1年11月30日
SP函数是一类具有明确逻辑意义的线性可分结构系,PSP函数是SP函数的特殊子集。文中讨论了二进神经元对SP函数和PSP函数的表达问题,通过研究PSP函数分类超平面的某些性质,建立了SP函数和PSP函数的一般判别和构造方法。
二进神经网络, 线性可分, PSP函数, 规则提取
-
60浏览
-
0点赞
-
0收藏
-
0分享
-
37下载
-
0
-
引用
【期刊论文】马尔可夫决策过程基于TD(0)学习和性能势的NDP优化1)
韩江洪, 袁继彬, 唐昊
第二十三届中国控制会议论文集,808~812,-0001,():
-1年11月30日
在Markov性能势基础上讨论了一种基于强化学习的马尔可夫决策过程(MDP)优化方法。本文通过MDP的一个一致化链和Markov性能势的神经元网络逼近,重点研究了Critic模式下的一种神经元动态规划(NDP)优化方法,给出了用于平均代价准则和折扣代价准则MDP优化的参数化TD(0)学习规则和参数改进公式,并讨论了基于性能势的逼近策略迭代算法。文中最后给出一个数值仿真实例,实验结果表明平均准则下的NDP优化方法足折扣准则当折扣因子趋近于零的极限情况。
马尔可夫决策过程, 性能势, TD(, 0), 学习, 神经元动态规划
-
111浏览
-
0点赞
-
0收藏
-
0分享
-
13下载
-
0
-
引用