行人重识别是指实现不重叠的不同摄像头下同一行人图像的匹配技术,在加强社会管理、预防犯罪行为发生以及实现事件重构等方面具有重要应用价值.由于行人重识别主要依靠人体外表视觉表示特征和人工设计特征,且受光照、...
进化规划中,个体选择变异策略特别重要.适应性变异策略因在进化过程中动态选择个体变异策略,能够取得较好的性能.传统适应性变异策略都依据个体一步进化效果考察个体适应性,没有从多步进化效果上对变异策略进行评价.本...
新形势下,我国体育用品市场迎来难得的发展机遇,同时面临激烈的市场竞争。通过对安踏品牌的外部竞争环境和内部能力的分析,研究适合的竞争战略,对国内体育运动品牌进行了有益探索。
原产地形象对海峡两岸消费者购买意愿影响的比较研究 CNKI文献
影响消费者选择产品的因素有很多,原产地形象是影响消费者产品选择的重要因素之一。原产地形象效应(Country of Origin Effect)由Schooler (1965)首次提出,他选用危地马拉的大学生为研究对象,调查了消费者对四个不同国...
利用增强学习的Q-learning理论,构造了一个基于时间信念、价格信念和状态期望Q值的代理谈判模型。将代理交互报价的过程看成代理选择报价行动,实现状态的迁移,可以计算出代理在不同状态采取行动的Q值。代理可以通过...
现今社会,随着生态破坏和资源浪费现象日益严重,人们的环保意识不断增强,企业越来越重视绿色管理,于是绿色声誉应运而生,并成为企业保持自身可持续发展的必然趋势。本文分析了绿色声誉的内涵及其实施的阻碍因素,从绿色...
在分析了多代理强化学习的基础上,提出了一种基于对手策略假设的代理最优响应强化学习规则,并证明了当对手策略满足一定条件时,基于该学习规则的Q值收敛。实验结果与理论证明相一致。
陶瓷装饰艺术从新石器时代制陶开始,时至今日,经历从无到有、从单色到多彩、从技巧的单一性到综合装饰,逐渐成为艺术领域中的一朵奇葩迸发出勃勃生机。让我们以时间为序,试着了解陶瓷装饰艺术的历史沿革和发展变迁。新...
本文从强化学习与 Markov 对策相结合方面考察了多代理协同技术的发展,系统地分析了已有的研究成果,并指出基于强化学习与对策的多代理协同技术研完中存在的问题及未来研究方向。
提出了一种基于模糊数的多代理信息融合算法。多代理系统中,自身代理为实现自身利益,有时提供非真实的诱导信息影响决策。通过分析信息融合算子对诱导信息的响应,扩充了简洁OWA(n-OWA)为信息融合算子以消除诱导信息的...
一般和对策中,只考虑个体理性的多代理协作是一种无全局目标的协作.代理学习基于对手策略假设,不能保证假设的正确性.为此通过定义代理协作的集体目标,提出了一种基于多代理协商的代理强化学习算法.代理选择协商策略,...
本文研究了p2p网络中基于内容的节点聚类。基于文件名关键词精确匹配的查询没有考虑文本语义及内容相似性。如果能够根据节点发布内容的相似性,建立节点聚类,信息查询在类内进行,必将提高查询效率。本文提出了一种基于...
新彩为陶瓷釉上装饰彩类之一,因其颜色丰富多彩,加上颜料的一些特性,自清末传入我国后一直受到市场和从业人员的青睐。
海尔作为我国家电企业巨头,有其独特的企业文化。以创新为核心的海尔文化带动了海尔内部的经营管理,同时也产生了很好的外部效应。本文从海尔文化观、人才观、战略观及服务观等等多个方面入手,对文化培育在企业经营中...
大因数分解和数据检索量子算法的提出带来了量子计算与量子信息的研究高潮。由于量子计算具有并行性、不可克隆性及量子态的不可测性,使得量子信息及量子计算在某些方面具有传统计算所无法比拟的优势。量子的态空间作...
张化祥 黄上腾 《计算机工程与应用》 2003年25期 期刊
本文研究了基于模糊知识的多代理决策问题。通过建立代理决策目标的模糊知识,我们给出了基于模糊收益的多代理决策模型,并研究了基于梯度的代理策略学习算法。
Multi-agent reinforcement learning based on policies o... CNKI文献
In general sum games, taking all agent’s collective rationality into account, we define agents’ global objective, and propose a novel multi agent reinforcement learning(RL) algorithm based on globa...
张化祥 黄上腾 《Journal of Systems Engineering and Electronics》 2005年03期 期刊
关键词: Markov / games / reinforcement / learning
下载(52)| 被引(0)
提出了一种新的图像特征表示方法,首先提取图像的底层颜色信息获取颜色特征值,通过对图像中物体的边缘检测计算像素点的边缘方向角度值,并对颜色特征值和边缘方向角度值进行量化。然后根据相邻像素点之间量化结果的数...
Multiagent reinforcement learning through merging indi... CNKI文献
In cooperative multiagent systems, to learn the optimal policies of multiagents is very difficult. As the numbers of states and actions increase exponentially with the number of agents, their action ...
张化祥 黄上腾 《Journal of Harbin Institute of Technology》 2005年03期 期刊
关键词: reinforcement / learning / multiagent / value
下载(38)| 被引(0)
The Cooperative Multi-agent Learning with Random Rewar... CNKI文献
This paper investigated how to learn the optimal action policies in cooperative multi-agent systems if the agents' rewards are random variables, and proposed a general two-stage learning algorith...
张化祥 黄上腾 《Journal of Shanghai Jiaotong University》 2005年02期 期刊
关键词: reinforcement / learning / game / random
下载(35)| 被引(0)