主  题

不  限

  • 不  限
  • 1915年
  • 1949年
  • 1979年

不  限

  • 不  限
  • 1979年
  • 1949年
  • 1915年
  • 全  文
  • 主  题
  • 篇  名
  • 关键词
  • 作  者
  • 作者单位
  • 摘  要
  • 参考文献
  • 基  金
  • 文献来源
  • 发表时间
  • 中图分类号

主  题

不  限

  • 不  限
  • 1915年
  • 1949年
  • 1979年

不  限

  • 不  限
  • 1979年
  • 1949年
  • 1915年
  • 全  文
  • 主  题
  • 篇  名
  • 关键词
  • 作  者
  • 作者单位
  • 摘  要
  • 参考文献
  • 基  金
  • 文献来源
  • 发表时间
  • 中图分类号

全  文

不  限

  • 不  限
  • 1915年
  • 1949年
  • 1979年

不  限

  • 不  限
  • 1979年
  • 1949年
  • 1915年
  • 全  文
  • 主  题
  • 篇  名
  • 关键词
  • 作  者
  • 作者单位
  • 摘  要
  • 参考文献
  • 基  金
  • 文献来源
  • 发表时间
  • 中图分类号
设置
  • 关闭历史记录
  • 打开历史纪录
  • 清除历史记录
引用
筛选:
文献类型 文献类型
学科分类 学科分类
发表年度 发表年度
作者 作者
机构 机构
基金 基金
研究层次 研究层次
排序:
显示:
CNKI为你找到相关结果

基于强化学习的2D仿真足球机器人协作机制  CNKI文献

本文在基于智能体学习的基础上,以RoboCup2D为实验平台,对多智能体强化学习及协作问题进行研究,研究内容如下:单智能体的控球策略优化问题中,提出了一种基于Sarsa(λ)算法的仿真足球机器人控...

胡丽娟 导师:梁志伟 南京邮电大学 2019-12-09 硕士论文

关键词: 多智能体 / 强化学习 / Sarsa(λ)算法 / Q-learning(λ)算法

下载(432)| 被引(2)

基于机器学习的3D仿真足球机器人动作与协作优化  CNKI文献

本文在RoboCup3D仿真平台中,实现建立了高通量计算机集群HTCondor系统,并在此基础上建立了Robocup3D个体机器人的动作优化机制,对机器人的踢球及行走参数进行了训练优化,其次基于足球队伍的阵型及角...

冯欢欢 导师:梁志伟 南京邮电大学 2017-10-26 硕士论文

关键词: HTCondor / CMA-ES / Delaunay三角网 / Markov决策过程

下载(391)| 被引(1)

基于多智能体强化学习的足球机器人决策策略研...  CNKI文献

分布式人工智能近十几年受到了广泛地关注与发展,多智能体系统也成为了研究的热点,将其强化学习相结合,可以得到多智能体的强化学习。本文以一个典型的多智能体系统即足球机器人系统为...

丁明刚 导师:陈梅 合肥工业大学 2017-03-01 硕士论文

关键词: 多智能体 / 强化学习 / Q学习 / 足球机器人

下载(1179)| 被引(16)

复杂环境下的多目标动态协同对抗辅助决策方法研究  CNKI文献

随着人工智能技术的飞速发展,多智能体系统在很多领域具有了广泛应用,研究多智能体相关技术就显得越加重要。同时,随着智能体结构设计技术和数据采集技术的不断完善,根据多智能体共享的...

李学思 导师:史豪斌 西北工业大学 2017-02-01 硕士论文

关键词: 态势评估 / 协同对抗决策 / 深度学习 / 强化学习

下载(1073)| 被引(2)

基于强化学习的多智能体协同机制研究  CNKI文献

多智能体系统由多个相互作用的自主智能体(Agent)形成的集合,其研究的核心问题是寻求建立一种有效的协同机制,使功能简单,相互独立的多个Agent通过协商、协调和协作完成复杂的目标任务或解决复杂的问题。...

孙清 导师:杨马英 浙江工业大学 2015-04-18 硕士论文

关键词: 多智能体协同 / 马尔科夫决策模型 / 强化学习 / 任务分层

下载(1119)| 被引(12)

RoboCup3D仿真中足球机器人的全向行走与团队协作  CNKI文献

本文以RoboCup3D足球仿真比赛环境为平台,主要研究了南京邮电大学Apollo3D团队有关足球机器人个体技术和多智能体团队协作对抗策略。先后实现了单个智能体的全向行走技术、机器人之间的...

沈萍 导师:梁志伟 南京邮电大学 2015-03-01 硕士论文

关键词: 全向行走 / CMA-ES / 协作定位 / PSO

下载(302)| 被引(3)

基于性能势的改进平均奖赏强化学习算法研究  CNKI文献

强化学习是人工智能领域内用于解决学习控制问题的一个重要方法。机器人仿真足球比赛是一个多智能体系统研究的标准问题,具有动态实时、分布式控制、不确定环境中的合作和对抗等特点,是人工~...

杨宛璐 导师:陈玮 广东工业大学 2014-05-01 硕士论文

关键词: 足球机器人 / 多智能体 / 强化学习算法 / 平均强化学习算法

下载(142)| 被引(3)

性能势算法研究及在RoboCup中的应用  CNKI文献

强化学习是人工智能领域中解决学习控制的一种重要方法。在强化学习算法中,平均奖赏强化学习是以平均奖赏值作为参照标准,适用于解决具有循环特性或不具终结状态的问题,其存在参数和环境的敏感及收敛速度慢等问...

杨宛璐 陈玮... 《计算机工程与设计》 2014年03期 期刊

关键词: 足球机器人 / 强化学习 / 性能势 / G-learning算法

下载(51)| 被引(0)

基于多智能体强化学习的足球机器人决策系统研...  CNKI文献

如何使智能体模拟人类思维方法做出决策是人工智能的要义ˋ智能体能够通过强化学习方法ˋ对环境进行试错性的学习ˋ从而为求解马尔可夫决策过程描述的大规模不确定环境下的决策问题提供了方法RoboC...

周坤龙 导师:王鸿鹏 哈尔滨工业大学 2013-12-01 硕士论文

关键词: 多智能体系统 / MAXQ分层强化学习 / 足球机器人

下载(472)| 被引(6)

基于多智能体强化学习的多机器人协作策略研究  CNKI文献

研究了一种基于智能体动作预测的多智能体强化学习算法.在多智能体系统中,学习智能体选择动作不可避免地要受到其他智能体执行动作的影响,因此强化学习系统需要考虑多智能体的联...

段勇 徐心和 《系统工程理论与实践》 2014年05期 期刊

关键词: 多智能体系统 / 强化学习 / 概率神经网络 / 多机器人协作

下载(2683)| 被引(58)

基于Markov决策理论的足球机器人协同机制研究  CNKI文献

多智能体系统的协调和协作机制,是目前人工智能研究的重点领域之一。多智能体系统的广泛应用决定了研究其协调协作机制有很大的现实意义。 本文以机器人足球比赛为背景,研究基于Markov决策...

贾玉博 导师:杨马英 浙江工业大学 2013-03-30 硕士论文

关键词: 多智能体系统 / 机器人足球 / 马尔可夫决策过程 / MAXQ值函数分解

下载(268)| 被引(3)

基于强化学习的足球机器人比赛决策策略研究  CNKI文献

近些年来,随着足球机器人比赛的逐渐发展和流行,它已经成为了机器人研究中的一个热点问题,同时为军用机器人、工业机器人、农业机器人以及服务机器人等众多领域提供了良好的技...

李程 导师:段勇 沈阳工业大学 2013-02-24 硕士论文

关键词: 多智能体 / 内省推理 / 强化学习 / 决策策略

下载(333)| 被引(3)

多智能体系统编队避障算法研究  CNKI文献

近年来,多智能体系统的群集控制作为一项新型的分散控制方法,在国内外智能系统领域引起了极大的关注。本研究课题源于华东理工大学与瑞典Malardalen University对于RoboCup中型组足球机器人的合作科...

王京 导师:王慧锋 华东理工大学 2012-12-10 硕士论文

关键词: 多智能体 / 群集运动 / 避障 / 编队控制

下载(1756)| 被引(22)

强化学习在RoboCup带球任务中的应用  CNKI文献

本文提出了一种基于强化学习的足球机器人带球任务的解决方案,带球方从阶段的开始到结束均尽力去控制足球,对方的队员则尽力从控球方抢夺足球。在本论文中控球方采用SARSA控制算法,防守方采用传统的...

刘飞 陈焕文... 《微计算机信息》 2012年09期 期刊

关键词: 强化学习 / 带球 / 控制算法

下载(86)| 被引(0)

基于行为效用预测的足球机器人角色实现  CNKI文献

近年来,基于动态角色转换的机器人足球策略系统得到越来越多的比赛队伍和研究机构的青睐。为了提高足球机器人角色实现的成功率和协调性,本文在基于角色的决策系统基础上,提出了基于行为效用预测的机器人足球比赛进攻...

贾玉博 杨马英 第三十一届中国控制会议论文集D卷 2012-07-25 国际会议

关键词: 机器人足球 / 多智能体系统 / 博弈论 / 效用

下载(57)| 被引(0)

多智能体协调控制实验系统研究与设计  CNKI文献

多智能体系统是人工智能与协同控制交叉领域的研究热点。多智能体的研究,主要集中在协调一致性控制、群集控制等方面。到目前为止,绝大多数的研究集中在理论层面上,实际的实验与应用系统却很少见...

王帅 导师:关新平 燕山大学 2012-05-01 硕士论文

关键词: 多智能体 / 无线通信 / 变积分PID / 视觉全局定位

下载(283)| 被引(3)

强化学习在足球机器人仿真中的应用  CNKI文献

机器人足球的研究涉及了人工智能机器人学、计算机视觉及智能控制等多个领域,是目前机器人研究中的一个热点。由于机器人足球具有分布性、实时性、动态性、异步性等特点,使其...

刘飞 导师:陈焕文 长沙理工大学 2012-03-01 硕士论文

关键词: 强化学习 / 多智能体 / SARSA算法 / 仿真足球机器人

下载(225)| 被引(3)

RoboCup中多智能体协作的研究  CNKI文献

多智能体协作是目前分布式人工智能领域的一个重要的研究热点。RoboCup仿真组的比赛是研究多智能体协作问题的一个标准的理想平台,它模拟了人类足球比赛,要想在这个复杂的多智能体环境...

秦童 导师:罗杰 南京邮电大学 2012-02-01 硕士论文

关键词: 多智能体协作 / Q学习 / RoboCup / CMAC

下载(187)| 被引(4)

足球机器人决策系统模型研究  CNKI文献

在足球机器人决策系统设计中,推理模型占有很重要的地位,它为足球机器人决策系统设计提供整体思路上的指导。推理模型研究的内容是决策系统推理的一般过程和步骤,这样就可以把从视觉空间到速度空间的映射分成多步映射...

李东亮 王海花 经济策论(上) 2011-09-01 中国会议

关键词: 微型足球机器人 / 机器人足球比赛 / 决策系统 / 多机器人系统

下载(38)| 被引(0)

机器人足球学习机制的研究现状与发展  CNKI文献

机器人足球赛是近几年在国际上迅速开展起来的高技术对抗活动,引起了研究人员的广泛关注和极大兴趣。机器人足球系统作为多智能体系统研究的测试床,许多研究者从不同的侧面对该项技术进行了研究并取得了一定的成果。对...

程显毅 朱玲玲... Proceedings of 2011 International conference on Intelli... 2011-06-18 国际会议

关键词: 机器人足球 / 多智能体系统 / 机器学习

下载(28)| 被引(0)

学术研究指数分析(近十年)详情>>

  • 发文趋势
时间的形状