2.拟开展的研究工作
着重阐述拟开展的研究工作的科学意义和创新性,技术路线、研究方案等的可行性(不超过4000 字)
2.1 研究意义
机器人资料随着计算技术、传感器技术、通讯技术、控制理论、人工智能理论等的不断发展与成熟,由多个学科交叉而形成的机器人学研究也进入了一个崭新的阶段,其成果可应用于工业控制、交通、航空航天等多个领域。但是单个机器人在信息获取、信息处理等方面的能力有限,为了高效地完成任务,对于复杂动态的工作环境,人们往往利用多机器人之间的协同工作来完成单个机器人难以完成的工作。
从20 世纪80 年代以来,分布式人工智能和复杂系统的研究工作逐渐开展并活跃起来,这些研究将分布式人工智能、复杂系统、社会学等其他领域中的理论和方法引入到机器人学的研究中,丰富了机器人学的研究内容。这方面的研究往往从系统角度出发,探讨机器人体乃至机器人社会的各种组织方式、信息交互方式、进化机制的基本问题,为机器人学的发展提供了一条新的思路。然而,随着应用领域的推广,多机器人系统的规模也急剧扩大,系统的控制机制和通信机制也更为复杂,这为机器人学的研究带来了更大的挑战。近年以来,研究者从自然界中存在一些生物体现象收到启发,如大雁的编队飞行、鱼的聚集以及蜜火虫闪光的同步现象等等。通过对这些生物体现象的分析可以看出,这些体在没有集中控制和全局信息交互的情况下,只是通过自身与周边个体的局部协作和交互,完成了所有个体的聚集和同步,表现
出了整体的一致性,这一生物现象不仅吸引了生物学专家的浓厚兴趣,同时也激发了计算机科学和控制科学等领域学者的研究热情,如何通过模拟生物学领域的集和同步现象,分析和研究体中的协同机制,成为了当前许多学者的研究热点。
受到生物系统所表现出的适应性、自组织性和灵活性的启发,比如蚂蚁可以利用自组织机制来灵活地解决觅食、搬运及队形等问题,可将生物系统的这种特性扩展延伸到多机器人系统中,使得机器人体具备生物体的智能性。
基于智能体的多机器人系统研究具有重要的理论和现实意义。在理论方面,随着对于体机器人学研究的深入,有利于揭示出自然界中体智能行为涌现的根本机制。在应用方面,成熟的体机器人系统可以在船舶制造、产品装配、交通系统、军事装备、航空航天等领域自主完成某些危险的工作,因而具有很高的潜在应用价值。
2.2 研究内容
(1)基于多智能的机器人系统协同行为建模
基于生物体的协作机制,研究机器人的行为规则和交互规则,分析体机器人系统的避障策略和同步机制,建立多机器人之间以及机器人和环境之间的感知和协同运动模型,使处于复杂动态环境中的自主
机器人能够通过与周围一定半径范围内的其他个体及外部环境的局部信息交互,来不断优化自身的控制策略,调整运动行为,以适应环境的动态变化。该模型的研究成果,可以提高复杂系统中体机器人的协同工作能力,对探索复杂环境下机器人的移动过程以及协同控制有积极作用,实现机器人系统的自主协作,从而为人们获取复杂环境信息服务提供了有力支持。
(2)基于智能理论的复杂环境机器人系统强化学习算法
机器人工作的复杂动态环境,固定的控制策略无法自适应环境需要。针对这一问题,分析建立机器人的知识库,研究个体之间的学习机制,从而使机器人能够主动获取知识、积累经验、不断更新和扩充知识,如图1所示;利用体机器人的分布式感知能力来获取环境信息,将环境信息通过适当的通信加以融合,建立基于智能算法的机器人系统协作机制,通过强化学习实现每个机器人的经验共享,从而提高学习效率和系统适应环境的能力,同时降低系统通信量。
图1 机器人系统强化学习机制
(3)基于两级目标驱动机制的体机器人系统协同控制优化方法
为使体机器人系统达到适应动态变化复杂环境的目的,构建体机器人系统-单个机器人个体两个层次
的优化目标体系,如图2所示。根据个体和系统目标之间的关系,研究基于两级目标驱动的系统协同控制优化方法,构建多尺度的优化策略体系,从而从不同关注角度提供不同层级的优化结果。两级目标驱动机制的机器人系统协同控制优化方法的研究既可以提供满足个体机器人目标任务的控制策略,又能够为体机器人系统协作完成目标任务而形成最优化工作系统。
图2基于两级目标驱动机制的协同控制优化方法
(4)多机器人系统仿真实验平台
为了验证智能体组协同控制算法的可行性和有效性,设计和开发多机器人系统仿真实验平台,对多机器人系统协同控制算法进行可行性和有效性验证,模拟和演示多机器人感知、学习和协同工作过程,完成算法的优化与评价。
2.3 创新点
(1)基于多智能系统的机器人交互行为模型
从多机器人系统时空协同工作角度,通过研究机器人的行为特征和交互规则,建立多机器人之间以及机器人和环境之间的感知和协同运动模型,提出体机器人系统的避
障策略和同步机制。该模型的研究成果,既可以提高交通系统中体机器人的协同工作能力,又能为交通应急预案的制定提供有效依据。这一基础科学问题的研究,对探索复杂环境下机器人的移动过程以及交互行为有积极作用,将有助于推动对该集成环境的安全出行分析,从而进一步满足应急交通指挥的需求,为智能交通系统的应急安全响应技术构建提出较可靠的理论支撑。
(2)面向复杂环境的机器人系统强化学习算法
根据生物体之间的协作通信机制,研究机器人之间、机器人与环境之间的感知与学习算法,使初期简单知识库通过学习演化与环境信息相融合,成为面向复杂环境的动态、可扩充知识库,从而提高机器人的智能性,同时可从系统与机器人个体两个方面进行优化。该问题的研究,既可以改进机器人系统控制策略,又能从整体上提高系统适应环境的能力。
2.4 技术路线
(1)基于多智能系统的机器人交互行为模型的建立
首先,构建机器人的交互规则,在交互和移动规则的约束下,设计一个移动对象模拟器,模拟出该环境下疏散对象的基本数据,研究不同机器人的移动特性,分析机器人对环境以及相互之间的时间及空间影响,提取移动和协作行为特征。
然后,应用agent技术来建立疏散模型,根据不同角的机器人,建立不同的agent,包括代表疏散个体的agent、代表决策者agent、用于个体行为挖掘和分析的agent,设定不同类型agent的行为规则,完成建模。本项目基于Agent 技术构建机器人行为模型,既充分发挥了Agent理论的行为刻画能力,又支持了对多机器人协作的有效描述。
(2)基于智能理论的复杂环境机器人系统强化学习算法设计与分析
首先,在多机器人系统模型的基础上,分析和建立机器人的初始知识库,利用自然界蚁、蜂等生物体的信息共享和通信机制,主动学习和扩充各自的知识库。
其次,构建动态可变的主动学习和环境感知方法,通过强化学习实现机器人之间的经验共享,以及机器人和环境之间的相互影响,提高学习效率和系统适应环境的能力。(3)基于两级目标驱动机制的体机器人系统协同控制优化方法
首先,针对机器人体需要完成的目标任务,建立宏观系统的目标体系,同时分析每个机器人在不同时刻的目标任务,构建系统-个体两级目标体系。
其次,利用新型仿生智能算法,如鱼算法、萤火虫算法、菌算法优化各级目标,
设计符合机器人和系统整体的优化方案,使得多机器人协同工作决策进一步细化,满足不同应用场合的需求,实现时空资源的优化利用。
最后,对优化算法进行性能、效能、合理性评估与分析,为该优化算法的后续优化以及实际应急应用提供重要的科学试验结论。
(4)多机器人系统仿真实验平台的设计和开发
首先,将机器人移动模型和感知学习算法融合设计一个多机器人系统仿真实验平台,模拟和演示多机器人感知、学习和协同工作过程。
其次,分析模型和算法中不同参数的影响,得出最优参数组合,并从理论上分析各个参数的实际意义,完成算法的优化与评价。
本课题的技术路线如图3所示: