| 成果名称: | 基于学习人类策略的动态稳定系统控制器切换方法研究 |
| 完成单位: | 中国科学院深圳先进技术研究院 |
| 主要人员: | 欧勇盛、Weihua Sheng、王灿、郭静、王凡、杜边境、Ye Gu、刘理、欧阳利萍、唐成 |
| 介绍: | 1.课题来源与背景:传统的机器人控制技术,一般需要建立明确的系统动态模型,获取精确和足够简单到控制可用的数学表示,通常只有少数建模是有效和足够简洁的,并高度依赖研究人员的专业技术,而且对于大量复杂的实际问题,还会因为模型太复杂而得不偿失。人类和动物能够轻松的完成复杂的动态的运动控制,这种能力对于当前的机器人而言却存在很大的困难。把人类自然的控制策略运用到机器人领域将会极大地推动机器人控制技术。另一方面,无论传统控制方法还是智能控制方法,对控制器切换过程中可能遇到的问题研究非常有限,然而,许多系统,特别是动态稳定系统,相当多的失稳都发生在控制器切换过程中。开展基于学习人类控制策略的动态稳定系统控制切换研究,不依赖动态系统建模的专家技能,不仅避免了因为模型简化造成的控制器性能的削弱,还能够更好地在变化的环境中运用,极大地提高控制器的鲁棒性和泛化性。 2.研究目的与意义:在目前智能机器人的控制方法中,某些控制品质不好,一方面是因为控制器的精度不够高,另一方面是设计控制器时没有仔细考虑控制器切换时可能出现的问题。基于此,本课题研究基于学习人类策略的动态稳定系统在控制器切换时保持稳定状态的理论和方法,提高这类智能控制器的鲁棒性和对复杂环境的适应性。重点突破的内容包括:对人类控制策略进行建模时,映射关系中输入状态应如何选取;如何提高建模精度及如何对建模的精度给出评价指标;如何进行单一目标控制器稳定域的估计等。 3.主要论点与论据:项目在基于人类控制策略的机器人动态稳定系统建模与控制器切换方面开展研究,基于轮式移动机器人探索控制器的设计与收敛域估计问题,探索建模精度和稳定性的权衡问题等,相关成果极大促进轮式移动机器人的控制技术发展,取得了有价值的研究与应用成果。 4.创建与创新:该成果提出了一套基于学习人类控制策略的控制模型设计方法,然后对该控制器的稳定性进行判断,并对其稳定的收敛域估计方法进行了探索。以轮式移动倒立摆为实验平台,记录通过人类操作保持其平衡的数据,然后基于支持向量回归方法对模型参数进行学习。经过实验验证该模型能够成功地控制移动倒立摆自主保持平衡。在此基础上,应用李雅普诺夫稳定性理论分析了所学习出来的控制模型是否稳定,并在系统稳定的基础上,应用切比雪夫点估计的方法对控制器的收敛域进行了估计。该研究对现今日益流行的单轮或双轮平衡车的控制方法提供了较强的参考价值,具有可观的应用前景。该成果提出将人类示教建模成非线性自治动态系统并与稳定性约束条件相结合的方法,实现机器人对复杂运动任务的掌握。探索简易、新型的神经网络在人类策略控制建模中的应用。基于李雅普诺夫定理推导控制器的稳定性条件,并通过对建模优化过程添加约束条件保证系统的稳定性。该研究成果对动态系统既保证稳定性又不失精度的快速建模方法提供有力的理论支撑。 5.社会经济效益,存在的问题:本项目基于人类控制策略探索机器人动态稳定系统模型的学习方法,是轮式移动机器人、单/双轮平衡车等高度智能产品的核心技术。本成果技术应用于低成本的室内机器人中,实现累计实现销售收入 6,551.37 万元,推动高度人工智能家用服务机器人产业化,为我国服务机器人提供创新技术和集成应用示范,推动产业升级和发展,和国际领先水平保持同步。 6.成果情况:项目产品方面,完成了新一代机器人产品开发,各项技术指标达到合同要求,顺利实现产业化。人才培养方面,引进人才 3 人,培养学生5 名,其中博士学生1 名,硕士学生4 名。知识产权方面,申请 PCT 专利 3 项,申请发明专利 14 项,申请实用新型专利12 项,计算机软件著作权6 项。该技术分别获得2016年吴文俊人工智能科技进步三等奖和2017年深圳市科技进步二等奖。 |
| 批准登记号: | 粤科成登(2)字【2018】0382 |
| 登记日期: | 2018-10-16 |
| 研究起止时间: | 2013.01 至2016.12 |
| 所属行业: | 居民服务、修理和其他服务业 |
| 所属高新技术类别: | 先进制造 |
| 评价单位名称: | 国家自然科学基金委员会计划局 |
| 评价日期: | 2017.04.12 |
