成果名称: 多源碎片化知识聚合关键技术研究
完成单位: 广东顺德西安交通大学研究院
主要人员: 刘均,南建忠,魏笔凡,何绯娟,李秋琼,郭少平,刘文强,宋凌云,石磊,郭朝彤
介绍:

    本成果将知识主题的分面结构与认知关系引入碎片化知识融合问题的研究,建立一种兼具分面聚合与导航学习特点的“知识森林”模型,通过分面树实现特定知识主题各个分面的全方位展示,缓解认知片面问题;通过将不同知识源的碎片化知识装配到主题分面树,缓解认知过载问题;通过建立由认知关系组成的认知路径实现导航学习,缓解学习迷航问题。主要技术特色包括:

    提出“分面树生成—认知路径生成—碎片化知识装配”三阶段的知识森林构建方法。首先,利用上下位与兄弟主题分面相似性,提出基于标签传播的弱监督分面树构建方法。其次,提出“最小补偿集生成-中心度及难度计算-学习序列生成”三阶段认知路径生成算法。最后,提出一种基于匹配策略扩展卷积神经网络的分面标注模型,解决文本碎片化知识装配问题;提出基于小样本学习、基于多实例学习等标注方法实现图像碎片化知识装配。

    研制出碎片化知识聚合系统。主要有以下功能:1)知识主题抽取: 从维基百科、百度百科等高质量数据源中抽取出具有多分面特性的领域术语作为知识主题。2)主题分面树生成及可视化:抽取主题的分面及分面间的从属关系构成主题分面树。3)碎片化知识采集:以中文开放域知识源为对象,对多源分布的碎片化知识进行爬取,通过质量分析抽取高质量的知识碎片。4)知识碎片装配:并将不同分面的碎片化知识装配到主题分面树对应的叶节点上,形成实例化的主题分面树。5)可视化检索可视化:为用户规划一条由认知关系组成的认知路径,实现导航学习。经过第三方测试,主要性能指标为:主题分面树构建的精确率达到80%,召回率大于80%;碎片化知识装配的层次精确率大于80%,层次召回率大于70%。

    本成果在IEEE TIP、AAAI等期刊与会议上发表学术论文7篇,申请发明专利3项,初步形成碎片化知识聚合技术体系。利用所提方法建立8个学科233门高等教育课程知识森林。研制的工具与系统获第21届“中国国际高新技术成果交易会”优秀产品奖。

批准登记号:
登记日期: 2020-04-17
研究起止时间: 2017-01-01至2018-12-31
所属行业: 教育
所属高新技术类别: 电子信息
评价单位名称: 广东省科学技术厅
评价日期: 2020-01-08