成果名称: 多示例多类标数据流识别模型的构建及其在南方特色作物长势监测中的应用研究
完成单位: 华南农业大学
主要人员: 宋歌,张大斌,张建桃,熊俊涛,刘昌余,韦婷婷
介绍:

    1、 课题来源与背景: 真实世界学习对象的隐私保护、多义性、实时性等问题,造成了挖掘和分析的困难,需要更安全的收集数据,更全面的表述能力,更加复杂的学习框架进行挖掘分析,这也成为信息检索、数据挖掘和人工智能等领域的研究难点。本课题的研究正是在这一背景下提出的。

    2、 研究目的与意义: 大数据时代,人们希望通过海量的图文声像等各种类型的数据,从多个角度全面动态的了解对象(事件)的细节,并挖掘背后的深刻概念,传统的静态单一语义学习框架难以取得良好效果。只有通过对多方数据进行实时的安全的挖掘分析,发现其潜在内涵和关联性。 通过前期的研究和分析发现,实际应用中的学习对象突破了时间和空间的限制,具有以下三个特点:语义多义性、实时性、安全性。以上问题给识别方法研究的挑战可以归纳为:在概念漂移的环境下,如何在保证隐私的情况下安全的收集数据,学习对象的复杂语义,建立能自适应动态更新的识别模型,使之能从海量的数据流中在线学习并优化学习器。本课题围绕着这个关键科学问题展开研究。

    3、 主要论点与论据: 本课题需解决以下科学问题:复杂概念的多义性表征和动态识别问题。项目组在实际研究中,在解决以上科学问题的同时,对研究内容进行了扩充,主要包括以下几个方面: (1)安全地搜集数据。如何安全地获取可供实验分析的数据,且不窥窃用户隐私一个关键问题。为此,课题组在第一阶段的工作中,提出了基于流程的加密方法和基于属性的加密方法等关键算法,既保证了数据的获取,又使数据提供商不担心所提供的数据暴露用户的隐私。 (2)建立聚类树,使之在准确的识别作物生长特征同时,表征作物特征与语义关系。 (3)基于精度权重的概念漂移检测方法和自适应选择策略。

    4、 创见与创新: (1)课题组提出的大数据隐私保护问题,作为数据收集的重要一环,具有重要的现实意义,真正实现数据资源的共享。针对基于隐私保护的数据收集问题。 (2)建立基于集成学习的聚类树。 (3)基于精度权重的概念漂移监测方法,通过精度权重来评估子树对当前数据块的性能,合理选择最优子树。

    5 、社会经济效益,存在的问题: 研究的关键技术数据流的安全动态识别模型,结合了信息安全领域和数据挖掘领域,为数据挖掘领域增加了一种新的方法,为政府制定农业政策措施提供了决策依据;为农业专家系统的建立、精确农业的发展提供了数据流挖掘领域的技术支撑,并应用到农业信息化建设中,为农情信息管理关键技术的研究提供算法。其学术价值和社会价值都显而易见。 存在问题:该技术属于前沿技术,还没有被广大用户真正接受,给技术推广带来一定难度。

    6、 历年获奖情况: 无。

批准登记号:
登记日期: 2024-07-09
研究起止时间: 2017-01-01至2019-12-31
所属行业: 信息传输、软件和信息技术服务业
所属高新技术类别:
评价单位名称: 广东省科学技术厅
评价日期: 2020-05-20