成果名称: 视觉大数据的深度分析与挖掘技术研究与产业化
完成单位: 中国科学院深圳先进技术研究院、香港中文大学
主要人员: 乔宇、汤晓鸥、李志锋、王晓刚、陈世峰、Chen Change Loy、黄韡林
介绍:

    项目团队以深度学习方法作为主要工具,在海量复杂视觉信息的表示方法与识别术领域取得多项进展。主要研究内容包括一下几个方面:

   1、在复杂场景下的人脸和文字检测方法研究方面:1)研究了复杂场景下人脸的检测方法,场景中文字的检测与识别方法。在人脸检测领域提出了MTCNN方法,在文本检测领域提出了CTPN方法。2)在文本检测技术方面, 针对文本具有序列的性质,我们设计了一种网络Connectionist Text Proposal Network (CTPN)去检测文本。通过修改RPN, 使RPN可以精确地定位文本行。因其能直接从特征图上检测最终的文本组件,不需要额外的CNN去进一步处理,因此本方法速度较快。

   2、在场景的识别与理解方法研究方面:我们研究开发了面向复杂多类别场景图像的分类方法。我们的方法在ImageNet15场景分类任务中取得第二,在LSUN16场景分类任务中取得第一。

   3、在人像识别方法方面:1)我们提出了聚集惩罚函数(Center Loss)来进行联合监督,该方法在数据著名数据集LFW和YTF上进行测试,在仅仅70万训练数据的情况下,我们的单模型识别效果在LFW数据库上超过了99.2,在YTF数据库上超过了94%。而其他人方法则需要通过大量的训练数据或者多模型融合,如Google的2亿数据和DeepID2+的25个模型。2)在跨年龄人脸识别方面,我们提出了一种基于隐因子引导的卷积神经网络(Latent Factor Guided Convolutional Neural Networks, 简称 LF-CNNs),在世界知名数据集Morph Album 2、FG-Net等上取得国际领先的结果。

批准登记号: 粤科成登(2)字【2018】0151
登记日期: 2018-04-16
研究起止时间: 2015.01 至2017.08
所属行业: 信息传输、软件和信息技术服务业
所属高新技术类别: 电子信息
评价单位名称: 广东省科技厅
评价日期: 2017.12.20