视觉大数据的深度分析与挖掘技术研究与产业化

成果名称:	视觉大数据的深度分析与挖掘技术研究与产业化
完成单位:	中国科学院深圳先进技术研究院、香港中文大学
主要人员:	乔宇、汤晓鸥、李志锋、王晓刚、陈世峰、Chen Change Loy、黄韡林
介绍:	项目团队以深度学习方法作为主要工具，在海量复杂视觉信息的表示方法与识别术领域取得多项进展。主要研究内容包括一下几个方面： 1、在复杂场景下的人脸和文字检测方法研究方面：1）研究了复杂场景下人脸的检测方法，场景中文字的检测与识别方法。在人脸检测领域提出了MTCNN方法，在文本检测领域提出了CTPN方法。2）在文本检测技术方面，针对文本具有序列的性质，我们设计了一种网络Connectionist Text Proposal Network (CTPN)去检测文本。通过修改RPN, 使RPN可以精确地定位文本行。因其能直接从特征图上检测最终的文本组件，不需要额外的CNN去进一步处理，因此本方法速度较快。 2、在场景的识别与理解方法研究方面：我们研究开发了面向复杂多类别场景图像的分类方法。我们的方法在ImageNet15场景分类任务中取得第二，在LSUN16场景分类任务中取得第一。 3、在人像识别方法方面：1）我们提出了聚集惩罚函数（Center Loss）来进行联合监督，该方法在数据著名数据集LFW和YTF上进行测试，在仅仅70万训练数据的情况下，我们的单模型识别效果在LFW数据库上超过了99.2，在YTF数据库上超过了94%。而其他人方法则需要通过大量的训练数据或者多模型融合，如Google的2亿数据和DeepID2+的25个模型。2）在跨年龄人脸识别方面，我们提出了一种基于隐因子引导的卷积神经网络（Latent Factor Guided Convolutional Neural Networks，简称 LF-CNNs），在世界知名数据集Morph Album 2、FG-Net等上取得国际领先的结果。
批准登记号:	粤科成登（2）字【2018】0151
登记日期:	2018-04-16
研究起止时间:	2015.01 至2017.08
所属行业:	信息传输、软件和信息技术服务业
所属高新技术类别:	电子信息
评价单位名称:	广东省科技厅
评价日期:	2017.12.20

中国未来研究会广东省技术经济研究发展中心广东省科学技术协会广东省科学技术厅