业界|23篇论文入选CVPR2017，商汤科技精选论文解读【开云(中国)Kaiyun】

新闻动态

电话：400-123-4567
地址：广东省广州市天河区某某工业园88号
Q Q ：1234567890
手机：138000000000
邮箱：admin@youweb.com

行业新闻

您当前的位置: 首页 > 新闻动态 > 行业新闻

业界|23篇论文入选CVPR2017，商汤科技精选论文解读【开云(中国)Kaiyun】

作者：开云(中国)Kaiyun 发布时间：2024-10-06 03:23:43 浏览：次

本文摘要：2017 年 7 月 11 日，专心于计算机视觉和深度自学的国内人工智能企业商汤科技已完成 4.1 亿美元融资的消息爆炸业内。

2017 年 7 月 11 日，专心于计算机视觉和深度自学的国内人工智能企业商汤科技已完成 4.1 亿美元融资的消息爆炸业内。本次融资刷新了全球人工智能公司单轮融资的最低纪录。

作为一家专心于计算机视觉和深度自学的新一代公司，在将要来临的世界顶级计算机视觉会议CVPR（7月21日-26日，美国夏威夷）上，商汤科技也将带给一系列的技术Demo、Presentation、PartyTime等活动。在本届CVPR 2017 大会上，商汤科技及香港中大-商汤科技牵头实验室共计23篇论文被接管。

入学论文中少有新奇有意思的题目，详尽内容青睐到会场和作者深度交流。因图而异的融合网络 - Quality Aware Network for Set to Set Recognition图像质量差异辨识难题示意图在人脸识别、人体再行辨识任务中，输出的数据一般来说是每张人脸或每个人体的多张图像包含的序列。现有的方法利用卷积神经网络对一个序列中的所有图像分别萃取特征，再行将特征展开非常简单的平均值或池化，作为该序列的最后特征用作之后的辨识。但实际应用于场景中一个序列中的图像有可能在许多方面不存在着较小差异，例如光照、清晰度、角度等，如示例图。

由于在融合序列的特征时没考虑到这些差异，上述方法在实际应用于场景用会不受这些因素的影响从而无法超过理想的效果。本论文明确提出了一种新的序列给定方法，充分考虑了序列内图像的差异性，并利用深度自学的方法对这种差异性展开无监督的自学，再行根据自学到的质量差异性对序列中的图像特征展开融合，最后获得具备较高判断力的序列特征，解决问题光照模糊不清等一系列实际应用于中的问题。以自然语言搜人 - Person Search with Natural Language Description以自然语言叙述来展开人的检索大规模图像库检索有十分大的行业意义，一般来说萃取图像属性特征再行通过属性检索来寻找目标。

但是常用场景比如嫌疑犯叙述都是通过自然语言叙述（人类能解读的语言）。本论文明确提出了用于自然语言叙述展开人的大库检索，如上图右图，自然语言叙述为“这位妇女穿著一件长而亮的橙色长袍，腰上系由着一条白色腰带。

她把头发挽成一个发髻或马尾辫。”这样的叙述要比用属性来的非常丰富的多。这个系统定位人体图像明显视觉区域，同时把有意义的文本叙述短语彰显明显的视觉区域。通过自学图像-语言关系，系统可以精确获得自然语言查找和相近度分数，从而大大提成查找准确率和效率。

融合人类视觉注意力 - Residual Attention Network for Image Classification首次顺利将极深卷积神经网络与人类视觉注意力机制展开有效地的融合视觉注意力机制是人类视觉所特有的大脑信号处理机制。人类视觉通过较慢扫瞄全局图像取得必须注目的目标区域，而后重点提供所必须注目的目标信息，诱导其他无用信息。人类视觉注意力机制很大的提升了视觉信息处理的效率与准确性。

注意力机制早已在自然语言处置中获得了根本性顺利。但在计算机视觉任务中，如何将视觉注意力机制有效地的映射到神经网络结构并提高网络性能沦为亟待解决的问题。Residual Attention Network，在图像分类问题上，首次顺利将极深卷积神经网络与人类视觉注意力机制展开有效地的融合，并获得了近超强之前网络结构的准确度与参数效率。

仅用与ResNet-50的非常的荐数量和计算出来量就获得了远超过了ResNet-152的分类性能。今年ImageNet检测冠军团队早已在LOC任务轻用于了本文的机制。模型、参数等都可以参照网站商汤科技PartyTimeCVPR 2017 会议期间商汤将牵头香港中文大学牵头实验室联合主办一场SenseTime PartyTime活动。

该活动目的为计算机视觉领域的研究人员和学生获取交流机会，并且不会有业内大咖共享近期研究成果。活动时间： 7月24日下午12:00-16:00pm活动地点：THE MODERN HONOLULU, Honolulu, Hawaii序言商汤科技及香港中大-商汤科技牵头实验室共计23篇论文被接管，附上CVPR2017上Session时间 1)Multi-Context Attention for Human Pose Estimation- Saturday, July 22, 2017，09：00–10：302)Multi-Scale Continuous CRFs as Sequential Deep Networks for Monocular Depth Estimation - Saturday, July 22, 2017，09：00–10：303)Accurate Single Stage Detector Using Recurrent Rolling Convolution - Saturday, July 22, 2017，10：30–12：304)Mimicking Very Efficient Network for Object Detection - Saturday, July 22, 2017，10：30–12：305)Object Detection in Videos with Tubelet Proposal Networks - Saturday, July 22, 2017，10：30–12：306)Spindle Net: Person Re-identification with Human Body Region Guided Feature Decomposition and Fusion.- Saturday, July 22, 2017，10：30–12：307)Discover and Learn New Objects from Documentaries- Saturday, July 22, 2017，13：30–15：008)Learning object interactions and descriptions for Semantic Image Segmentation - Saturday, July 22, 2017，13：30–15：009)Learning Spatial Regularization with Image-level Supervisions for Multi-label Image Classification Saturday, July 22, 2017- 15：00–17：0010)Scale-Aware Face Detection - Saturday, July 22, 2017，15：00–17：0011)Interpretable Structure-Evolving LSTM - Sunday, July 23, 2017，08：30–10：0012)Detecting Visual Relationships with Deep Relational Networks - Sunday, July 23, 2017，13：00–14：3013)Joint Detection and Identification Feature Learning for Person Search - Sunday, July 23, 2017，13：00–14：3014)Learning Cross-Modal Deep Representations for Robust Pedestrian Detection - Sunday, July 23, 2017，14：30–16：3015)PolyNet: A Pursuit of Structural Diversity in Very Deep Networks - Sunday, July 23, 2017，14：30–16：3016)Pyramid Scene Parsing Network - Sunday, July 23, 2017，14：30–16：3017)Person Search with Natural Language Description - Monday, July 24, 2017，10：00–12：0018)Quality Aware Network for Set to Set Recognition - Monday, July 24, 10：00–12：0019)UntrimmedNets for Weakly Supervised Action Recognition and Detection - Tuesday, July 25, 2017，10：00–12：0020)Not All Pixels Are Equal: Difficulty-Aware Semantic Segmentation via Deep Layer Cascade - Tuesday, July 25, 2017，13：00–14：3021)Residual Attention Network for Image Classification - Tuesday, July 25, 13：00–14：3022)ViP-CNN: A Visual Phrase Reasoning Convolutional Neural Network for Visual Relationship Detection- Tuesday, July 25, 2017，1430–163023)Look into Person: Self-supervised Structure-sensitive Learning and A New Benchmark for Human Parsing - Tuesday, July 25, 2017，14：30–16：30原创文章，予以许可禁令刊登。下文闻刊登须知。

本文关键词：开云(中国)Kaiyun,开云(中国)Kaiyun·官方网站-登录入口

本文来源：开云(中国)Kaiyun-www.xian6.cn