本篇文章1001字,读完约3分钟

CVPR是计算机视觉领域三大世界顶级会议之一。不久前,CVPR 2022举办,线下注册参会人数达到了5641人,接收了2064篇论文投稿,研究方向涵盖目标检测、图像分割、医学影像、模型压缩、图像处理、文本检测等。其中,浪潮信息AI团队提交的论文《CoDo: Contrastive Learning with Downstream Background Invariance for Detection (CoDo:在自监督学习中引入下游数据的背景不变性)》成功入选。

浪潮信息AI团队提交的论文提出了一种新的自监督学习框架,在自监督学习的预训练过程兼顾下游数据的背景不变性,以提升自监督学习在下游目标检测任务的性能,并通过初步实验证明了方法的有效性。自监督学习可以对海量数据进行自主学习,无需像监督学习那样进行复杂的数据标注,有望改变自动驾驶等数据生成量巨大、标注成本高昂行业的工作模式,因此被认为是计算机视觉领域中有望带来突破的重点方向。

浪潮信息”

目前,虽然基于对比学习的自监督学习方法在图像分类任务上取得了与监督型学习相近甚至更优的性能,但是将其应用于下游任务如目标检测时,常常会出现明显的性能差距。浪潮信息AI团队提出的自监督学习框架CoDo,在预训练中引入上下游任务数据集充当背景,预训练图像的推荐框粘贴到背景图像上,边框经过比例变换及扰动后,作为增强样本参与对比学习。该论文采用了CPJ数据增强方法、目标检测结构对齐及层次对比学习构建,并通过初步实验证明了方法的有效性。在实验中,研究团队使用浪潮AI服务器NF5488A5作为模型训练平台,使用COCO数据集以R50-FPN作为backbone的Mask R-CNN的目标检测与语义分割性能进行分析。

另外,研究团队还评估了CoDo中Query Network和Key Network的背景数据集的选择策略。实验发现,相比于两路引入不同数据集,引入相同数据集性能更优,同时引入数据集的多样性也对下游任务的性能有贡献。目前,该论文已被CVPR 2022 L3D-IVU Workshop接收,本届L3D-IVU Workshop的主题为利用有限标签数据实现图像及视频的学习理解。

浪潮信息作为引领全球的人工智能计算领导品牌,一直在致力于打造敏捷、高效、优化的人工智能基础设施。在未来,浪潮信息将继续聚焦AI领域,加大研发力度,促进AI产业化落地。


标题:浪潮信息AI团队提交新型自监督学习框架论文,成功入选CVPR 2022

地址:http://www.9u2j.com/wnylyw/33929.html