赛题一:ICCV 2023 VisDrone Challenge: Object Detection(获冠军奖项)

智能学子斩获ICCV 2023国际顶级竞赛四项冠亚军奖项_模子_冠军 智能助手

由博士研究生“路小强、黄钟健、杨育婷”组成的参赛军队得到了ICCV 2023 VisDrone Challenge: Object Detection赛题冠军。

冠军队伍(路小强、黄钟健、杨育婷)

赛题先容:VisDrone目标检测竞赛旨在促进无人机视觉研究发展,数据集包含由无人机平台在不同地点、多种视角下捕获的10,209张图像,预定义道路中常见的10种目标种别(行人,汽车,卡车,自行车,三轮车等)。

冠军方案:军队基于YOLOv7检测器提出LS-DOD算法,该算法由大规模预演习、大尺寸监督学习以及高效测试增强组成。
为了提升检测器在不同场景下的泛化能力,军队首先在SODA10M数据集中的100万张图像上以半监督学习范式进行预演习。
其次,在迁移学习中通过大幅度动态增大演习尺寸策略以降落眇小目标信息丢失,缓解密集场景目标稠浊。
末了,在测试阶段提出高效测试增强及金字塔加权框领悟算法进行多模型领悟。
以42.713的分数降服了来自北大、清华、MIT、美团等有名团队,刷新了VisDrone目标检测赛题历史记录。
提出的方案办理了无人机视角目标检测中目标密集以及眇小目标无法精准识别的难题。

赛题二:ICCV 2023 MUAD Uncertainty Estimation for Semantic Segmentation Challenge(获冠、亚军奖项)

由2022级硕士研究生“左谊、王子韬、张潇文”和博士生“赵嘉璇”组成的参赛军队得到了ICCV 2023 MUAD Uncertainty Estimation for Semantic Segmentation Challenge赛题冠军;由2022级硕士研究生“王昕怡、彭瑞、张君沛、张柯欣”组成的参赛军队得到了同赛道亚军。

冠军队伍(左谊、王子韬、张潇文、赵嘉璇)

亚军队伍(王昕怡、彭瑞、张君沛、张柯欣)

赛题先容:该赛题旨在评估语义分割模型的不愿定性估计性能。
比赛采取官方供应的MUAD数据集,个中演习集3420张,验证集492张,测试集240张。
所有图像都涵盖了白天和夜间的情形。
一些测试集包含OOD(Out-Of-Distribution)工具或雨、雪、雾等两种不同强度等级的分外景象条件,这将对模型的鲁棒性提出寻衅。
参与者通过演习模型提交类预测图和置信度图,以便决策者找出测试集图像中的OOD工具。

冠军方案:军队利用Swin-L+Mask2Former、InternImage H +Mask2Former和Segformer+MIT-B5作为根本模型进行演习。
由于演习集中缺少恶劣景象条件,军队设计了一种针对恶劣环境的数据增强方法来仿照相应景象状况。
为了提高mIoU与mAUROC两个评估指标分别提出了应对方案。
对付mIoU评估指标,利用集成模型的思想输出预测结果。
对付mAUROC评估指标,通过引入Cityscapes数据集预演习对三个根本模型进行微调,在Segformer模型输出结果的根本上领悟Mask2former模型的输出结果,并提出了一种区域归一化策略。
首先对置信度低于0.6的区域利用均值滤波,然后利用连接域算法将全体图像分割成多个掩模区域。
若置信水平低于0.4的像素中超过50%存在于某个掩模区域,将其定义为分布外区域。
对付该区域中的所有像素,则利用该区域的最小置信度覆盖。
所提出的方案办理了不愿定性语义分割中已知类的精准度与未知类的不愿定性相互滋扰难题。

亚军方案:军队首先在Mask2former、Segformer和UperNet三个模型上利用原始数据集进行演习。
在演习策略上,为了防止过拟合,设置了模型演习的初始学习率为0.00006并成比例修正最大迭代次数。
同时,在对演习集、验证集和测试集进行数据剖析后,在给定的演习集上添加了不同程度的分外景象条件,如雨天、雪天和雾天的效果,该方法显著增强了语义分割模型的鲁棒性和泛化性。
在测试阶段,对三个模型不同阶段的演习结果进行测试并给出了终极结果。
对同一模型的不同结果进行领悟获取类预测结果和置信度结果。
所提出的方案办理了在不愿定性与不利景象条件等繁芜场景下的物体分割问题,实现了更加鲁棒的语义分割。

赛题三:ICCV 2023 The 5th Large-scale Video Object Segmentation Challenge - Track 1: Video Object Segmentation(获冠军奖项)

由2022级硕士研究生“张潇文、王子韬、左谊”组成的参赛军队得到了ICCV 2023 The 5th Large-scale Video Object Segmentation Challenge - Track 1: Video Object Segmentation赛题冠军。

冠军队伍(张潇文、王子韬、左谊)

赛题先容:该赛题在仅供应***第一帧分割物体mask的条件下,哀求参赛者对整段***中的一个或多个物体进行分割。
比赛数据集采取常见的***数据集YouTubeVOS和一个新提出的数据集VOST。
个中,VOST数据集中包含的物体是由破碎、撕裂和合成等操作而形成的,极大地改变了物体的整体外不雅观,使得全体比赛任务具有极大的寻衅性。

冠军方案:基于前期对实例分割模型机理的剖析,创造虽然memory-based方法能够通过平移和变形引起的眇小变革来分割物体,但对付更具寻衅性的变换分割效果较差。
因此,以半监督***实例分割的SOTA模型AOT为根本,将演习序列的长度由5帧增加到10帧。
但由于该模型不具备利用长期韶光线索的能力,难以提升效果。
我们提出采取recurrent transformer更换短期影象模块来增加模型的时空建模能力。
末了,军队通过以15fps进行评估并启用多尺度推理,在测试时显著提高了模型的韶光和空间分辨率。
所提出的方案打破了长***序列中后段***分割结果较差的技能难题,显著提升了长***序列中目标跟踪能力和分割性能。

ICCV,全称IEEE International Conference on Computer Vision (国际打算机视觉大会)由IEEE主理,在世界范围内每两年召开一次。
其与打算机视觉模式识别会议(CVPR)和欧洲打算机视觉会议(ECCV)并称打算机视觉方向的三大顶级会议。
西安电子科技大学人工智能学院焦李成院士团队在遥感领域有30多年的履历积累,智能学子们也屡次在IGARSS、CVPR、ICCV、ECCV等多项国际顶会赛事中斩获冠亚季军奖项达百余项。
学院人才培养效果显著。
在国际最高赛事中拼搏,通过“赛中学”不仅能够让学生快速理解该领域的干系知识,引发学生科研的动力,同时也磨炼了团队学生的组织折衷能力、写作能力与生理抗压能力。

(通讯员:杨育婷、王昕怡、黄思婧、张丹)