你想知道的这都有!一文带你快速理解计算机视觉_视觉_技巧
近日,清华大学人工智能研究院、北京智源人工智能研究院和清华-中国工程院知识智能联合研究中央共同发布了《人工智能之打算机视觉》报告。
我们选取打算机视觉作为本期 TR 报告的主题,环绕打算机视觉的基本观点、技能发展、家当运用、人才概况和热点趋势五大方面进行深入挖掘。
报告的论文、国家自然科学基金、趋势数据均来自于清华大学唐杰教授自主研发的“科技情报大数据挖掘与做事系统平台”(简称 AMiner),通过人工智能、大数据剖析与挖掘、知识图谱、自然措辞处理等技能,并结合文献计量学等情报学方法制作天生。
接下来,我们将通过回答大家可能感兴趣的问题,为读者展示本次报告的亮点内容。
Q1 什么是打算机视觉?
打算机视觉是指用打算机实现人的视觉功能——对客不雅观天下的三维场景的感知、识别和理解。它是一种范例的交叉学科研究领域,包含了生物、生理,物理,工程,数学,打算机科学等领域,存在与其他许多学科或研究方向之间相互渗透、相互支撑的关系。
Q2 打算机视觉紧张完成哪些任务?
打算机视觉的内涵丰富,须要完成的任务浩瀚,关键任务包括:图像增强、图像分类、图像检测与定位、图像分布、目标识别。
图像增强
图像增强处理可以有效去除图像噪声、增强图像边缘,突出图像中所需的主要信息,去除或弱化不主要的信息,达到改进图像的视觉质量的效果,更适宜人的不雅观察或机器的识别。
图像分类图像分类是目标检测、语义分割的主要支撑,其目标是将不同的图像划分到不同的种别,并实现最小的分类偏差。如今,图像分类的运用在我们的生活中随处可见,如智好手机的相册自动分类、产品毛病识别、无人驾驶等等。
图像检测和定位物体检测为许多视觉任务供应了动力,例如实例分割,姿势估计,追踪和动作识别。它在监视,自动驾驶和视觉问答中具有下贱运用。
图像分割对付一张图来说,图上可能有多个物体、多个人物乃至多层背景,希望能做到对付原图上的每个像素点,能预测它是属于哪个部分(人、动物、背景……)。
目标识别目标识别的目的在于判断场景(二维图像、***或三维图像)中是否存在感兴趣目标,若存在则对其位置和姿态等信息进行估计,是打算机视觉中非常主要的一个研究方向。
Q3 打算机视觉领域有哪些大佬?他们都在哪里?
在环球范围内,打算机视觉的顶尖学者紧张分布于东亚、北美以及欧洲,此外,南美、澳大利亚等地亦有部分学者分布。
在我国,领域学者大部分聚拢于北京地区。与此同时,江苏、上海、辽宁、湖北、广东等地同样分布着可不雅观数量的打算机视觉领域学者。北京地区学者紧张聚拢在以北大、清华、亚洲微软研究院为首的海淀人才搜集地,人才密度可谓在世界范围内都压倒一切,为该领域的发展供应了强大的人才保障。此外,喷鼻香港、深圳、广州等城市在发展打算机视觉家当上各具上风及特色,从研发成果家当化的角度看,喷鼻香港有较顶尖的人才储备,而深圳有强大的科创军队,广州则具备很强的家当化能力。
打算机视觉代表性学者包括 Trevor Darrell, Ross B. Girshick, Christian Szegedy, Li Feifei 等。本报告参照 AI 2000 人工智能环球最具影响力学者榜单,网络整理了历届得到过 AI 2000 打算机视觉子领域的学者,通过“学者画像”的办法进行展示,其余还包括了学者的基本信息、AMiner 获奖信息、研究兴趣和干系代表性论文等。
Q5 打算机视觉技能的紧张运用领域有哪些?
打算机视觉技能为很多场景供应了全新的办理方案,本报告紧张从城市公共安全、政务民生、金融做事、新零售等方面详解了打算机视觉是如何运用的。
城市公共安全
伴随着人工智能软硬件技能的不断发展,打算机视觉技能早已打破了肉眼精度的图像识别,并广泛运用于城市公共安全领域,包括:车辆识别、安防监控、刑侦追逃、罪犯识别、边防安全检讨、金融安保、交通监管、监狱职员管理等诸多场景。
政务民生
目前,打算机视觉技能在政务民生场景的运用已涌如今审批、核准、备案、证明等多项行政权力办理事宜中。企业和个人在线申请,政府在线办理,全面实现网上政务公开和互动互换等便民运用,同时基于大数据的人工智能,助力政府制订更加精准、灵巧、前置性的决策方案。
金融做事
金融做事与打算机视觉等其他人工智能技能深度领悟已发成为金融做事行业的常规业态,利用打算机视觉技能验证用户身份,可以在担保安全性的根本之上,大幅降落核验本钱。
新零售
打算机视觉技能在新零售领域紧张有三方面的运用。
一是用于面部识别。紧张是识别用户性别、年事范围、浏览记录、浏览习气等基本个人信息,提醒做事供应商和零售商把稳及时反应,达到识别老顾客、收成忠实度、提升广告投放回报率的效果。二是实现“货架数字化”,推动货架生态变革。零售企业通过打算机视觉技能,实时监控货架上发生的情形,并对缺货、调货等做出反应。三是实现个性化、定制化的营销互动。利用人脸识别、手势识别、图片处理等技能,实现与用户在多种营销场景下的互动,让营销更趋人性化,使得视觉成为品牌连接用户的新流量入口。Q6 打算机视觉的未来趋势如何?
报告通过领域技能剖析系统(https://analysis.aminer.cn/),基于 AMiner 的 3 亿篇论文进行深度挖掘,全面剖析了打算机视觉领域的技能趋势、国家趋势、机构趋势等。
技能趋势:
国家趋势:
机构趋势:
当前,我国打算机视觉技能快速发展,研究热度位居环球首位。技能的发展也带来了就业构造、个人隐私、社会准则等多方面的的问题。我国在大力发展打算视觉技能的同时,技能带来的风险与寻衅也同样不容小觑。
参考文献:
[1] Deng J, Dong W, Socher R, et al. Imagenet: A Large-scale Hierarchical Image Database[C]//2009 IEEE Conference on Computer Vision and Pattern Recognition IEEE, 2009: 248-255.
[2] Masi I, Wu Y, Hassner T, et al. Deep Face Recognition: A Survey[C]//2018 31st Sibgrapi Conference on Graphics, Patterns and Images (SIBGRAPI), IEEE, 2018: 471-478.
[3] Ren S, He K, Girshick R, et al. Faster R-CNN: Towards Real-time Object Detection with Region Proposal Networks[C]//Neural Information Processing Systems, 2015: 91-99.
[4] Comaniciu D, Ramesh V, Meer P. Kernel-based Object Tracking[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2003, 25(5): 564-577.
[5] Brox T, Bruhn A, Papenberg N, et al. High Accuracy Optical Flow Estimation Based on a Theory for Warping[C]//European Conference on Computer Vision, Springer, 2004: 25-36.
[6] Izadi S, Kim D, Hilliges O, et al. Kinectfusion: Real-time 3d Reconstruction and Interaction Using a Moving Depth Camera[C]//Proceedings of the 24th Annual ACM Symposium on User Interface Software and Technology, 2011: 559-568.
本文系作者个人观点,不代表本站立场,转载请注明出处!