「专家有料」人工智能进修:让猫和鸟教你读懂卷积神经收集_卷积_神经收集
作者:华为人工智能高等讲师 王豪聪
华为人工智能专业培植首席架构师 张志峰
随着打算机技能的不断发展,网络上的图像数据越来越多。根据GIV组织的预测,到2025年,所有网络数据中89%是图片(视频)数据。因此,图像处理技能变得越来越主要。在浩瀚图像处理算法中,卷积神经网络是最主要的一种,被大量运用于打算机视觉、自然措辞处理等人工智能领域 。
什么是卷积神经网络?听到“卷积”、“神经网络”,你脑海中大概会浮现下面的场景:
是的,这是卷积核在打算机中运算时的样子,但我们将用另一种直白易懂的办法来理解这个过程。
你可以想象这样一个场景:有一只猫和一只鸟,你将如何差异它们呢?
面对这个问题,你的第一反应是什么?“鸟有翅膀”、“猫有四条腿”、“它们的尾巴不同”、“鸟的嘴是尖的,猫不是”等等。实际上,这是对我们人类认知系统最大略的一次测试。从中我们可以创造,任何一个物体都因此一个个最大略的特色存储在我们的认知系统中。须要对事物进行判断时,认知系统会首先给出一个最大略的差异特色,这也是认知系统的事情办法——化繁为简:以每个特色为最小单位进行差异,从局部到全局进行特色提取并匹配,终极得出一个认知结果。
通过卷积核探求特色
上面这张图便是一个大略的卷积神经网络的架构图。我们可以将一个个卷积核理解为一个个特色,图中K1,K2……Kn代表不同的卷积核也便是不同特色。回到刚才的场景中,假设这个神经网络实现的功能便是对鸟和猫进行区分。那么卷积核K1可能代表 “翅膀”,卷积核K2可能代表“嘴巴”,卷积核Kn可能代表“爪子”,当一张图片进入到这个认知系统,一个个卷积核会去处理这个图片,探求其代表的特色。从图片的左上角一步步,一行行移动并匹配特色,探求图片中与目标特色相似的位置,输出一张特色图片,图片中的每个点都代表图中每个区域是否有我们要找的那个特色。如下面这张图,这是一张卷积后的特色图,图中每个点代表原区域与特色的相似程度,数值越高,相似程度越高。
池化层加工提炼
卷积层之后常日会跟一层池化层,并进行下图的操作。
从图中可以看出,经由池化层,我们仅保留各自池化区域中数值最大的部分,将4X4的图片缩小成2X2的图片。在卷积神经网络中,池化层也是非常主要的。试想一下,如果卷积后的结果代表着与特色的相似程度,而我们认知、分类的关键便是特色,那么我们只要找到最具特色的部分进行处理,筛选出主要部分即可。同时,通过池化层缩小尺寸后,也减少了神经网络的打算量。
池化层还有一个关键浸染便是扩大了卷积核的浸染范围。试想一下,当对上图2X2的特色图再次进行卷积时,就相称于对原4X4的图片进行了卷积,这使得在多次池化后,我们要探求的特色可能不是“局部”细节特色而是“全局”的风格特色或轮廓特色,这也给我们的神经网络供应了更强的稳定性。
经由以上两步,一张图片的紧张特色已经被我们提取出来了。现在认知系统知道这个图片中“有翅膀”、“有爪子”、“有尖尖的嘴巴”。那么下一步如何根据这些结果剖析出这张图是属于鸟还是猫呢?
全连接层进行分类这时,全连接层的浸染就显现了——分类!
如果我们将具备一种特色标记为1,不具备该特色标记为0,如上图所示。那么猫的种别便是0101,鸟的种别便是1110。这便是全连接层的浸染:将我们提取出的特色进行汇总分类,来完玉成部认知系统的末了一步。
当然,一个真正的卷积神经网络要比我们假设的场景要繁芜得多,每一个卷积层和池化层都包含了大量的神经元构造,我们也会运用更多种类的卷积核和其他正则化方法来提高网络的能力。
如今,全天下的学者也提出了很多经典的卷积神经网络模型,如:Resnet,VGG16,inception V3等。但神经网络最核心的特点还是以卷积核为根本,分解输入数据为一个个特色,从而由局部至整体对数据进行剖析。也正是卷积神经网络的这个优点,使得它在图像领域取得了非常瞩目的造诣。同时,卷积神经网络对旋转、缩放、位移的鲁棒性使得它对数据特色的剖析、处理得非常准确,使其运用也已经开始向其他领域拓展,如:字符识别、语音识别等。
看完利用卷积神经网络对猫和鸟进行分类,是不是以为能秒懂高大上的人工智能技能?在华为AI认证的课程中,我们将深入浅出地讲解包括卷积神经网络在内的有关人工智能的各方面的知识,让你学到人工智能的踏实理论并运用到实践中。
理解华为人工智能认证干系知识,请点击下方扩展链接。
本文系作者个人观点,不代表本站立场,转载请注明出处!