人工智能让遥感数据释放巨大潜能：人口普查中的人工或将被取代_模子_社会经济

2024-12-22 19:07:50 智能写作

机器之心编辑部

采取卷积神经网络（CNN）和卫星图像数据来预测区域收入水平的方法已经越来越广泛，部分方案正在考试测验逐步商业化以推向市场。
但由于 CNN 的「黑盒」特点，大多数模型并不能阐明其预测的背落后程。
近期的一项研究采取热力争 Grad-CAM 对神经网络进行可视化，进一步探索了这些预测背后的逻辑，让人们对这些模型的可靠性产生了疑惑——在预测过程中是否采取了相似的特色，以及这些特色与收入水平的干系性。
近年来，无论是劳动力的迁移，还是教诲和住房等资源的分配问题，背后都少不了对付城市化进程的思考，持续加速的城市化进程无疑对城市的社会经济环境产生了深远的影响，如何定量地监测和剖析这一过程已经成为城市方案和城市环境研究领域的主要课题。
日益前辈的遥感和卫星技能已经为不雅观察特定地区的地理数据以及与城市化研究铺平了道路。
通过人造卫星、飞机或其他翱翔器上网络地物目标的电磁辐射信息，可判认该地区的地理环境和资源分布。
例如城市人口密集程度和道路培植情形采集，人口的经济特色丈量等。
随着多源、高精度遥感数据量的激增，传统的人工判读和半自动化软件解译的办法使其在效率和准确度打上折扣。
而采取人工智能和高分辨率遥感可以说是天作之合，基于机器学习算法长于办理海量数据剖析问题的特点，能够大幅缩短遥感图像解译周期、提高解译精准度。
事实上，采取卷积神经网络（CNN）和卫星图像数据来预测区域收入水平的方法已经越来越广泛，部分方案正在考试测验逐步商业化以推向市场。
比如在短缺经济生存可靠数据的发展中国家，基于高分辨率卫星图像来估计消费开支和财产财富无疑是一种精确、低廉和可升级的选择，将对当地政府的政策和方案决策带来主要参考。
「这类方案的基本思路是通过建模并提取与收入密切干系的特色进行预测。
但我们的研究表明，事实可能并非如此，以是须要更为深入地理解 CNN 是如何将视觉特色整合到预测模型中的。
」研究职员 Jacob Levy Abitbol、Ma´rton Karsai 说道。
Abitbol & Karsai 分别来自法国里昂高档师范学院 (ENS) 和匈牙利中欧大学(CEU)，近日他们联合开拓了一个神经网络模型，以实现从航拍图像中预测给定地点的社会经济状况，进而根据潜在的城市拓扑构造阐明其激活图，从而缩小基于城市拓扑构造和高分辨率的社会经济舆图之间预测的差距。
该研究证明了卷积神经网络（CNN）针对卫星图像数据深入剖析的潜能。
图 1：巴黎地区实际统计（左）和算法预测（右）的人均收入舆图比拟。
每个像素代表 4000 平方米，颜色深浅代表不同地区居民的社会经济均匀水平。
来源：Abitbol & Karsai.
该研究的终极目标是通过剖析某一地区当前的卫星 / 航空图像来网络有关该地区经济发展的数据，从而逐步替代人工网络的人口普查数据。
在空想情形下，该模型须要具备可概括、可理解特点，即在区域 A 上演习出的模型该当在区域 B 上产生同等的结果，并且确保模型采取了精确的旗子暗记。
该研究采取法国城市的航拍图像进行演习，通过 MBConv 模块提取特色图，经由全局均匀池化层（GAP）和密集层打算出单个 p 值。
由此，从二项式分布中得出每个社会经济阶层的概率，预测该地区居民社会经济地位的能力。
研究的图像数据紧张基于三类公开数据集，提取了五个法国城市在社会经济和地皮利用数据方面的完全数据及航空图像：
由国家地理信息研究所 (IGN) 供应的法国市政的航拍照片；
由法国国家统计和经济研究所 (INSEE) 供应的高分辨率的社会经济舆图 (2019 年)；
由欧洲环境署供应的欧盟城市舆图集 (2012 年)，包含欧盟 28 个国家和欧洲自由贸易区 22 个国家。
数据集均可在线访问：
https://geoservices.ign.fr/documentation/diffusion/telechargement-donnees-libres.html#ortho-hr-sous-licence-ouverte
https://www.insee.fr/fr/statistiques/4176290?sommaire=4176305
https://land.copernicus.eu/local/urban-atlas/urban-atlas-2012
巴黎某一区域内的数据采集样本：a. 遥感 / 航拍图像；b. 收入的空间分布；c. 功能的空间分布。
该研究的代码现已开放，可免用度于非商业用场：
https://doi.org/10.5281/zenodo.3906063
论文地址：
https://arxiv.org/abs/2004.04907
在研究初期，须要探求一个最佳的影像空间分辨率以建立可用的算法模型，Abitbol & Karsai 在 CNN 模型上取得了不错的结果。
但随着算法进一步被测试，Abitbol & Karsai 创造其每每是被一些与收入或社会经济地位并非密切干系的城市特色激活。
例如，由于公共及商业场所的灯光明亮，经济发达的城市地区常日在夜晚具有较强的照明强度，但是模型优先考虑的是居民区的其他功能。
于是，他们开始疑惑这些模型在预测不同地区的收入水平时是否采取了相似的特色，以及这些特色与收入水平的干系性。
只管针对卫星图像推断地区经济收入状况的深度学习模型不在少数，但大多数并不能阐明其预测的背落后程。
这很大程度上取决于卷积神经网络自身的技能特点——通过理论推导，以及梯度传播，去不断逼近局部最优解。
但 Abitbol & Karsai 仍试图阐明其模型的预测结果，以便更好地理解它是如何为每一幅图像推断出特定的收入。
为此，Abitbol & Karsai 采取热力争 Grad-CAM 对神经网络进行可视化，以研究模型的可阐明性，即通过热力争的权重形式来展现，神经网络对图片的哪一部分激活值最大。
基于航拍图像（a），利用 Grad-CAM 打算出最穷苦地区（b）和最富余地区（c）的社会经济阶层的热力争；将热力争与航拍图进行叠加演习 CNN，得出城市功能区域的多边形图（d），打算出最贫穷地区（e）和最富余地区（f）的标准化激活比率。
（ UA: urban area; DUF: discontinuous urban fabric）
通过将高分辨率的类判别激活图投射到原始舆图上，并与地皮利用数据叠加，以天生履历统计的特色，使模型更为准确地预测该地区在社会经济地位方面的地皮利用种别。
这一方案让社会经济地位的预测范围更加广泛，同时也精确地指出了预测城市环境的真实特色。
此外，它还供应了不同的城市在城市拓扑构造和财富分配之间的关联模式。
该研究创造，在推测社会经济地位的过程中，CNN 模型忽略了地皮利用和社会经济数据之间的现有干系性，而紧张关注包含在居民区内的特色。
这一创造为预测的实际运用引入了更多可阐明性和参考，让政策的制订者和决策者不仅能够匆匆进其模型内部运作模型的理解，同时也将为穷苦地区的城市发展和城市方案带来更多启示。
只管 CNN 已显示出网络地理社会经济数据的潜力，但该研究表明，其预测背后的过程存在不可靠可能，因此应进行进一步研究。
接下来，该研究小组将会在预测模型的可阐明性方面进行更多探索，使其能够更有效和可靠地实行。
Abitbol & Karsai 说道，「我们对付影响模型可预测和可阐明程度的成分十分感兴趣，此外我们还将通过传统的视觉识别算法进行收入水平的预测，以验证 CNN 模型在不同地区的迁移能力以及进行高精度社会经济预测的准确性。
」