老生常谈:听安然人员讲人工智能的安然与隐私问题!_相干_年夜众
关于机器学习(ML)和人工智能(AI)以及它们如今为各行各业供应的各种利用案例,人们在提起时包含着太多的愉快感情。在很多领域,我们现在已经有了成熟的办理方案,我们时时地听到有关ML和AI在迄今尚未探索的的问题上的有趣且富有洞察力的运用,这些问题让我们不禁发出感叹。
随着支配的场景变得更加丰富和广泛,我们必须确保AI和ML的安全性和隐私性方面得到充分考虑。为了做到这一点,主要的是要理解安全和隐私与AI和ML领域交叉路径的不同办法。在本系列中,我们将探索这些\公众交叉点\公众,理解所涉及风险的性子和程度,并为每种交叉\"大众路径\"大众供应或正在探索的保护方法。
虽然我在信息安全和隐私领域有多年的事情履历,但我对AI和ML还比较陌生。(我们刚刚开始在我们的云安全和正在开拓的项目利用ML技能。)因此,这个系列的文章更多的是从安全职员的角度出发,系统地推理AI和ML环境中的安全性和隐私性的不雅观点。
在第一部分中,我将从网络安全的角度出发,从\"大众让我们节制精确的根本信息\"大众开始,而不会深入理解AI和ML的内部内容。在接下来的部分中,我们将开始更仔细地不雅观察AI和ML组件。
AI和ML办理方案的传统网络安全
与任何新领域一样,AI和ML带来了一系列有趣的事物,干系的细微差别和把稳事变,从安全角度对我们提出了寻衅。
下面的两张图片(来自Microsoft Azure文档)展示了范例工件亲睦处干系方,它们涉及到终端AI / ML事情流程的各个阶段。
这些图表突出了我们面临的安全寻衅的性子和类型的以下特色:
有一个弘大的生态系统工具、措辞、框架 - 具有从数据摄取、数据预处理、建模、模型评估、集成、可视化、打包和支配等功能。从传统软件工程师到机器学习工程师,数据科学家和统计职员等多个利益干系方团体参与项目。完全的事情办理方案常日涉及多个别系在不同的接口上联合在一起。从安全角度来看,这是许多新的和未知的事情。我们正在研究许多新工具和框架,新人(利益干系者群体)和新系统或系统组合。暂且不谈AI和ML的细节/内部,纵然只是传统的网络安全,在这样的环境中也很难做好。这是由于常日新的工具和框架须要韶光才能变得\"大众足够安全\公众,新的利益干系方团体可能并不总是对安全性有统一的理解或认识。而且,涉及许多系统和接口的办理方案已经涌现了失落败的例子。
现在让我们来看看\"大众数据安全\"大众方面。在AI和ML背景下,数据安全寻衅的以下特色尤为突出:
在大多数办理方案中,涉及到大量的业务数据。我们正在评论辩论的是数百万乃至数十亿的记录。并且,根据问题领域的不同,这些数据可能具有巨大的代价(例如,经纪公司过去的交易)或敏感性(例如,来自连锁医院的医疗记录)。与传统的软件工程不同,在AI和ML中常日不能利用\公众虚拟数据\"大众进行测试/预生产阶段。因此,在生态系统的各个方面,我们都在评论辩论各种利益干系者和处理宝贵实际数据的各种系统。对各种数据的多次迭代和要求可能会毁坏你可能拥有的任何现有数据管理。鉴于AI和ML已经涉足各行各业,我们正在研究数百种数据和记录格式(以及相应的阅读器、编码器和解码器)。我们在少数几种更盛行的编码格式中拥有丰富的安全漏洞历史。当我们考虑乘数效合时,请考虑未来的情形。虽然它们确实令人生畏,但上述许多寻衅对安全从业者来说并不是什么新鲜事。我们过去曾经历过技能的转变。我们已经看到了安全至上的基本原则是不可改变的,以及在仔细理解新环境/生态系统的细微差别和独特哀求之后如何运用它们。
· 确保所有团队成员/利益干系者对安全和隐私有基本的理解。例如数据分类、数据保护技能、身份验证/授权、隐私原则、适用的监管哀求等。我们的目标该当是确保所有利益干系者都对安全和隐私有着基本的理解,每个人都利用相同的术语,并理解和熟知干系的政策和标准。
· 具备良好的数据管理构造。对付每个事情流程的不同阶段数据的变革,各利益干系方应明确所有权和问责制。鉴于ML&AI项目中不可避免的数据广泛传播,这一点尤为主要。
· 对办理方案实行威胁建模——无论是在组件级别还是从端到真个角度来说。这将确保在设计中\公众内置\公众安全性,并且在端到端系统中的每个点(处理、存储或传输有代价的数据)都知足适用的安全哀求。
· 在进行威胁建模时,应特殊把稳不同子系统之间的边界和接口。任何一方在这些界面上做出的假设都该当清楚地记录和验证。
· 此外,由于生产数据无处不在,因此请务必详尽地涵盖威胁模型中的所有事情流程——从最早的实验和观点证明开始,直到完备操作系统,就好比在生产中支配的那样。
· 确保在履行过程中遵照良好的编程实践,并且根据所利用的技能,避免一些漏洞(例如,如果办理方案的某些部分是基于Web的,则必须保护身份验证/ cookie免受XSS、CSRF等攻击)。
· 确保实行功能安全测试和渗透评估的通过,这可以担保威胁建模期间识别出所有威胁/风险并使其得到修复。
· 确保不同框架和子系统的安全模型得到最优解,以实现全体系统的统一安全性。这一点尤其主要,由于多个可能完备不同的组件和框架将被\"大众粘合\"大众在一起,从而构成终极办理方案。
· 仔细考虑项目不同阶段的各利益干系方利用的软件组件,或导入不同的\"大众管道\"大众。尽可能利用经由验证和署名的组件,要考虑到其他成分,如开拓职员荣誉、利用范围、存储库的可信度、评论、安全问题/漏洞的历史记录等。这些该当有助于评估组件的安全质量。
· 考虑支配(CICD)管道的安全性。你是否可以很好地掌握谁可以变动构建/发布环境?你是否正在保护支配所需的任何秘密/连接字符串?你的生产设置是否已锁定,以至于人们无法进行临时配置变动?
· 保持良好的监控和安全卫生。确保所有软件组件都处于最新的安全补丁级别,进行定期访问检讨,轮换密钥/证书等。
· 末了,制订良好的事件应急预案,以便在发生灾害时能够及时应对。
对付安全专业职员来说,上述所有内容都不应该是新颖的。你必须在过去的各种问题环境中完成部分或全部的这些操作。因此,AI和ML中安全性和隐私性的第一个方面便是在与所有干系利益干系方互助的同时将所有专业知识运用于新环境中。
本文系作者个人观点,不代表本站立场,转载请注明出处!