作者:Cassie Kozyrkov

人工智能掉足要怪谁?_人工智能_示例 绘影字幕

人工智能犯错时是谁的错?请不要误会我的意思,我喜好机器学习和人工智能。
但我并不盲目相信它们,你也不应该相信。
由于你在建立有效可靠的机器学习/人工智能办理方案的方法将会强制每个办理方案赢得你的信赖。

在你开始认为这可能与机器人或科幻小说有关之前,请停滞履行!
机器学习/人工智能系统并不是人性化的,它们只是拥有诗意名称的标签。
相反,对它们的不信赖完备来自其他地方。
我认为最好不要见告别人,以是让我们看一个熟习的例子。

http://bit.ly/quaesita_simplest

永久不要盲目相信机器学习/人工智能,总是强制它通过适当的测试赢得你的信赖。

为一厢宁愿设定场景

以猫的图片分类为例,当我们构建的分类器将供应的六张照片的原始数据集分成两组时,你可能已经碰着这样的案例。

http://bit.ly/quaesita_unsupervisedimg

来自无监督学习的原始演习数据集揭秘。
你看到这两组图片了吗?

http://bit.ly/quaesita_simplest

你看看是那个吗?令人惊人的神奇机器学习系统成功地返回了我希望的确切结果!

这个示例适用于受监督的机器学习和无监督的机器学习,因此不必担心。
主要的是,该模型完美地识别了这两只猫,具有100%的演习准确性。

答对了!
这两只猫已经区分开,并完美地标上了他们的标签,这让我对分类器感到骄傲。
这意味着我刚刚建立了Tesla和Huxley分类器!
不是吗?

我们的大脑在捉弄我们

但这个分类结果不会这么大略!
人类一厢宁愿的想法再次捉弄我们。
我感情太激动了,以至于可能没有把稳到所有的Tesla照片的背景都有一个散热器,而Huxley的照片没有。
你把稳到了吗?再看一遍。

这个别系并不是针对猫的探测器。
由于确认偏差,我选择性地把稳到我喜好的事情,并且没有把稳到证据表明系统实际上是散热器探测器的证据,因此我得到了这个结论。

到底是猫探测器还是散热器探测器?

我并不知道我的办理方案实际上是一个散热器探测器,而不是猫探测器。
利用新示例进行测试有助于供应帮助,以是让我们看看我们是否以这种办法办理问题。

事实证明,利用来自同一数据集的更多示例并没有太大浸染

纵然我通过向新数据显示这些新照片来测试它,也不会有太多的提示。
这是一个问题吗?

如果总是在散热器的房间中拍摄Tesla,并且总是在没有散热器的房间拍摄Huxley。
如果是这样的话,谁在乎它是如何事情的?它总是有效的。
它每次都会精确地对猫进行分类。
这并没有什么问题。

那么如果猫搬到另一间房间怎么办?如果你在没有我的记事本的情形下采取我的分类器,并在通过照片进行分类,它会怎么样?

在这些情形下,返回的标签将是\公众Huxley\公众,而依赖我的Tesla和Huxley探测器的任何关键任务系统都会崩溃失落败。

这是谁的错?让我们快速剖析一下:

•正如人工智能常见的那样,把像素转换成标签的方法太繁芜了,

•我不雅观察到的只是输入(图像像素)和输出(Tesla/Huxley的标签)。

•由于我是人,也会犯错。
我没有把稳到眼皮底下的东西(散热器和Tesla总是在一起)。

•我提醒自己关于输入与输出的关系不仅过于简化,而且由于一厢宁愿的思考而偏离了散热器的阐明。

• 没紧要。
只要我确信它确实有效,我就不必理解它是如何事情的。

•检讨它是否有效的方法是评估它在一系列干系的例子中所做的事情。

到目前为止,统统都好。
实际上还没有问题。
你熟习一些东西却不知道它们是如何事情的,比如我们很多人服用扑热息痛片来治疗头痛。
这很有效,但却无法见告你为什么会有疗效。
主要的一点是,可以验证扑热息痛是否有效。

不知道这种已经具有100多年历史的药物在分子水平上如何起浸染?科学也不例外。

考虑繁芜的人工智能系统,就像治疗头痛一样。
只要确保它们有效,你就会没事。

不幸的是,我检讨了一些示例的性能,这些示例与我希望系统运行的示例不同。

缺点就在那里,末了一个是缺点的。
只要我们用适当的例子适当地测试系统,别的的都是对有。
以是答案是:这是我个人的错。

如果你测试一个事情的系统,然后将它运用到另一个事情......那么你在期待什么?

如果我用一组例子来教诲和测试一个学生,而这些例子并没有涵盖我希望那个学生学习的任务,那么如果往后涌现混乱,我为什么会感到惊异呢?如果我所有的例子都来自Tesla和散热器总是一起事情的照片,那么我只能期望我的分类器在这些照片中进行分类事情。
当我把它移到另一个天下时,就会出错,这个运用程序最好是低风险的,由于没有任何借口。
但如果你以前不知道的话,那么现在就要做。

这便是为什么从一开始就记住你的目标和用户是如此主要的缘故原由。
在开始之前指定规格和设置,并须要确定任务人。
在涉及更大的事情的地方,不要关注其他不干系的数据集。

如果没有闇练和负任务的领导,我希望你的运用程序永久不会有妨碍他人的康健、安全、肃静或未来......

知识,不是魔术

我一贯在利用\"大众例子\"大众这个词而不是\公众数据\公众来提醒你这不是魔术。
机器学习/人工智能的要点是,你利用示例来代替你的指令来表达你的欲望为了使它起浸染,这些例子必须是干系的。
任务越繁芜,你须要的示例就越多。
你每天都利用示例进行互换,因此已经知道了这些内容。
大概你想知道数学是否表达了不同的东西,实在不是。
请放心,知识便是你最好的算法。

如果你想用示例进行传授教化,那么这些例子必须是一个好例子。
如果你想要学生信赖你,那么考试必须也是好的。

盲目的信赖是一件恐怖的事情

在你检讨系统的条件之外,你对系统的安全性一无所知,以是请记住这些提醒:

•如果你没有测试它,请不要相信它。

•如果未在一个环境中进行测试,请不要相信停上环境。

•如果未利用用户群进行测试,请不要信赖这个用户群。

•如果未利用数据添补进行测试,请不要信赖数据添补。

•如果输入非常,请不要相信你的系统能够输出合理的信息。
考虑利用离群值检测和安全网(例如标记一个不屈常的实例进行人工审查)。

如果你利用的工具尚未经由验证,制造的任何混乱都是你的错。
而人工智能实在便是一种工具,与其他工具没什么两样。