人工智能正在触及无法超出的天花板_数据_人工智能
要理解这个问题,我们须要理解AI事情的基本事理。当代AI利用深度学习算法和人工神经网络来创造数据中的趋势。然后,它们可以根据这些数据进行推断,或者沿着同一趋势线天生新的数据。这始于“演习”AI,将大量数据输入个中进行剖析,使其能够找到这些趋势。之后,可以查询AI以获取输出。这一基本观点为打算机视觉、自动驾驶汽车、谈天机器人和天生人工智能供应了动力。这是一个比较简化的阐明,但目前我们只须要理解到这个程度。
在过去的几年里,AI的能力明显增强。这部分是由于编程和算法的改进。但也有90%的缘故原由是由于AI已经在更大的数据集上进行了演习。这使得它们能够更准确地理解数据中的趋势,因此能够更准确地天生结果。但是存在一个问题;我们正在看到AI演习的递减回报,无论是在数据方面还是在打算力方面,都在急剧减少。
首先我们来看数据。假设我们建立了一个大略的打算机视觉AI来识别狗和猫,并且我们利用了100张狗和猫的图像和***进行演习,它能够以60%的准确率精确识别它们。如果我们将演习图像和***数量增加一倍到200,它的识别率会有所提高,但仅仅略微提高到大约65%旁边。如果我们再将演习图像和***数量增加一倍到400,它的提高会更加微不足道,大约提高到67.5%旁边。
这部分是由于当你拥有较小的数据集时,与向较大数据集添加新的演习图像比较,每个新的演习图像都会按比例为你供应更多的新数据。然而,也是由于AI可以迅速在小数据集中做出新的连接和趋势,由于它只须要找到一个在几个示例中有效的趋势。但随着数据集的增长,要找到在全体数据集中有效的新的趋势和连接变得越来越困难。来自更大数据集的这些新趋势和连接使得AI变得更好、更有能力。因此,随着我们达到演习AI的递减回报点,为了提高AI的能力所需的演习数据量呈指数级增长。
但还有另一个问题。AI的演习对打算资源需求极大。AI必须将每个数据点与数据集中的每个其他数据点进行比较,以找到这些连接和趋势。这意味着对付添加到AI演习数据库的每个数据位,演习AI所需的打算事情量都会呈指数级增加。因此,纵然你能得到演习这些不断改进的AI所需的大量数据,所需的物理打算能力和能源也将终极增长到不可能的程度。
可悲的是,有证据表明我们已经到了一个阶段,即演习数据集增长的回报递减,以及利用所述数据集所需的打算能力呈指数级增长,都在给人工智能发展设置硬上限。
以OpenAI的旗舰AI ChatGPT4为例。它对ChatGPT3的改进小于ChatGPT3对ChatGPT2的改进,只管它更加准确,但仍旧存在着ChatGPT3的问题,如虚构事实和缺少理解。现在,OpenAI对其如何开拓其AI保持着严格的保密,但专家调查创造,ChatGPT3利用的演习数据集大约比ChatGPT2大78倍,而ChatGPT4利用的数据集比ChatGPT3大571倍!
然而,只管演习数据集大小大幅增加,ChatGPT4仍旧存在显著的毛病,严重限定了它的用场。例如,它不能被信赖来写任何与事实有关的东西,由于它仍旧虚构事实。
据估计,ChatGPT4的原始演习数据集的明文容量为45TB。这意味着,要使下一次迭代像ChatGPT4相对付ChatGPT3那样有很大改进,演习数据集须要数万TB。纵然是通过OpenAI的可疑方法获取和准备大量的明文数据,也是不现实的。然而,实际利用这个数据集来演习他们的人工智能可能会花费大量的能源,以至于本钱使得人工智能完备不可行,纵然是对付非营利组织也是如此。
这并不是夸年夜。OpenAI CEO Sam Altman在一次讲话中表示,须要一种能源打破,比如核聚变,才能使前辈的人工智能变得可行。可悲的是,纵然我们真的解锁了核聚变,它也不太可能比本世纪乃至下个世纪我们目前的能源便宜。事实上,没有任何形式的能源会比我们目前拥有的任何能源都便宜得多。因此,这种针对人工智能能源问题的办理方案极具误导性。
这一不雅观点得到了一些非常严明的研究的支持。来自马萨诸塞州大学阿姆斯特分校的一项研究稽核了将图像识别人工智能的性能提高到95%以上准确率所需的打算和能源本钱。他们创造,演习这样一个模型将耗资1000亿美元,产生的碳排放量相称于纽约市一个月的碳排放。须要把稳的是,这是针对一个在5%的情形下仍旧犯有严重缺点的人工智能。该研究还指出,将准确率提高到99%将须要成倍增加的本钱和碳排放。
这便是为什么特斯拉永久不会用其当前的方法开拓完备自动驾驶汽车的缘故原由。他们的Autopilot和FSD只能通过这种类型的人工智能打算机视觉感知周围天下,而要使FSD完备自动驾驶,其图像识别准确度须要靠近100%。正如这项研究所表明的那样,要使他们的人工智能达到如此高的水平,乃至可能须要比特斯拉更多的资金。
换句话说,除非人工智能行业能够找到更高效的人工智能演习和打算负载方法,否则它将无法打破这一限定,人工智能的发展将完备结束不前。现在,可能的办理方案已经涌如今地平线上,比如更加高效的人工智能硬件,结合仿照和量子技能,以及须要明显较小的演习数据集的新人工智能架构。然而,这些观点仍处于抽芽阶段,可能还须要几十年才能在现实天下中利用。
简而言之,准备好在未来几年里,人工智能将大大不及预期。
本文系作者个人观点,不代表本站立场,转载请注明出处!