若何建立人工智能护城河?_模子_价值
成功的公司可以建立良性循环的数据,由于您天生和生产的产品数据越多,模型就越好,产品也就越好。
这是一个很关键的部分,但它不是完全的故事。更好的模型并不能担保更好的产品。如果没有两者之间的联系,你就不会有护城河。弄清楚如何创建这种良性循环是产品计策和数据计策相遇的交汇点,也是这篇文章的主题。
模型、产品、代价
让我们从一个大略的问题开始:机器学习模型的商业代价是什么?
它本身的代价是零。由于在市场上创造代价的不是模型而是产品。
换句话说,模型只能作为产品的一部分天生代价。它可能是自动化我们事情流程中的一个常规动作,也可能是检测网络流量非常或供应个性化推举。在每种情形下,模型的代价基于它的产品产生所谓的代价。
如果模型做出预测却没有产品可以利用它,它是否会创造代价?
量化预测代价
量化模型的潜在商业代价的一种方法是想象该模型是100%准确的。这对您的业务有何影响?答案可以是美元、点击次数、转化次数或任何其他可量化的商业指标。我称之为模型的预测值。
例如,保险公司可能希望利用机器学习自动化索赔处理。模型将从每个声明中提取信息并决定是否批准它。具有100%准确度的模型将降落代理商的本钱,减少处理韶光,并许可公司更有效地扩展,因此其预测值非常高。
并非每个模型都有可能如此有代价。一些初创公司推销基于人工智能的办理方案,这些办理方案根本没有足够的可寻址市场。如果你的神经网络没有创造商业代价,那么它是否100%准确是无关紧要的。
让我们连续这个思考下。实际上,没有任何模型是100%准确的。那么,如果模型准确度达到99%,那么预测值会发生什么变革呢?
我们可以考虑下保险公司,可能会批准少量敲诈或其他未表露的索赔。如果这些索赔本钱非常高,那么自动处理别的99%的索赔所节省的本钱就会被抵消。
从产品计策的角度来看,这带来了明显的寻衅,由于构建高度精确的模型须要大量的韶光、资源,尤其是数据。在这种情形下,有一个大略的办理方案:对自动索赔的代价设置上限。这是一个大略的示例,解释产品和数据洞察如何协同事情以加速代价创造。我稍后会回到这里,但现在让我们连续思考这个实验。
模型值图
99%的准确性问题为我们供应了一些有用的见地,但它仍旧过于乐不雅观。实际上,您构建的第一个模型远没有那么准确。究竟有多准确?这你不会事先知道的。由于它取决于许多成分,紧张是数据量和问题类型。
纵然您不知道模型的准确度是60%还是90%,您仍旧可以在这些不同的情形下评估预测值。您不须要实际构建任何模型来回答这些问题。事实上,你乃至不须要理解很多的有关机器学习的知识!
让我们把这个思想实验的结果绘制成图表,在x轴上设置成精确值,在y轴上设置成预测值。这是模型值图,以下是保险公司的情形:
图表呈上升趋势,由于随着模型精度的提高,预测值总是会提高。但是,由于任何缺点的本钱都很高,该模型只能在非常高的精度下产生显著的代价。在容错性较低的许多情形下,这种模式很常见。
达到收益递减
让我们考虑另一个例子。当您致电优步时,您可以估算出驾驶员的到达韶光,这是机器学习模型的预测输出。例如,可以通过预订的行程数量的增加和取消的行程数量的减少来丈量预测值。
该模型的模型值图表是什么样的?纵然是一个不准确的ETA,对搭客来说仍旧有些用途,从而产生正的预测值。准确的ETA当然更有用,但在某些时候你会收到递减的回报:知道确切的到达韶光到第二个点不会影响旅行次数。换句话说,模型值图趋于平稳:
这也是一种常见的模式。这比保险示例中的情形要安全得多,由于纵然模型不是很准确,该模型也能产生良好的代价。
破碎的环节
但具有稳定代价的模型代表了一个错失落的计策机遇,由于它们并没有创造出一条深厚的护城河。
机器学习模型不是静态的,他们可以重新演习和改进。当优步刚刚起步时,ETA的预测并不十分准确。但随着越来越多的搭客上路,该公司网络了越来越多的数据,模型变得越来越准确。
产品是否也变得更好?模型值图表见告我们答案。当图表趋于平稳时,这意味着对付这个特定的模型,从网络更多数据或利用更繁芜的建模技能中得到的机会并不多。更好的模型和更好的产品之间的联系被冲破了。
也便是说,纵然竞争对手的数据少得多,竞争对手也能迅速遇上并创造出类似的代价。如果模型在您的产品中具有很好的功能,那么这可能是可以接管的,但如果它是代价天生的核心引擎,就不是这样了。这便是为什么单凭数据或深层技能很难建立一条可防御的护城河的缘故原由之一。
如果模型在您的产品中具有很好的功能,那么这可能是可以接管的,但如果它是代价天生的核心引擎则不是。这便是为什么单靠数据或深度技能难以构建可防御的护城河的缘故原由之一。
如何建立AI护城河
那么如何用数据和AI建立一个可防御的护城河呢?以下是您希望模型值图形的样子:
这意味着您的模型纵然最初的准确性可能较低,也会产生一定的代价。然后,当您网络更多数据并改进模型时,预测值会增加。
这种模式确立了更好的模型和更好的产品之间的良性循环,并确保数据较少的竞争对手将具有显著的劣势。
从更好的模型到更好的产品
实际上,单个模型很难符合该模型。但成功的AI产品并不仅仅依赖于一种机器学习模型。相反,它会利用模型生态系统之间的协同浸染,随着更多数据的天生而共同改进。
再看看优步,除了ETA预测之外,UberX,我之前谈论过的优步做事,也是由预测搭客需求和旅行模式的模型供应支持。单独来看,这些模型中的每一个都可能是稳定的,但总的来说,它们的预测值可以在更长的韶光段内保持增长。
随着您天生越来越多的数据,您的每个模型都会变得更加准确。随着韶光的推移,先前预测值较低的模型,如保险公司的情形,可以提高到足以产生本色代价。终极,您可以开释潜力,利用这一新的模型群体为新产品供应动力,创造更多代价和更深层次的护城河。
AI S曲线
以Uber POOL为例,这是一种较新的优步做事,许可搭客在类似的路线上拼车,并分摊用度。除了UberX模型之外,POOL还依赖于一组须要更高精度和繁芜性的模型,例如预测额外搭客是否会加入正在进行的旅程。该模型具有相对较低的容错性,由于缺点的预测可能会给公司带来巨大的丢失。
作为一种产品,POOL打开了一个更看重价格的客户的新市场。这对Uber来说显然非常有代价,这意味着为POOL供应动力的模型具有很高的预测代价。
让我们一起绘制UberX模型和POOL模型的模型值图。
与ETA预测示例一样,为UberX供电的模型开始以相对较低的精度产生代价并快速扩展,然后趋于平缓。这样就会形成一个S形曲线。一旦准确度足够高,POOL模型就会启动,并且与UberX模型一起连续扩展预测值。追踪所有模型的预测值,可以创造优步深层AI护城河后的预测值正稳步上升。
这种模式类似于创新的S曲线,它标识了一种技能成熟与刚刚开始涌现的新技能之间窗口创新和毁坏的机会。同样,我们案例中的关键计策问题是如何确定何时涌现了一批新的高代价模型的潜力以及如何在产品创新中利用它。我将在往后的帖子中连续磋商这个话题。
总结
人工智能和数据有可能形成深层防御护城河,关键是要建立更好的模型和更好的产品之间的联系。 随着更多数据的天生,模型变得更好,但任何单个模型的预测值都趋于稳定。 通过计策性地利用新的更强大的模型群和他们解锁的产品机遇,成功的企业可以扩展其数据产生的业务代价,并构建深厚的AI护城河。
编译出品
本文系作者个人观点,不代表本站立场,转载请注明出处!