十大年夜最受迎接的人工智能模型_数据_模子
我们将阐明的基本特性和运用领域下面所有这些算法。然而,我们必须事先阐明机器学习的基本原则。
所有的机器学习模型旨在学习一些函数(f),供应最精确的输入值之间的干系性(x)和输出值(y)y = f(x)。最常见的情形是,当我们有一些历史数据X和Y和AI模型支配到可以供应最好的这些值之间的映射。结果不能100%准确,否则,这将是一个大略的数学打算不须要机器学习。相反,f函数我们演习可以用来预测新的Y利用新的X,从而使预测剖析。各种毫升模型实现这个结果采取不同的方法,然而上面的紧张观点保持不变。
线性回归 Linear Regression
线性回归中利用数理统计超过200年了。算法的目的是找到这样的系数值(B),供应最影响精度的函数f我们正在努力演习。最大略的例子是
y= B0 + B1 x,个中B0 + B1是干系功能
通过调度这些系数的权重,数据科学家得到不同结果的演习。该算法成功的核心哀求是有明确的数据没有太多噪音(低代价信息)和删除输入的变量具有相似值(干系输入值)。
这许可利用线性回归算法梯度低落优化金融统计数据的银行、保险、医疗、营销、等行业。
逻辑回归 Logistic Regression
逻辑回归是另一种盛行的人工智能算法,能够供应二进制的结果。这意味着该模型预测结果和可以指定一个y值的两个类。函数也是基于改变权重的算法,但由于不同非线性逻辑函数是用于转换结果。这个函数可以表示成一个s形线分离从虚假的真实值。
成功的需求是一样的线性回归-删除相同的值输入样本和减少噪音(低代价数据)。这是一个相称大略的函数,可以比较快地节制,对实行二进制分类非常有用。线性判别剖析 Linear Discriminant Analysis (LDA)
这是一个逻辑回归模型的分支时,可以利用超过2类可以存在于输出。数据的统计特性,如均值分别为每一个类和总方差总结类,打算模型。预测许可打算每个类和确定类的值最值。这个模型是精确的,须要分布式的数据根据高斯钟形曲线,以是所有紧张的非常值该当事先被移除。这是一个伟大的和非常大略的模型进行数据分类和构建预测模型。
决策树 Decision Trees
这是一个最古老,最常用、最大略和最有效的ML模型。它是一个范例的二叉树是或反对议每个分裂,直到模型达到结果节点
这个模型是大略的学习,它不须要数据规范化和可以帮助办理多种类型的问题。
Naive Bayes 贝叶斯
朴素贝叶斯算法是一个大略,但非常强大的模型来办理各种繁芜的问题。它可以打算2种可能性:
1、每个类涌现的机会
2、条件概率为一个独立的类,由于有一个额外的x润色符。
模型被称为天真的操作时,假设所有输入数据值都与彼此无关。虽然这不能发生在现实天下中,这种大略的算法可以运用于多种规范化数据流预测结果与一个伟大的精确度。
K-Nearest Neighbors
这是非常大略的和非常强大的ML模式,利用全体演习数据集作为代表。打算结果的预测代价通过检讨全体数据集K数据节点具有相似的代价不雅观(所谓的邻居)和利用欧式数量(这可以很随意马虎地皮算基于代价差异)来确定结果值。
这样的数据集须要大量打算资源的存储和处理数据,受到精度丢失当有多个属性,必须不断策划。然而,他们的事情非常快,非常准确和有效地创造在大型数据集所需的值。
学习矢量量化 Learning Vector Quantization
KNN的唯一紧张缺陷是须要存储和更新大型数据集。学习矢量量化或LVQ资讯进化模型,神经网络,利用码向量来定义所需的演习数据集和整理结果。因此说,向量是随机的,和学习的过程涉及到调度值最大化的预测精度。
因此说,找到最相似的代价不雅观的结果的向量的最高精确度预测结果的代价。
支持向量机Support Vector Machines
该算法是一种最广泛谈论的数据科学家之一,由于它供应了非常强大的功能进行数据分类。所谓的超平面是一条直线,把数据输入节点有不同的代价不雅观,和这些点到超平面的向量可以支持它(当同一类的实例的所有数据都在同一侧的超平面)或唾弃它(当数据点在平面上的类)。
最好的超平面是最大的积极的向量和分离的数据节点。这是一个非常强大的分类机,可以运用于广泛的数据归一化问题。随机决策森林 Random Decision Forests or Bagging
随机决策森林形成决策树,多个样本数据处理通过决策树和结果汇总(喜好网络许多样品袋)找到更准确的输出值。
找到一个最优的路线,而是多重次优路由定义,从而使总的结果更精确。如果决策树办理问题之后,随机森林是一个调度的方法,供应了一个更好的结果。深度神经网络 Deep Neural Networks
DNNs 是最广泛利用的人工智能和ML算法。有显著改进深上优于文本和语音运用程序,机器感知和OCR深层神经网络,以及利用深度学习授予强化学习和机器人运动,连同其他杂款的运用程序。
正如你所看到的,有一个充足的各种人工智能算法和ML模式。一些更适宜数据分类、excel在其他领域。没有模型适宜所有大小,所以为你选择最好的情形是至关主要的。
如何知道这个模型是精确的吗?考虑以下成分:
1、3 V的大数据须要处理(输入的数量、种类和速率)
2、打算资源的数量在你的处置
3、韶光可以花在数据处理
4、数据处理的目的
因此说,如果一些模型供应了94%的预测精度为代价的两次延长处理韶光,比较86%准确的算法——各种各样的选择大大增加。
然而,最大的问题常日是高层的普遍缺少专业技能来设计和实现数据剖析和机器学习办理方案。这便是为什么大多数企业选择托管做事供应商之一,专门从事大数据和人工智能的办理方案。
本文系作者个人观点,不代表本站立场,转载请注明出处!