来源 | 异步 | 文末赠书

谷歌人工智能专家力荐!美亚4.5星这本机械进修畅销书火了_机械_本书 绘影字幕

在美国亚马逊网站上,机器学习的图书如浩如烟海,但是在这个领域竟有一本书仅凭百页内容就成功跻身图书发卖总榜单前1000名,在亚马逊的官网,这本书也长期位于亚马逊机器学习图书排行榜的领先位置,并得到4.5星好评,成为美亚在机器学习领域最脱销的图书之一。
这本书便是《机器学习精讲》 。

本书作者安德烈·布可夫(Andriy Burkov)是一位机器学习专家,目前居住于加拿大魁北克省。
他拥有人工智能博士学位,尤其善于自然措辞处理技能。
目前,他是高德纳(Gartner)咨询公司机器学习开拓团队的主管。

为何要理解机器学习

从人工智能出身开始,这门技能就不断的被人们寄予颠覆传统、创造未来的厚望。
本日的企业和个体都正在经历工业化以来最重大的变革。
人工智能的技能不断地被落地运用,很多企业因此打破原有的商业版图。

不论你接不接管,一个属于人工智能的时期已经来临。
Gartner预测到2020年人工智能将创造230万个事情岗位,同时肃清180万个事情岗位。
对付个体来说,既然不能抗拒时期的潮流,就须要顺应变革。
而机器学习——作为人工智能主要的驱动力,目前这一领域的专家还很少,店主们都在为ML技能人才而战。
以是,理解机器学习,是进入人工智能领域的一种有效策略。

这本书讲了什么?

人工智能的核心是机器学习。
《机器学习精讲》一书中席卷了机器学习的精髓,为读者系统而精髓精辟地讲解机器学习的基本事理。

详细内容包含了监督和非监督学习、支持向量机、神经网络、集成算法、梯度低落、聚类分类、降维、自编码器、迁移学习、特色工程以及超参数调试等方面的知识。

《机器学习精讲》

作者: [加拿大] 安德烈·布可夫(Andriy Burkov)

译者: 韩江雷

书中既有数学公式,又有图讲授明,一应俱全。
通过这本书,你将理解到机器学习是如何事情的。
并可以在项目初期的头脑风暴阶段进行实践,比如评估机器学习是否适用于办理某个技能或业务问题,以及详细的办理思路。

译者有话说

我与“机器学习”的初次重逢是在5年前,那时我刚刚决定于新加坡南洋理工大学攻读打算机博士学位。
比起打算机学院的主流课程,如数据库、软件开拓、嵌入式系统等,“机器学习”这个“新领域”既令人好奇,又让人望而生畏。
当时,“学习”还没那么深度, “数据科学家”刚刚被《哈佛商业评论》宣告为“二十一世纪最吸引人的职业”。
转头看来,差不多同一韶光,“人工智能”正在为一次空前的崛起积累能量、蓄势待发。

我在新加坡南洋理工大学的研究项目属于工业界的运用问题,因此得以打仗各种工业界数据和工具,并在研究事情中考试测验部分机器学习模型。
与此同时,与机器学习干系的各种文献、资料、开源项目在网络上大量呈现。

在本书之前,我打仗过一些关于机器学习技能的教科书。
这些书的共同特点是:深、厚、难。
首先,它们普遍内容深奥,阅读门槛较高。
严谨的论证和详细的数学推导,须要很强的理论根本才能看懂。
其次,很多教科书篇幅动辄上千页,让刚入门的读者望而生畏。
末了,实现书中所先容的算法所须要的工程量较大,很难快速运用于实际问题。

比较专业教科书,本书更像是一本科普读物,任何具备基本代数知识的读者都可以理解其大部分内容。
本书篇幅较短、章节清晰,适宜通读与精读。
书中先容的很多实用技巧也可以帮助读者快速上手实践。

对我个人来说,翻译一本专业著作是个全新的寻衅。
当时紧张的考量有二:一方面,将原书内容翻译成另一种措辞的过程,也是加深对各种技能观点的印象、在精读中创造新的视角和问题的过程;另一方面,随着越来越多的行业正加入人工智能的改造浪潮,对机器学习人才的需求会连续增加,我也希望通过自己的绵薄之力,让更多对机器学习感兴趣却又望而生畏的中文读者打仗到这本书。

初学者入门机器学习的第一个困难

对初学者来说,想要用机器学习来办理实际问题,面临的第一个问题便是——该如何根据详细问题选用适宜的算法。
这就须要考量数据的大小、质量和性子、可用打算韶光、任务的紧迫性和数据的,新手小白每每会在这一步受阻。

异步君分享书中内容,为初学者在选择学习算法的时候供应了理论辅导。

选择一个机器学习算法并不是一项轻松的任务。
如果韶光很充裕,我们该当试遍所有的算法。
不过,一样平常情形下,我们办理一个问题的韶光是有限的。
在开始办理一个问题前,我们可以先回答几个问题,并根据答案缩小可选算法的范围,再试验于我们的数据。

l 可阐明性

针对非技能性受众,我们的模型是否须要具有可阐明性?很多准确度很高的学习算法都是所谓的“黑箱”算法。
它们可以学得一个极少犯错的模型,但是做出一个特定预测的情由可能很难明得,更难阐明。
例如,神经网络模型和集成模型。

其余,由k隔壁、线性回归或决策树算法天生的模型并不一定最准确,但它们预测的情由却很刀切斧砍。

l 内存中vs.内存外

我们的数据集是否可以完备被载入做事器或个人打算机的内存中?如果可以,那么我们可选的算律例模比较大;否则,我们可能须要考虑利用增量学习算法(incremental learning algorithm),通过逐步增加数据来提高模型的表现。

l 特色数与样本数

我们的数据集中有多少演习样本?每个样本有多少个特色?有的算法可以处理大量样本以及百万级别的特色,包括神经网络和梯度低落(我们稍后详细考虑二者);有的算法容量就逊色得多,如SVM。

l 类型特色vs.数值特色

我们的数据是否只包含类型特色或只包含数值特色,还是两者稠浊?根据详细答案,有的算法可能无法直接应用于我们的数据集,须要先将类型特色转换为数值特色。

l 数据的非线性

我们的数据是否线性可分隔?或者是否可以用一个线性模型建模?如果是,利用线性核的SVM、对率或线性回归可能效果都不错;否则,深度神经网络或集成算法可能更适宜。
我们会在第6章、第7章等分别详细讲解这两种算法。

l 演习韶光

我们希望一个学习算法花多少韶光构建一个模型?神经网络的演习速率是出了名的慢。
大略的算法,如对率回归、线性回归或决策树,都快得多。
一些算法的专用库中整合了非常高效的实现方法。
我们上网做些研究便可找到这些库。
有的算法(如随机森林)可以借助多核处理器(CPU)的超强性能减少构建模型所需的韶光。

l 预测韶光

我们希望一个模型多快可以天生预测结果?模型是否会被用于须要超高吞吐量的生产环境?诸如SVM、线性回归、对率回归以及(一些)神经网络模型,预测速率特殊快。
其他的,比如k隔壁、集成算法还有非常深或循环的神经网络,则相对较慢[2]。

如果我们不想凭空预测哪一个算法用于我们的数据效果最好,一种很盛行的选择方法是在验证集上测试。
我们下面就会讲到。
另一种方法是,如果利用scikit⁃learn库,我们可以利用它们的算法选择图,如图所示。

scikit⁃learn专用机器学习算法选择图

多位人工智能专家推举

作者完成了一项非常主要但是难度巨大的任务——将所有机器学习内容浓缩到100多页的篇幅中。
他选择的主题,无论从理论还是实践角度,都对从业者很有帮助。
初学者阅读本书后,可以为读懂更多专业文献打好根本。

——Peter Norvig,谷歌研究主任

本书的篇幅很短,但涵盖了非常广泛的主题,作者并没有省略数学公式。
我很欣赏作者用简洁的措辞阐明核心观点的能力。
本书不仅能给入门者以帮助,还能为有一定机器学习根本的读者供应了一个全方位的视角。

——Aurélien Géron,高等AI工程师

这是一本精简的机器学习入门手册,我认为它将会成为学习者和从业者的主要参考资料。
简短的篇幅使得读者可以快速读完本书。
纵然如此,本书也涵盖了机器学习的绝大部分内容,从经典的线性和对数概率回归,到当代的支持向量机、深度学习、提升法、随机森林等,本书详细先容了这些方法。

阅读本书不须要深入理解数学、统计学或者编程知识。
本书适宜每一位刚开始打仗机器学习的博士生阅读。
本书通过代码诠释一些算法,所采取的Python措辞是机器学习运用中常用的编程措辞。
如果你是机器学习的初学者,或者是想要扩充知识储备的从业者,我强烈推举本书。

——Gareth James,南加州大学马歇尔商学院统计学教授

本书是为那些想要在事情中运用机器学习技能但又没有太多韶光去学习的工程师量身打造的。

——Deepak Agarwal,LinkedIn人工智能副总监

一本很好的机器学习入门读物。

——Karolis Urbonas,Amazon数学科学主管

多希望在我读研究生刚打仗机器学习时,能有这样的一本书。

——Chao Han,Lucidworks 研究开拓主管、副总监

本书从第一页开始便省略细枝末节,直达主题,效果不错。

——Sujeet Varakhedi,eBay 工程主管

这本书有什么特色?

适宜人群

首先,本书是为机器学习的初学者所量身打造的。
随着外界与机器学习干系的各种文献、资料、开源项目在网络上大量呈现,那些想在事情中运用机器学习技能的工程师或者研究者,一方面受益于大量信息所带来的便利,另一方面却也时常由于信息量太大而不知从何入手。

通过阅读本书,初学者能够较全面地理解机器学习的根本知识,为理解该领域的繁芜问题和进一步深入研究打好根本。
与此同时,本书也为有从业履历的读者供应了多种自我学习的方向。
作为一本工具书,它同样也适用于项目初期的头脑风暴阶段,比如评估机器学习是否适用于办理某个技能或业务问题,可以为这部分读者供应详细的办理思路。

《机器学习精讲》

作者: [加拿大] 安德烈·布可夫(Andriy Burkov)

译者: 韩江雷

图书特色

● 精简并直入主题——篇幅短小,从第一页开始便省略细枝末节,直达主题,仅用100页的内容读者就可以快速读完并节制机器学习技能的精髓。

● 易读,适宜初学者——阅读本书不须要深入理解数学、统计学或者编程知识。
书中通过代码诠释了部分法,所采取的Python措辞也是机器学习运用中常用的编程措辞。
非常适宜机器学习的初学者,或者是想要扩充知识储备的从业者阅读学习。

● 配套网页——本书配有持续更新的网页,对书中内容进行补充,包括问答、代码、推举阅读材 料、工具以及其他干系内容。
扫描书中二维码即可查看。

● 全彩印刷——色彩丰富,阅读轻松。

-END-

今日福利

《机器学习精讲》

作者: [加拿大] 安德烈·布可夫(Andriy Burkov)

译者: 韩江雷

如何得到:访问【异步图书】微信公众号,在同名文章中 在看+参与话题留言+转发本文至朋友圈,1月15日,异步君将抽取2名读者赠予《机器学习精讲》。

今日互动话题:

“你理解过哪些机器学习的算法呢?”