2、你是怎么理解偏差方差的平衡的?

人工智能算法工程师常见面试题及解答_模子_算法 绘影字幕

3、给你一个有1000列和1百万行的演习数据集,这个数据集是基于分类问题的。
经理哀求你来降落该数据集的维度以减少模型打算韶光,但你的机器内存有限。
你会怎么做?

4、环球均匀温度的上升导致天下各地的海盗数量减少。
这是否意味着海盗的数量减少引起景象变革?

5、给你一个数据集,这个数据集有缺失落值,且这些缺失落值分布在离中值有1个标准偏差的范围内。
百分之多少的数据不会受到影响?为什么?

6、你意识到你的模型受到低偏差和高方差问题的困扰。
那么,该当利用哪种算法来办理问题呢?为什么?

7、协方差和干系性有什么差异?

8、真阳性率和召回有什么关系?写出方程式。

9、Gradient boosting算法(GBM)和随机森林都是基于树的算法,它们有什么差异?

10、你认为把分类变量当成连续型变量会更得到一个更好的预测模型吗?

11:“买了这个的客户,也买了......”亚马逊的建议是哪种算法的结果?

12、在k-means或kNN,我们是用欧氏间隔来打算最近的邻居之间的间隔。
为什么不用曼哈顿间隔?

13、我知道校正R2或者F值是用来评估线性回归模型的。
那用什么来评估逻辑回归模型?

14、为什么朴素贝叶斯如此“朴素”?

15、花了几个小时后,现在你急于建一个高精度的模型。
结果,你建了5 个GBM(Gradient Boosted Models),想着boosting算法会展现“魔力”。
不幸的是,没有一个模型比基准模型表现得更好。
末了,你决定将这些模型结合到一起。
只管众所周知,结合模型常日精度高,但你就很不幸运。
你到底错在哪里?

以上题目答案详解:https://www.tinymind.cn/articles/109【推举收藏】机器学习教材中的 7 大经典问题https://www.tinymind.cn/articles/83

算法工程师口试题

事情中的算法工程师,很多时候,会将生活中须臾即逝的灵感,付诸产品化。

将算法研究运用到事情中,与纯粹的学术研究有着一点最大的不同,即须要从用户的角度思考问题。
很多时候,你须要明确设计的产品特色、提升的数据指标,是不是能真正迎合用户的需求,这便哀求算法工程师能在多个模型间选择出最得当的那个,然后通过快速迭代达到一个可以走向产品化的结果。
知识储备作为成功的根底亦必不可少,以下是营长为你精选的算法口试,帮你检讨下自己的技能是否在线。

1. LDA(线性判别剖析) 和 PCA 的差异与联系

2. K-均值算法收敛性的证明

3. 如何确定 LDA (隐狄利克雷模型) 中主题的个数

4. 随机梯度低落法的一些改进算法

5. L1正则化产生稀疏性的缘故原由

6. 如何对贝叶斯网络进行采样

7. 从方差、偏差角度阐明 Boosting 和 Bagging

8. ResNet的提出背景和核心理论

9. LSTM是如何实现是非期影象功能的

10. WGAN办理了原始 GAN 中的什么问题

以上题目答案详解:https://www.tinymind.cn/articles/1275【推举收藏】是男人就过8题!
楼教主出题,请接招https://www.tinymind.cn/articles/47算法和编程口试题精选TOP50!
(附代码+解题思路+答案)https://www.tinymind.cn/articles/3759

深度学习12大常见面试题

1.什么是深度学习?为什么它会如此受欢迎?

3.深度学习与机器学习有什么差异?

4.深度学习的先决条件是什么?

5.选择哪些工具/措辞构建深度学习模型?

6.为什么构建深度学习模型须要利用GPU?

7.何时(何处)运用神经网络?

8.是否须要大量数据来演习深度学习模型?

9.哪里可以找到一些基本的深度学习项目用来练习?

10.深度学习的一些免费学习资源

末了附上深度学习的干系口试问题有哪些?

(1)深度学习模型如何学习? (2)深度学习模型有哪些局限性? (3)前馈神经网络和递归神经网络之间有什么差异? (4)什么是激活特色函数? (5)什么是CNN,它有什么用场? (6)什么是池化? 简述其事情事理。
(7)什么是dropout层,为什么要用dropout层? (8)什么是消逝梯度问题,如何战胜? (9)什么是优化函数?说出几个常见的优化函数。

以上题目答案详解:https://www.tinymind.cn/articles/608

Python常见面试题100+Python编程题给你练~(附答案)https://www.tinymind.cn/articles/3987

10个Python常见面试题,这些弄不明白不要说学过Python!
https://www.tinymind.cn/articles/3768

Google人工智能口试题

1、求导1/x。

2、画出log (x+10)曲线。

3、若何设计一次客户满意度调查?

4、一枚***抛10次,得到8正2反。
试析抛***是否公正?p值是多少?

5、接上题。
10枚***,每一枚抛10次,结果会如何?为了抛***更公正,该当怎么改进?

6、阐明一个非正态分布,以及如何运用。

7、为什么要用特色选择?如果两个预测因子高度干系,系数对逻辑回归有若何的影响?系数的置信区间是多少?

8、K-mean与高斯稠浊模型:K-means算法和EM算法的差别在哪里?

9、利用高斯稠浊模型时,若何判断它适用与否?(正态分布)

10、聚类时标签已知,若何评估模型的表现?

11、为什么不用逻辑回归,而要用GBM?

12、每年应聘Google的人有多少?

13、你给一个Google APP做了些修正。
若何测试某项指标是否有增长

14、描述数据剖析的流程。

15、高斯稠浊模型 (GMM) 中,推导方程。

16、若何衡量用户对***的喜好程度?

17、仿照一个二元正态分布。

18、求一个分布的方差。

19、若何建立中位数的Estimator?

20、如果回归模型中的两个系数估计,分别是统计显著的,把两个放在一起测试,会不会同样显著?

以上题目答案详解:https://www.tinymind.cn/articles/98

苹果人工智能口试题

1、有成千上万个用户,每个用户都有 100 个交易,在 10000 个产品和小组中,用户所参与故意义的部分,你是如何处理这一问题的?

2、为了肃清敲诈行为,我们对这些数据进行预筛选,如何才能找到一个数据样本,帮助我们判断一个敲诈行为的真实性?

3、给出两个表格,一个表格用来存储用户 ID 以及购买产品 ID(为1个字节),另一个表格则存储标有产品名称的产品 ID。
我们考试测验探求被同一用户同时购买的这样一个成对的产品,像葡萄酒和开瓶器,薯片和啤酒。
那么,如何去探求前 100 个同时存在且成对涌现的产品?

4、详细描述 L1 正则化和 L2 正则化二者之间的差异,特殊是它们本身对模型演习过程的影响有什么不同?

5、假设你有 10 万个存储在不同做事器上的文件,你想对所有的文件进行加工,那么用 Hadoop 如何处理?

6、Python 和 Scala 之间有什么差异?

7、阐明一下 LRU Cache 算法。

8、如何设计一个客户——做事器模型,客服端每分钟都可以发送位置数据。

9、如何将数据从一个 Hadoop 聚类通报给另一个 Hadoop 聚类?

10、Java 中的内存有哪些不同的类型?

11、你是如何处理数百个标题中的元数据这一繁琐任务的?

12、在数据流和可访问性方面,如何在隐蔽韶光帧内进行丈量?个中在隐蔽韶光帧内,核心超负荷将打算性能量重定向到 cellar dome 的过度繁芜文件系统的边界构造。

13、你最希望拥有的超能力是什么?

14、如果你有一个韶光序列传感器,请预测其下一个读数。

15、利用 SQL 创建 market basket 输出。

16、你有没有过生理物理学实验的履历?(Research Portfolio based question)

17、你在表征方法上的专长是什么?常日利用什么?你是如何在研究中利用它,有没有什么有趣的结果?(Research Portfolio based question)

18、如何进行故障剖析?

19、检讨一个二叉树是否为旁边子树上的镜像。

20、什么是随机森林?为什么朴素贝叶斯效果更好?

以上题目答案详解:https://www.tinymind.cn/articles/139

大家可在详解页面查找以上所有问题的答案,口试除了运气,更多还是须要踏实的基本功。
努力刷题吧,祝大家都能所向披靡,顺利进入心仪的公司~