历史上有许多天才,生前籍籍无名,去世后众人崇拜。
18世纪英国数学家托马斯·贝叶斯也是个中一位。
贝叶斯定理源于他生前为办理一个“逆向概率”问题而写的一篇论文。
在贝叶斯写文章之前,人们已经能够打算“正向概率”。
举个例子:假设一个袋子里有N个红球和N个白球,伸手随机摸一个,摸出红球的概率是多大呢?显然摸出红球的概率是1/2,这便是正向概率。
那么“逆向概率”是什么呢?《公式之美》一书见告我们:如果我们事先并不知道袋子里红球和白球的比例,而是闭着眼睛摸出一些球,然后根据手中红球和白球的比例对袋子里红球和白球的比例做出推测,这便是“逆向概率”。
也便是说,当你不能准确知悉一个事物的实质时,你可以依赖履历去判断实在质属性。
用数学措辞表达便是:支持某项属性的事宜发生得愈多,则该属性成立的可能性就愈大。
与其他统计学方法不同,贝叶斯定理建立在主不雅观判断的根本上,你可以先估计一个值,然后根据客不雅观事实不断改动。
这个研究看起来平淡无奇,名不见经传的贝叶斯也未引人把稳。
他写的论文直到他去世后的第二年,才由他的一位朋友在1763年揭橥。

百科新知|人工智能与贝叶斯定理_措辞_概率 文字写作

那么贝叶斯定理在人工智能领域又是如何表示的呢?人工智能有许多运用,它们大致可分为五类:自然措辞处理、语音识别、打算机视觉、专家系统和智能机器人。
自然措辞处理便是让打算机代替人来翻译措辞、识别语音、认识笔墨和进行海量文献的自动检索。
但是,人类的措辞可以说是信息里最繁芜最动态的一部分。
人们最初想到的方法是措辞学方法,让打算机学习人类的语法、剖析语句,等等。
尤其是在乔姆斯基提出“形式措辞”往后,人们更武断了利用语法规则的办法进行笔墨处理的信念。
但是,几十年过去了,在打算机措辞处理领域,基于这个语法规则的方法险些毫无打破。

率先成功利用数学方法办理自然措辞处理问题的是贾里尼克。
他认为语音识别便是根据吸收到的一个旗子暗记序列推测说话人实际发出的旗子暗记序列(说的话)和要表达的意思。
这就把语音识别问题转化为一个通信问题,而且进一步简化为用贝叶斯定理处理的数学问题。

基于贝叶斯定理,语音识别问题可以分解为:给定笔墨序列后涌现这条语音的条件概率及涌现该条文字序列的先验概率。
对条件概率建模所得模型即为声学模型,对涌现该条文字序列的先验概率建模所得模型即为措辞模型。
这种语音识别系统不但能够识别静态的词库,而且对词汇的动态变革具有很好的适应性,纵然是新涌现的词汇,只要这个词已经被大家高频利用,用于演习的数据量足够多,系统就能精确地识别。

随着大量数据输入模型的迭代,和大数据技能的创造,贝叶斯定理的威力日益凸显,它的实用代价也加倍显现。
(卯言)