概率和统计的概念
概率统计是各类学科中唯一一门专门研究随机现象的规律性的学科,随机现象的广泛性决定了这一学科的重要性。概率论是数学的分支,它研究的是如何定量描述随机现象及其规律。
我们之前经常在天气软件上看到:“今天下雨的概率是95%”,这个95%就是概率,概率就是描述可能性的一个数值。
概率在机器学习中的地位
概率论在机器学习中至关重要,因为我们可以将机器学习的输入数据看作是随机变量,当机器学习中的输出数据也看作是随机变量,这样机器学习模型本质上就是一个概率模型,这样就可以通过概率的方式来对不确定性进行建模了。
比如概率图模型中
,变量和变量之间是有依赖关系,那么此时需要概率论的技术。
又比如在很多随机算法中,比如蒙特卡络算法中,也需要概率的技术。
机器学习算法的设计通常依赖于对数据的概率假设,如果不了解概率的数学知识,很有可能在理解算法上出现问题,所以概率的重要性不言而喻。
在监督学习中,我们是从一部分带标签的样本学习得到的结果预测总体的标签,然后用这个去预测新样本的标签情况。也就是说我们通过一部分来估计总体,我们是从中抽一部分样本来进行学习,这个是符合概率的思想的。
总结
在前面的课程中,我们主要学习了线性代数以及矩阵论,从本节课程之后,线性代数将告一段落,将开启概率论和数理统计的学习。