NJU1healer的个人博客分享 http://blog.sciencenet.cn/u/NJU1healer

博文

概率论和统计学的区别

已有 16731 次阅读 2020-5-4 17:05 |个人分类:机器学习|系统分类:科研笔记

       Larry Wasserman在他的统计学巨作All of Statistics的序言里有说过概率论和统计推断的区别,如下图所示。

image.png

       它们之间的区别包括:(1)概率论是统计推断的基础,在给定数据生成过程下观测、研究数据的性质(2)而统计推断则根据观测的数据,反向思考其数据生成过程。预测、分类、聚类、估计等,都是统计推断的特殊形式,强调对于数据生成过程的研究。因此,统计和概率是方法论上的区别,一个是推理,一个是归纳。

       通过一个形象的例子具体说明,如下:

image.pngimage.png

       打个比方,概率论研究的是一个白箱子,你知道这个箱子的构造(里面有几个红球、几个白球,也就是所谓的分布函数),然后计算下一个摸出来的球是红球的概率。而统计学面对的是一个黑箱子,你只看得到每次摸出来的是红球还是白球,然后需要猜测这个黑箱子的内部结构,例如红球和白球的比例是多少?(参数估计)能不能认为红球40%,白球60%?(假设检验)

       而概率论中的许多定理与结论,如大数定理、中心极限定理等保证了统计推断的合理性。做统计推断一般都需要对那个黑箱子做各种各样的假设,这些假设都是概率模型,统计推断实际上就是在估计这些模型的参数。

       概率论就好比是给你一个模型,你可以知道这个模型会产生什么样的数据;而统计则是给你一些数据,你来判断是由什么样的模型产生的。

      点滴分享,福泽你我!Add oil!

参考:

(1)统计学与概率论的区别(CSDN):https://blog.csdn.net/diaoer7075/article/details/101229679

       另:可参考此博文Tensorflow。



https://blog.sciencenet.cn/blog-3428464-1231584.html

上一篇:机器学习范式与分类问题
下一篇:Logistic Regression(逻辑斯蒂回归)(续)
收藏 IP: 118.74.90.*| 热度|

3 周忠浩 杜学领 张利华

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...
扫一扫,分享此博文

全部作者的其他最新博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-25 15:15

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部