博客乎?茶馆乎?分享 http://blog.sciencenet.cn/u/gfcao 累时休整,烦时发泄, 闲时思考,乐时分享。

博文

天下奇谈:不知道产品的不合格数量不应使用超几何分布?

已有 7498 次阅读 2019-1-6 21:57 |系统分类:观点评述

一个朋友发给我一篇文章,对其中的几个观点表示迷惑不解,我看后不由大跌眼镜,我不知道该为自己的无知汗颜还是该为基础教育悲哀!这里没兴趣再长篇大论了,就针对几个关键问题发表一下个人观点,孰是孰非由大家评判去吧。作为一个普通教师,我左右不了中国的基础教育,但也不希望一线教师们受误导进而误人子弟!

1、不知道产品不合格数能否用超几何分布?

这是个荒唐的问题,因为产品抽检试验属于超几何分布还是二项分布与是否知道产品的不合格数量毫无关系。为便于理解,这里举一个小样本总量的例子,假设有10件产品,其不合格率为p,现从这10件产品中随机抽取两件产品,试计算刚好有一件不合格品的概率f(p)。

这里可以把10 换成任意正整数N。根据条件,10件产品中有10p件不合格,显而易见有

如果求使得f(p)取得最大值的p0,按照高考的标准求解方法,可以用求导的办法得出p0,也可以按照二次函数的最值问题计算。接下来的问题不必我多说,大家看我过去的推文就知道怎么回事了。

请问这是不是超几何分布?计算有问题吗?为什么要假设取2件产品而不是3件或4件?因为取几件就会出现关于p的几次多项式,三次以上的多项式求最值就比较复杂了。

2、什么时候可以用二项分布近似替代超几何分布?

如果是无放回式抽检,一定是超几何分布,但为什么有时候又可以当成独立重复试验呢?因为当样本总量很大时,如果抽检的样本量相对于总量很小,先抽检对后抽检抽到不合格品的概率影响不大,这时可以将抽检试验近似看成独立重复实验。问题是多大的样本总量算大?多小的抽检样本量算小样本量?这的确要视具体情况而论。但有一点可以肯定,如果市场上某种商品的不合格品率高达10%,恐怕没有多少顾客愿意购买这种商品。如果你喜欢吃的某种食品不合格率达到10%,你还敢吃这样的食品吗?因此,如果随机抽检中,抽检的样本量达到了样本总量的10%,这样的抽检量不能视为小样本抽检,换句话说,用二项分布替代超几何分布是不合适的。正因为如此,这类题通常的表述方式是,大批产品中抽检N件。那么样本总量可不可以具体给出来呢?当然可以,但只要你当成二项分布来做,给不给出总量都不影响解题。所以关键的问题是多大的样本总量算大?这是个带有一定主观性的问题,因人因产品性质而异。在我看来,抽检的样本占样本总量不超过0.01-0.05时,可以将超几何分布近似看成二项分布。

3、2018年全国高考理科I卷第20题可否当成二项分布?

专家认为,由于说的是大批量产品,所以可以将不合格品率看成每件产品都为不合格品的概率,我不知道专家学的是哪家的概率,无论产品的量有多大,只要这批产品已经生产出来了,哪件产品合格哪件产品不合格就是确定的,不确定的是不知道会抽到哪件产品,随机性正是由此而来。每件产品要么合格要么不合格,每件产品不合格的概率是多少是荒谬的说法!说明命题人压根没搞清楚抽检试验中的随机性是相对于什么而言的。如果一定要说每件产品不合格的概率均为p,正确的说法是某机器生产每件产品的不合格率均为p,这个随机性是相对于机器的生产而言的,如果机器的性能稳定,它生产出来的产品是否合格是不确定的,所以可以说生产每件产品不合格的概率是多少。只要产品被生产出来了,每件产品是否合格就是确定的,与所谓的大数定律风马牛不相及。既然是要对成箱的产品做检验,这就意味着是对生产出来的产品做检验,何来每件产品为不合格品的概率均为p?

我们姑且退一步,暂且认同专家的说法,每件产品的不合格率都是p。现在问题来了,这批产品需要分箱包装,每箱200件,然后从200件一箱的产品中抽检20件,从题目的标准解答实际可以看出,解答比较的是200件产品抽取20件后余下的产品全检还是不检的费用。我们再退一步,假设题目指的是余下的全部产品全部抽检还是全部不检,有一个问题谁能回答?这些产品是如何分箱包装的?是随机地每200件一箱还是将不合格品均匀放到各个箱子里?如果是后者,说明已经知道哪些产品合格哪些产品不合格了。可见一定是随机装箱,那么如何保证每箱产品的不合格率是一样的?如果不一样,凭什么根据其中一箱的不合格品率决定对所有的产品检测或全部不检测?对于200件一箱的产品如果还说成每件产品不合格的概率均为p恐怕太荒谬了。常识告诉我们,即使厂家生产的产品质量是相对稳定的,也不可能保证每箱产品的合格率都是一样的。这里实际涉及到了两次随机,一次是随机装箱,另一次是从装有200件产品的箱子中随机抽检20件产品。

如果专家还坚持自己的观点,我也就无话可说了。这世道死不认账的事司空见惯!早就见怪不怪了。




https://blog.sciencenet.cn/blog-40247-1155662.html

上一篇:再谈2018年高考全国理科I卷(第20题)概率压轴题--错还是没错?
下一篇:一丝嫉妒感油然而生
收藏 IP: 14.24.133.*| 热度|

11 杨正瓴 苏德辰 钟炳 闫钟峰 张珑 李颖业 郑永军 王林平 hmaoi zjzhaokeqin xqhuang

该博文允许注册用户评论 请点击登录 评论 (10 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-25 21:23

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部