CAU06018的个人博客分享 http://blog.sciencenet.cn/u/CAU06018

博文

警惕:别让对统计结果的误读误导科学研究(三) 精选

已有 4856 次阅读 2021-8-30 22:50 |系统分类:科研笔记

(三)“时-空替代”的时间尺度

通俗地讲,“时-空替代(Space-for-time substitution)”法就是利用空间上的统计规律去预测时间上变化。例如,空间尺度的区域调查发现,土壤pH与某个参数具有显著负相关。此时,我们或许会做出预测:土壤酸化(即,pH下降)后该参数会增加。从本质上,-空替代偷换了时间和空间的概念。今天要说的是,偷换概念过程中可能存在时间尺度的匹配错误,属于对统计结果的另一类误读。

1)为什么要采用“时-空替代”法?在生态环境领域,相当多的研究关注某一(类)因子发生变化后可能带来的影响。例如,在当今热门的全球变化领域,有人关注气候变化的原因、趋势和应对措施,但估计有近一半的研究侧重于探讨气候变暖所带来的各种影响。此时,最简单的方案是在实验室设计增温实验,分析目标参数随温度增加的变化。但是这样的设计人为割裂了生态系统各部分之间的紧密联系(即,整体性),也不能反映生态系统响应气候变暖的空间差异(即,空间异质性)。为克服这些问题,最理想的办法是在全球范围内广泛选择各种典型生态系统进行长期原位增温实验,但是这种做法在操作上具有相当的难度。据笔者所知,具有三个以上温度梯度的原位增温实验在全球范围内也没有几个。在这种背景下,-空替代法提供了一种折中的方案:通过目标参数与温度在大尺度空间上的统计关系来预测气候变暖后该参数的变化。这种方案貌似可行:目标参数是原位实测值,能够反映生态系统的整体性;研究区域覆盖了很大空间,能够反映生态系统的空间异质性。但是这种“时-空替代”法有一个重要但却容易被忽视的前提:造成数据空间变异所需的时间必须与气候变暖所需的时间在同一尺度上(即,时间尺度匹配)。

2)时间尺度的差别:对于特定的目标参数Y,它的空间变异是多种过程的综合效应。这些过程在作用机制上不尽相同,需要的时间也有很大差别。以图2为例,横坐标为时间(T),纵坐标为目标参数(Y),黑色和绿色曲线分别代表两种过程对Y的实际影响。图2中包含了两个信息:1. 黑色和绿色过程都有周期性,但周期在时间尺度上有很大差别;2. 红色的Y值(即,表观实测值)是黑色和绿色两个过程的平衡。如果我们对目标参数Y和相关影响因子进行区域性考,并得到了它们之间的空间统计关系。此时,一个问题应该紧接着被提出来:这种表观统计结果到底代表那种过程呢?黑色还是绿色过程?这种表观统计结果对应的机制过程与我们关注的过程在时间尺度上匹配吗?如果不匹配,应该通过更进一步的方法努力找到尺度匹配的统计关系。这些问题,统计学不会告诉我们,而是需要我们自己根据面对的实际问题做出判断。

                                               3.jpg

图2. 时间尺度差别的示意图.

3)时间尺度的不匹配的后果:-空替代法在当今的生态环境领域应用非常广泛,但很多时候是潜意识地的应用。不少人在论文发表之后也没意识到自己应用了“时-空替代”法,何谈会注意到时间尺度匹配呢?那么如果时间尺度不匹配,结果会怎么样呢?那就会出现类似“张冠李戴”、“关公战秦琼”的笑话。容易识破的,别人会一笑而过;复杂点的不容易被发现,或许会被当作重大科学发现而继续误导后人的研究工作。笔者注意到,很多已经公开发表的文献中都存在时-空尺度不匹配的问题。有些情况,对文章的主要结论没有太大影响;有些情况,论文的“创新性”结论就是因为时间尺度不匹配造成的。下面举三个例子,由通俗逐渐专业:

一个通俗点的:冬-春季是感冒的高发季节,而夏-秋季感冒的发病率相对较低。如果整理全国的感冒发病率与气温数据,或许会发现:感冒发病率与气温存在显著的负相关。但如果据此推论:气候变暖会降低感冒发病率,这就非常可能是一个天大的笑话。原因在于,上述统计关系在时间尺度上与要预测的事情完全不同。气温与感冒发病率之间的关系属于季节性变化,但是预期的气候变化需几十年甚至上百年才会完成。

一个稍微专业点的:植物光合作用需要从大气中吸收二氧化碳(CO2),光合作用越强,CO2吸收越多。因此,大气中CO2的浓度有一个季节性变化:春夏季低,秋冬季高。此时如果统计一年内温度与大气CO2浓度之间的关系,会发现:温度与CO2浓度之间呈负相关。如果据此预测:全球变暖会降低大气CO2浓度,或者CO2浓度升高会缓解全球变暖,估计气候变化相关的专家有撞墙的欲望

一个专业点的:气候条件可以通过两种途径影响土壤有机碳的周转。第一种:气候可以通过塑造土壤属性,进而通过土壤属性间接影响有机碳的周转。这种过程一般以千年为时间尺度,因为气候是通过影响岩石的风化成土过程来塑造土壤属性的,这一过程属于地质过程的范畴。第二种,气候通过直接影响土壤微生物的组成和活性来调控有机碳的周转。由于微生物对温度变化的响应较快,这一影响的时间尺度与气候变化的尺度基本一致。此外,土壤属性亦可以通过控制有机碳的微生物可及性和微生物活性直接影响有机碳的周转,其时间尺度与有机碳周转的相同。目前科学界公认的土壤有机碳保留时间(等效于现存有机碳从土壤中全部流失所需的时间)在10-25年左右。实际调查中,观测到的有机碳周转速率是上述三种过程(即,气候的直接和间接影响、土壤属性的直接影响)共同的结果。如果我们得到了气候-土壤因子与有机碳周转速率之间的空间统计关系,接下来最重要的是什么?是甄别统计关系对应的时间尺度,并找出与气候变化-有机碳周转尺度(十年尺度)相匹配的统计关系。忽略这一点,胡子眉毛一把抓,可能会得出一些“似是而非”的结论。在文献中经常看到下面的情况:利用空间大数据进行结构方程或路径分析,而后得出:气候因子(温度和/或降水)是影响土壤有机碳周转的主要因子,气候变暖之后有机碳会如何变化,等等结论。那么气候是如何影响的呢?这些模型经常会给出如下路径:气候影响土壤属性而后影响有机碳的周转。我想说的是:上述路径属于千年尺度的过程,而气候变化-有机碳周转属于十年尺度的过程,将如此两个时间尺度完全不同的因果联系起来是对空间统计关系的误读。至于如何从这种复杂表观统计关系中解析出时间尺度匹配的因果关系?或者说,这种表观统计关系代表的实际意义是什么?这在学术界尚有争议,在这里不做过多讨论。

本文中,笔者仅以气候变化与土壤有机碳周转为例探讨了“时-空替代”法在应用中可能存在的时间尺度不匹配问题。实际上,该方法在其它领域也存在广泛的应用,希望本文亦能够为这些领域的专家学者们提供一定参考。

 

通过三篇短文,分享了关于统计误读的一些粗浅认识,希望这些经验之谈还能有些用处。此外,如果所举的例子恰好与您的某项研究成果类似,那纯属巧合,绝无冒犯之意,也请您不必介怀。




https://blog.sciencenet.cn/blog-3486388-1302127.html

上一篇:警惕:别让对统计结果的误读误导科学研究(二)
下一篇:偏回归分析:一种克服变量共线性的回归方法
收藏 IP: 124.64.17.*| 热度|

14 黄永义 檀成龙 李方和 左小超 高景 饶鑫 刘金涛 杜学领 唐小卿 冯兆东 岳东晓 王卫 黄河宁 杨正瓴

该博文允许注册用户评论 请点击登录 评论 (6 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 04:43

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部