注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

Puriney's Notes

Puriney=purine+Y, my Wonderland

 
 
 

日志

 
 

[统计旧帐]标准差(SD)与标准误(SE)的区别  

2014-05-11 11:40:34|  分类: Numb |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
总有一些统计基本概念的旧帐需要翻一翻。这次翻翻看标准差Standard deviations 和标准误standard errors。直接参考这篇简单通俗的文献:http://www.ncbi.nlm.nih.gov/pmc/articles/PMC1255808 与这篇吐槽贴:http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2959222/

标准误其实就是一种标准差
一方面,“标准误与标准差有什么差别”这个问题我个人觉得本身不太成立的。标准误需要对应一个样本统计量(比如均值就是一个统计量)。标准误不能单独存在,提起标准误就必须提起它究竟是去衡量什么,究竟什么“误”了,究竟什么的波动有多大。
另一方面,标准误其实就是一种标准差。现在想想我们做的实验,比如做了几次定量PCR检测基因表达水平。客观情况真正的表达水平我们是无法直接获知的,我们能够知道的仅仅是我们实验的结果,目的是希望这个实验结果能够尽量正确地代表客观、真理、实际存在但无从知道的数据。手里拿到的数据与客观事实颇有小圆环套在大圆环内的感觉,我们每一次的实验其实是对客观事实的采样。二者能不能划上等号?这个至少对于生物来说不太可能。今天做的、明年做的;你自己做的、师兄做的,这些结果都不太相同,各自的均值都不尽相同。为了衡量这些均值的波动性,均值标准误的概念就出现了。所以标准误其实也是一种标准差,都是去衡量波动。

描述数据
在很多期刊里总能看见诸如69.4±9.3 kg 此类的数据说明,但是这一加一减的东西究竟是什么?所以我想,其实更多的误解是来自于标准差与均值标准误。

如第一篇文献里说的:

The terms “standard error” and “standard deviation” are often confused. The contrast between these two terms reflects the important distinction between data description and inference, one that all researchers should appreciate.

标准差的用途是描述数据的波动性,所以它是用于描述数据;标准误则是用于统计推断的。在说统计推断之前先说说均值标准误是怎么被滥用的。均值标准误(SEM)与标准差二者在数字上的关系是这样的:
[统计旧帐]标准差(SD)与标准误(SE)的区别 - Puriney - Purineys Notes (公式图片来自维基百科)
 SE_x是均值标准误,s是你手里有的数据的标准差,n是你手里数据的数量。也一如文献里提到的,SEM随着样本数变大而变小:

The standard error of the sample mean depends on both the standard deviation and the sample size, by the simple relation SE = SD/√(sample size). The standard error falls as the sample size increases, as the extent of chance variation is reduced—this idea underlies the sample size calculation for a controlled trial, for example. By contrast the standard deviation will not tend to change as we increase the size of our sample.

而且很容易发现,从数字上看,均值标准误是永远比标准差要小的。于是均值标准误就被错用为标准差,错误地用于数据描述,这样好像使得自己的数据看上去更加稳定。
均值标准误与置信区间
如果是正态分布,则95%的置信区间是 均值± 1.96 * SEM


  评论这张
 
阅读(2398)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017