注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

Puriney's Notes

Puriney=purine+Y, my Wonderland

 
 
 

日志

 
 

[Daily-R]t.test/wilcoxon.test/permutation.test  

2012-11-19 14:52:56|  分类: Bio |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

Intron长度差异分析

paper顺便扯扯统计. 这里一瞥t.testwilcoxon.testpermutation test的用处. 从应用角度概要来说适用范畴:

  1. t.test适用符合正态分布, 数据量比较大
  2. 如果不符合(不确定是否符合)正态分布, 或者数据量不够大(<=20),则建议用wilcoxon.test
  3. 如果压根就不清楚是否符合正态分布, 压根数据量就很小, 则建议直接上permutation test.

各种原理考究可以参考Y叔的博文. 特别推荐对Y叔对t.test的介绍. 这里专门来扯一扯t.test (wilcoxon.test)的应用.

除了确定单个母本数据的置信区间t.test (wilcoxon.test)可以用来比较两组母本数据的均值, 直观来说是比较两组数据是否有明显差异.

最近看这篇paper, 有一例说:

Class1 introns were on average longer, compared with introns of other classes.

于是挑取数据出来, 用作案例分析.

首先, 单从均值来看:

> mean(c1len)
[1] 3672.484
> mean(cothlen)
[1] 2486.772

Class1比其他class确实长那么点. 可是长的明显麼? (怎么略邪恶了...)

其次, 从wilcox.test来看, 差异略明显.

> wilcox.test(c1len,cothlen)

Wilcoxon rank sum test with continuity correction

data: c1len and cothlen
W = 4441989, p-value < 2.2e-16
alternative hypothesis: true location shift is not equal to 0

紧接着, 直观上图来看.

hist_length_distribution_difference1.png

从分布图来看, Class1比其他class涵盖了更长的intron. 这点可以放大到局部来验证(用ylim, 虽然这有点误导).

zoom-in-distributiondifference_of_class1and_other_classes.png

从放大局部来看, 似乎Class1的"势力"范围更大, 而对于短intron, 似乎二者没有太大区别.

因此我就琢磨, 是不是这些多余的势力范围才使得Class1就比其他class的intron更长?于是我把Boxplot图里的离群点挑了出来. Boxplot里的Q4线 (Q0线)是n*(Q3 - Q1)而得到的. 这里n=2.5后, 分别大概找到了boxplot箱子的最上限. 对于Class1用黑线, 对于其他class用了橘色线.

boxplot-length-distribution-diffrence2.png

所以, 第一步把离群点剔除之后, 继续看分布图:

sub_set_introns_distribution.png

不敢下什么结论. 第二步来看看boxplot.

boxplot_subset_introns_distribution.png

似乎Class1仍然比其他class还要长.

最后一步看看wilcox.test:

> mean(c1len_sub)
[1] 1620.365
> mean(cothlen_sub)
[1] 1175.363
> wilcox.test(c1len_sub,cothlen_sub)

Wilcoxon rank sum test with continuity correction

data: c1len_sub and cothlen_sub
W = 3533760, p-value < 2.2e-16
alternative hypothesis: true location shift is not equal to 0

所以Class1还是和其他class有明显差异......麼? 故此排除了我的疑虑, 整体而言, Class1确实富集了更长的intron.


END

  1. http://ygc.name/2012/05/29/t-test/
  2. http://ygc.name/2009/11/05/wilcoxon-test/
  3. http://ygc.name/2012/10/26/permutation-test/
  4. http://gossipcoder.com/?p=1026
  5. http://gossipcoder.com/?p=1012
  6. http://genome.cshlp.org/content/suppl/2012/07/24/gr.131847.111.DC1.html
  评论这张
 
阅读(923)| 评论(1)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017