注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

Puriney's Notes

Puriney=purine+Y, my Wonderland

 
 
 

日志

 
 

[bio] 小品pysam——方向  

2013-09-14 10:14:46|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
用pysam时,判断read是否为正负链时,它提供了一个方法:

read.is_reverse

如果是比对在反义链上则为真

英文翻译过来为中文,比较清楚地知道,就是判断该read是否在反义链(3'->5'方向)上。但是本diao不知道怎么抽筋了,在处理reads时,把所有read.is_reverse的条目都continue了。按着我当时脑子短路的想法,reverse会这样判断:
- 当我处理正链信息时,如果read是反义链则会跳过
- 当我处理反义链信息是,如果read是正链则会跳过
我现在仔细回想,这是被reverse一词给迷惑了,也把功能想地过于复杂(当然也体现认知水平太低下)

不论是bowtie也好,star也好,或者是palmapper也好,比对软件产生的sam/bam结果,其实就早已经包含了read的正负链信息。这是来自于基因组的fasta文件(也就是写满了ATCG的生命之书)。基因组的fasta文件默认记录的是5'->3'的基因组信息。在比对软件比对之前,会对基因组构建index(正负链都有)。搜索read时,如果read比对上的是fasta默认的文本,那么read自然就是正链;反之亦然。

我用pysam时还会有一点混乱,是曾经遭遇过这么一个数据。它RNA-seq数据测下来,所有的reads信息都是比对在了反义链上。即基因注释里的正链基因,却有很强反义链的信号;反之亦然。坐标完全吻合,唯独方向相反。这与有时候处理RNA-seq数据时看到的双向转录完全不是一个层面。 

解释的原因是,在构建RNA-seq测序库时,UTP来合成第二链,即那些与mRNA互补的序列被测序了。还是按照加黑的原则,正链基因互补的序列自然是反义链,因此反义链上存在了大量信号。
  评论这张
 
阅读(509)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017