c***y 发帖数: 615 | 1 刚刚接触这方面的概念. 想问一下, 具体的实验设计是这样.
有RNAseq的数据的话,什么样的package可以用来分析?
多谢了! |
x*****d 发帖数: 704 | 2 1.RNA提纯。Ribosomal RNA depletion (千万别用poly A selection)
2.RNA-Seq,最好50bp,80million reads以上。推荐Illumina HiSeq
3.Reads alignment,abundance estimation. 用Tuxedo Suite,http://www.nature.com/nprot/journal/v7/n3/full/nprot.2012.016.html
4.分析。这就比较麻烦了,一般是先在cufflink输出的gtf文件找novel transcript,
然后再用IGV看具体的coverage。
5.validation。 |
x*****d 发帖数: 704 | |
c***y 发帖数: 615 | 4 非常感谢。
这里 50bp是什么原因?
IGV coverage看什么?
【在 x*****d 的大作中提到】 : 1.RNA提纯。Ribosomal RNA depletion (千万别用poly A selection) : 2.RNA-Seq,最好50bp,80million reads以上。推荐Illumina HiSeq : 3.Reads alignment,abundance estimation. 用Tuxedo Suite,http://www.nature.com/nprot/journal/v7/n3/full/nprot.2012.016.html : 4.分析。这就比较麻烦了,一般是先在cufflink输出的gtf文件找novel transcript, : 然后再用IGV看具体的coverage。 : 5.validation。
|
x*****d 发帖数: 704 | 5
50bp是read length,一定要用paired-end. IGV看的是RPKM.RPKM越高,lncrna表达的程
度就越高.
【在 c***y 的大作中提到】 : 非常感谢。 : 这里 50bp是什么原因? : IGV coverage看什么?
|
b****r 发帖数: 17995 | 6 好贴
有个问题,hiseq不是一般都有100bp readlength以上吗
【在 x*****d 的大作中提到】 : : 50bp是read length,一定要用paired-end. IGV看的是RPKM.RPKM越高,lncrna表达的程 : 度就越高.
|
D***0 发帖数: 5214 | 7 另外记得作strand specific library。size selection, polya+还是polya-, 看看文
献好好想想。另,RNAseq有个毛病是,即使存在某个转录,如果表达量低,很难被测序
仪读出来。建议LZ,通过别的证据,比如histone marks(这是lncRNA 发现背后的关键
因素),coding frame,已有注释等信息先确定candidate。然后设计引物把它P出来。
★ 发自iPhone App: ChineseWeb 8.2.2
【在 x*****d 的大作中提到】 : 1.RNA提纯。Ribosomal RNA depletion (千万别用poly A selection) : 2.RNA-Seq,最好50bp,80million reads以上。推荐Illumina HiSeq : 3.Reads alignment,abundance estimation. 用Tuxedo Suite,http://www.nature.com/nprot/journal/v7/n3/full/nprot.2012.016.html : 4.分析。这就比较麻烦了,一般是先在cufflink输出的gtf文件找novel transcript, : 然后再用IGV看具体的coverage。 : 5.validation。
|
x*****d 发帖数: 704 | 8
对的.
【在 b****r 的大作中提到】 : 好贴 : 有个问题,hiseq不是一般都有100bp readlength以上吗
|
c***y 发帖数: 615 | 9 所以我前面的问题是, 现在一般的RNAseq是100bp, 为什么在检测long non-coding
RNA 时要用50bp? 有什么特别的原因吗?
【在 x*****d 的大作中提到】 : : 对的.
|
c***y 发帖数: 615 | 10 我现在是有一批cufflinks assembled transcripts which does not seem to
contains coding frame. 也就是连续翻译的长度<30 amino acids.
这个结果是来自deep-seq, RNA是经过polyA selected.
看有些文献说long noncoding RNA 是可能含有polyA tail的。 所以在想是不是应该考
虑这些 tanscripts 是 long non-coding RNA.
不过我承认, 这方面东西我还读得太少。。。
【在 D***0 的大作中提到】 : 另外记得作strand specific library。size selection, polya+还是polya-, 看看文 : 献好好想想。另,RNAseq有个毛病是,即使存在某个转录,如果表达量低,很难被测序 : 仪读出来。建议LZ,通过别的证据,比如histone marks(这是lncRNA 发现背后的关键 : 因素),coding frame,已有注释等信息先确定candidate。然后设计引物把它P出来。 : : ★ 发自iPhone App: ChineseWeb 8.2.2
|
|
|
s********x 发帖数: 472 | |
D***0 发帖数: 5214 | 12 至少最早找到的lncrna是pol2转的。但long noncoding是个很宽泛的定义。
单纯看cufflinks拼出的结果是没用的,mapping和拼接都有很多tricky的地方。你换个
流程也许拼出别的来了。老话:确定可能的candidate之后,需要别的实验证据的支持
,特别是得到全长序列。
★ 发自iPhone App: ChineseWeb 8.2.2
【在 c***y 的大作中提到】 : 我现在是有一批cufflinks assembled transcripts which does not seem to : contains coding frame. 也就是连续翻译的长度<30 amino acids. : 这个结果是来自deep-seq, RNA是经过polyA selected. : 看有些文献说long noncoding RNA 是可能含有polyA tail的。 所以在想是不是应该考 : 虑这些 tanscripts 是 long non-coding RNA. : 不过我承认, 这方面东西我还读得太少。。。
|
D***0 发帖数: 5214 | 13 如果你们的sequencing facility只提供50bp 请kick their asses
★ 发自iPhone App: ChineseWeb 8.2.2
【在 c***y 的大作中提到】 : 所以我前面的问题是, 现在一般的RNAseq是100bp, 为什么在检测long non-coding : RNA 时要用50bp? 有什么特别的原因吗?
|
p**********t 发帖数: 2636 | 14 我每次送RNA-seq library,seqcore的人都反复问我,你确定测paired-end 100 bp,
你真的确定?这个少见啊,你再确定一次?
【在 D***0 的大作中提到】 : 如果你们的sequencing facility只提供50bp 请kick their asses : : ★ 发自iPhone App: ChineseWeb 8.2.2
|
b****r 发帖数: 17995 | 15 长了还是短了?我们自己做Miseq一般都能保证150bp
【在 p**********t 的大作中提到】 : 我每次送RNA-seq library,seqcore的人都反复问我,你确定测paired-end 100 bp, : 你真的确定?这个少见啊,你再确定一次?
|
x*****d 发帖数: 704 | 16
我的意思是最少要50b paired end.100bp,150bp paired end更好.read length越长,就
越有机会cross exon-exon junction从而检测到splice variant.
【在 c***y 的大作中提到】 : 所以我前面的问题是, 现在一般的RNAseq是100bp, 为什么在检测long non-coding : RNA 时要用50bp? 有什么特别的原因吗?
|
S*******e 发帖数: 94 | 17 很多long ncRNAs本身就比较短,表达量又低不容易检测。所以担心150bp paired end
建库的时候就是300bp左右了,容易把一些lncRNA给弄断了弄丢了。所以我的一个很个
人的建议是,直接100-nt SE就可以。重点是测得深一些,后续分析仔细点。
至于exon-exon junction,其实也无所谓了。 long ncRNA gene的本身是热点,但的
splice variant其实感觉上也不是一个特别好的热点。因为做这个的需要后续,这时
候麻烦事或者无效劳动量也挺多,个人意见了。
还有就是strand specific library之后用Cufflinks这一套去拼接lncRNA。这个如果是
intergenic的,那还好说。如果是Antisense,这个如上文有人提到,有"很多tricky的
地方",从tophat这一步就开始了。
另外就是Poly-A selection或者Ribosomal RNA depletion。其实这两个技术回答的问题
有点不一样。 如果没有什么特异的考虑,那么我个人觉得Poly-A selection鉴定
lncRNAs
就可以。而如果想做些特殊的lncRNA,比如cRNA等,那样就Ribosomal RNA depletion。
最后,找到了candidates之后还是得多用IGV去具体看。还有就是得尽量用多方面的证
据多角度分析论证。
【在 x*****d 的大作中提到】 : : 我的意思是最少要50b paired end.100bp,150bp paired end更好.read length越长,就 : 越有机会cross exon-exon junction从而检测到splice variant.
|
x*****d 发帖数: 704 | 18
end
问题
很赞同! 用strand-specific library有什么优势,能否展开说说?
【在 S*******e 的大作中提到】 : 很多long ncRNAs本身就比较短,表达量又低不容易检测。所以担心150bp paired end : 建库的时候就是300bp左右了,容易把一些lncRNA给弄断了弄丢了。所以我的一个很个 : 人的建议是,直接100-nt SE就可以。重点是测得深一些,后续分析仔细点。 : 至于exon-exon junction,其实也无所谓了。 long ncRNA gene的本身是热点,但的 : splice variant其实感觉上也不是一个特别好的热点。因为做这个的需要后续,这时 : 候麻烦事或者无效劳动量也挺多,个人意见了。 : 还有就是strand specific library之后用Cufflinks这一套去拼接lncRNA。这个如果是 : intergenic的,那还好说。如果是Antisense,这个如上文有人提到,有"很多tricky的 : 地方",从tophat这一步就开始了。 : 另外就是Poly-A selection或者Ribosomal RNA depletion。其实这两个技术回答的问题
|
l**********1 发帖数: 5204 | 19 Pls check,
>This underlines the importance of identifying the presence and
understanding the function of these antisense non-coding RNAs. The
information concerning strand ori-gin is often lost during conventional RNA-
Seq; capturing this information would substantially increase the worth of
any RNA-Seq experiment. By manipulating the input cDNA during the template
preparation stage it is possible to retain this vital information. This
forms the basis of strand-specific RNA-Seq. With an ability to unlock
immense portions of new in-formation surrounding the transcriptome,
cited from
i,
Curr Genomics. (2013). 14: 173-81.
Strand-Specific RNA-Seq Provides Greater Resolution of Transcriptome
Profiling.
http://www.ncbi.nlm.nih.gov/pubmed/24179440
ii,
Nat Protoc. (2013) 8: 1494-512.
De novo transcript sequence reconstruction from RNA-seq using the Trinity
platform for reference generation and analysis.
http://www.ncbi.nlm.nih.gov/pubmed/23845962
//www.ncbi.nlm.nih.gov/pmc/articles/PMC3875132/pdf/nihms-537313.pdf
more
iii,
Nat Methods. (2010) 7: 709-15.
Comprehensive comparative analysis of strand-specific RNA sequencing methods.
http://www.ncbi.nlm.nih.gov/pubmed/20711195
iv,
Methods Enzymol. (2011). 500:79-98.
A strand-specific library preparation protocol for RNA sequencing.
http://www.ncbi.nlm.nih.gov/pubmed/21943893
【在 x*****d 的大作中提到】 : : end : 问题 : 很赞同! 用strand-specific library有什么优势,能否展开说说?
|
D***0 发帖数: 5214 | 20 为啥strand specific, 其实就一句话:为了得到真相...
【在 x*****d 的大作中提到】 : : end : 问题 : 很赞同! 用strand-specific library有什么优势,能否展开说说?
|