转录组测序服务

产品简介:

转录组即某个物种或特定细胞在某一功能状态下产生的所有RNA的总和,是研究细胞表型和功能的一个重要手段。与基因组不同的是,转录组的定义中包含了时间和空间的限定。同一细胞在不同的生长时期及生长环境下,其基因表达情况是不完全相同的。转录组测序是指利用第二代高通量测序技术进行cDNA测序,全面快速地获取某一物种特定器官或组织在某一状态下的几乎所有转录本。相对于传统芯片而言,转录组测序无需预先设计探针,即可对任意物种的任意细胞类型的转录组进行检测,能够提供更精确的数字化信号,更高的检测通量以及更广泛的检测范围,是目前深入研究转录组复杂性的强大工具。


转录组测序比其他研究方法有哪些优势?

(1)可以直接测定每个转录本片段序列、单核苷酸分辨率的准确度,同时不存在传统微阵列杂交的荧光模拟信号带来的交叉反应和背景噪音问题;(2)灵敏度高,可以检测细胞中少至几个拷贝的稀有转录本;(3)可以对任意物种进行全基因组分析,无需预先设计特异性探针,因此无需了解物种基因信息,能够直接对任何物种进行转录组分析,同时能够检测未知基因,发现新的转录本,并准确地识别可变剪切位点及cSNP,UTR区域。(4)检测范围广,高于6个数量级的动态检测范围,能够同时鉴定和定量稀有转录本和正常转录本。


应用范围:

1.基因表达水平研究:可以定量检测基因的表达水平(RPKM);

2.转录本结构研究:UTRs区域鉴定、Start codon鉴定、内含子边界鉴定、可变剪切研究;

3.转录本结构变异研究:融合基因鉴定、cSNP(编码序列单核苷酸多态性)研究;

4.非编码区域功能研究:鉴定Non-coding RNA, microRNA前体及成熟的microRNA预测;

5.低丰度转录本及新转录本的发现。



测序对样品的要求:

1. 动物、植物、微生物

1) 请提供总量大于2g的新鲜样品;植物材料应尽量选取幼嫩部位,避免过老的组织。

2) 采样后将样品立即用液氮速冻,保存于-80℃(保存期不超过1个月),送样时使用干冰运输(不超过72h)。

3) 送样管务必标清样品编号,管口使用Parafilm膜密封。

4) 样品保存期间切忌反复冻融。

5) 样品质量合格与否的判断标准:RNA提取后经变性电泳,各RNA条带清晰,比例适中,完整性好,无降解。

6) 请填写完整的送样订单,并提供尽量详细的物种基因组背景资料信息,如基因组大小,基因平均长度,预计表达的基因数量等。

2. RNA

1) 请提供请提供OD260/280介于1.8~2.2之间,浓度≥250ng/μl,总量≥40μg的总RNA,并确保RNA无降解,无污染;或提供浓度≥50ng/μl,总量≥400ng的mRNA。

2) 送样管务必标清样品编号,管口使用Parafilm膜密封。

3) 样品保存期间切忌反复冻融。

4) 送样时使用干冰运输。

5) 质检以我方电泳胶图、紫外分析仪定量为准。

6) 请填写完整的送样订单,并提供RNA电泳检测照片,用自封袋密封后随同样品一起送样。

3. 双链cDNA

1) 请参照美吉生物提供的cDNA 454文库构建流程进行文库构建,去除文库中的Poly A。

2) 总量>5μg,浓度>50ng/μl,OD260/280在1.8左右。

3) 送样管务必标清样品编号,管口使用Parafilm膜密封。

4) 样品保存期间切忌反复冻融。

5) 送样时使用干冰或冰袋运输。

7) 请填写完整的送样订单,并提供cDNA电泳检测照片,用自封袋密封后随同样品一起送样






生物信息学分析:

1. 无参考基因组转录组分析 (De novo Transcriptome Analysis




1) 测序原始数据处理(质量剪切、污染序列去除等)

根据测序接头以及测序质量对原始的测序数据进行预处理,其中,测序质量Q与测序错误E之间的关系如下:



Q = -10Log2E

                              测序质量数值Q               

测序错误率E

13

 5%

20

1%

30

                            0.1%                       


预处理后质量以及碱基分布统计图

2) Contig和Unigene统计分析

拼接后转录本长度的分布图


3) Unigene功能注释(COG、GO和KEGG等)

COG分类分布情况展示图

GO 功能分类展示图

KEGG 代谢通路展示图,对拼接得到的unigene进行KEGG pathway 映射。


4) SNPs及SSR分析等

对拼接得到 UniGene进行 SNP和SSR 简单重复序列的查找。

寻找单核苷酸重复的次数在10次或10次以上,二核苷酸重复的次数在 6次或6次以上,三至六核苷酸重复的次数在 5次或 5次以上打断的不完全重复的SSR。

结果:SNP单核苷酸突变位点信息和SSR重复序列的信息文件以及统计文件。

5) 表达差异分析(不少于两个样品)

对定量的结果进行统计分析,找出差异表达的基因。

通常采用双层过滤筛选差异基因方法

FC值筛选:采用Fold-change(FC),表达差异倍数进行第一层此的差异基因筛选

FDR检验:一般采用卡方检验中的fisher精确检验进行p值检验,采用Benjamini FDR(False discovery ratio)校验方法对p值进行假阳性检验,即,通过FDR显著性参数进行第二层次的差异基因筛选,用火山图展示差异基因如下:




FDR<5%且结合倍数筛选方法,用散点图和SAM Plot展示差异表达基因


2.有参考基因组的转录组分析(Transcriptome analysis with reference genome)


1) 测序原始数据处理(质量剪切、污染序列去除等)

根据测序接头以及测序质量对原始的测序数据进行预处理,其中,测序质量Q与测序错误E之间的关系如下:



Q = -10Log2E

   测序质量数值Q                                

                                      测序错误率E                

        13

                                           5%

        20 

                                            1%

        30

                                            0.1%


预处理后质量以及碱基分布统计图


2)短序列mapping至参考基因组序列


3)基因功能注释及KEGG和GO富集分析展示

GO 功能分类展示图(同上)

KEGG 代谢通路展示图,对拼接得到的unigene进行KEGG pathway 映射(同上)。


4) 基因融合分析

寻找可能发生融合的基因,通过测序片段的splicing事件以及pair-end测序的距离信息进行基因融合位点的定位,如果一个测序片段的一个子片段与geneA匹配,另一个子片段与geneB匹配,那么geneA与geneB有可能为一个融合基因,而当pair-end双向测序时,一对测序片段中一个与geneA匹配,另一个与geneB匹配,那么geneA与geneB有可能为一个融合基因。如果同时满足两个条件,那么融合发生的可能性就较大。

5) 可变剪切分析

寻找不同的可变剪接类型



6)差异表达基因分析

对定量的结果进行统计分析,找出差异表达的基因。

通常采用双层过滤筛选差异基因方法
FC值筛选:采用Fold-change(FC),表达差异倍数进行第一层此的差异基因筛选
FDR检验:一般采用卡方检验中的fisher精确检验进行p值检验,采用Benjamini FDR(False discovery ratio)校验方法对p值进行假阳性检验,即,通过FDR显著性参数进行第二层次的差异基因筛选,FDR<5%且结合倍数筛选方法,用散点图和SAM Plot展示差异表达基因



7) 预测新的基因并进行功能注释

首先得到在基因间区有测序序列富集的一些段区域,然后,排除那些已经有注释的那些段区域作为候选的新基因

8) cSNV查找,转录水平找出变异位点或者片段。

通过测序数据得到基因组每个位点的碱基富集情况;然后,统计每个点富集富集的碱基种

类,得出可能存在的变异(即,与参考基因组碱基不同且富集程度较高的碱基类别)。



已有发表的相关文献:

The "Grep" Command But Not FusionMap, FusionFinder or ChimeraScan Captures the CIC-DUX4 Fusion Gene from Whole Transcriptome Sequencing Data on a Small Round Cell Tumor with t(4;19)(q35;q13).

Panagopoulos I, Gorunova L, Bjerkehagen B, Heim S.

PLoS One. 2014 Jun 20;9(6):e99439. doi: 10.1371/journal.pone.0099439. eCollection 2014.

IF:3.06


Identification and comparative analysis of the Pseudosciaena crocea microRNA transcriptome response to poly(I:C) infection using a deep sequencing approach.

Qi P, Guo B, Zhu A, Wu C, Liu C.

Fish Shellfish Immunol. 2014 Jun 16. pii: S1050-4648(14)00208-3. doi: 10.1016/j.fsi.2014.06.009. [Epub ahead of print]

IF:3.322


Characterization of the Floral Transcriptome of Moso Bamboo (Phyllostachys edulis) at Different Flowering Developmental Stages by Transcriptome Sequencing and RNA-Seq Analysis.

Gao J, Zhang Y, Zhang C, Qi F, Li X, Mu S, Peng Z.

PLoS One. 2014 Jun 10;9(6):e98910. doi: 10.1371/journal.pone.0098910. eCollection 2014

IF:3.06


Correcting imbalanced reads coverage in bacterial transcriptome sequencing with extreme deep coverage.

Zhang X, Gangaiah D, Munson RS Jr, Spinola SM, Liu Y.

Int J Comput Biol Drug Des. 2014;7(2-3):195-213. doi: 10.1504/IJCBDD.2014.061646. Epub 2014 May 28.



Deep sequencing blood transcriptomes.

Forrest AR.

Blood. 2014 Apr 24;123(17):2595-6. doi: 10.1182/blood-2014-03-563452. No abstract available.

IF:9.06


De novo transcriptome and small RNA analyses of two amorphophallus species.

Diao Y, Yang C, Yan M, Zheng X, Jin S, Wang Y, Hu Z.

PLoS One. 2014 Apr 23;9(4):e95428. doi: 10.1371/journal.pone.0095428. eCollection 2014.

IF:3.06


Validation of predicted mRNA splicing mutations using high-throughput transcriptome data.

Viner C, Dorman SN, Shirley BC, Rogan PK.

Version 2. F1000Res. 2014 Jan 13 [revised 2014 Apr 7];3:8. doi: 10.12688/f1000research.3-8.v2. eCollection 2014.