CD基因组——基因组服务公司
支持文档 CD基因组学的思维方式 探索我们开发的科学文件,包括样本提交指南,原则,应用和遗传技术的生物信息学。欧宝官网app苹果下载
首页/资源/支持文档/基因组研究/ LncRNA测序工作流程及数据分析欧宝体育官网网址

LncRNA测序工作流程及数据分析欧宝体育官网网址

LncRNA是长度超过200个核苷酸的非编码RNA。与mRNA相比,lncRNA一般表达较低,具有较强的组织特异性。lncRNA是RNA研究的热点之一,它在表观遗传、转录和转录后等多个层面调控编码基因的表达。与传统的芯片检测不同,lncRNA分析结合高通量测序技术和生物信息学分析可以全面挖掘样本中lncRNA的信息。欧宝体育官网网址LncRNA测欧宝体育官网网址序技术已广泛应用于物种遗传改良和疾病发生、发展、诊断和治疗的研究。LncRNA测序工作流程欧宝体育官网网址典型的lncRNA测序包括总RNA欧宝体育官网网址质量评估、文库制备和测序。从RNA样本到最终数据,每一步都对数据的质量和数量产生影响。因此,获得高质量的数据是确保生物信息分析全面可信的前提。

LncRNA测序工作流程及数据分析欧宝体育官网网址

图1。lncRNA测序概述欧宝体育官网网址

(1)总RNA检测.主要包括RNA降解程度和污染分析、RNA纯度检测(OD260/280比)、RNA浓度精确量化(Qubit)和RNA完整性检测。(2)图书馆建设。在总RNA符合文库制备条件后,进行基于poly-A的mRNA富集,然后进行mRNA破碎,以减少rRNA的读取。然后利用逆转录酶(Super-Script II)和随机引物将富集和破碎的RNA合成cDNA。利用缓冲液、dntp (dUTP, dATP, dGTP和dCTP)和聚合酶进一步将cDNA转化为双链DNA。cDNA片段在末端被修复并连接到平台特异性适配器上。(3)文库检测和测序。欧宝体育官网网址文库构建完成后,进行初步量化和稀释,然后对文库的片段大小进行测试。Hiseq/Miseq测欧宝体育官网网址序在库检查之后执行。LncRNA测欧宝体育官网网址序数据分析通过Illumina配对端测序生成raw RNA-seq reads后,lncRNAs的数据分析和鉴定如下:欧宝体育官网网址

LncRNA测序工作流程及数据分析欧宝体育官网网址

图2lncrna的数据分析和鉴定综述

(1)数据预处理
  • 质量评估。获取原始数据(fastq文件)后,使用FastQC v0.11.3评估原始读取的质量,包括测序错误率分布和GC内容分布。欧宝体育官网网址
  • 数据过滤。原始测序序列包含低质量的读欧宝体育官网网址取序列和适配器序列。为了保证数据分析的质量,必须对原始读取进行过滤以获得干净的读取,后续的分析基于干净的读取。数据过滤主要包括去除了读取中的适配器序列,去除了N比例高的读取(N表示未确知的基信息),去除了低质量的读取。该过程使用Cutadapt和Trimmomatic进行。
(2)综合质量评价RNA-seq主要包括样本间相关性评价(Pearson相关系数)和均匀分布评价。(3)对参考基因组进行比对。STAR对齐器和Tophat 2通常用于读取对齐。如果正确选择了参考基因组,并且实验中没有污染,那么映射的结果(总映射读或片段)通常会高于70%。(4)数据探索。在对文件进行排序后,使用DESeq2进行数据探索。输出结果可用于RNA-seq样品间的聚类分析和主成分分析(PCA)分析,探索样品间的关系或验证实验设计。样本聚类距离或PCA距离越近,说明样本越相似。(5)成绩单组装。抄本由袖扣或经文软件汇编。Cufflinks使用概率模型在尽可能小的同时集合和量化了亚型集的表达水平,提供了映射点表达数据的最大似然解释,并为链特定库准确地提供了具有特定参数的链信息。bible是基于统计分割模型来区分表达位点和实验背景噪声的,它提供了所有在映射位点上有统计学意义表达的异构体信息,适用于长转录本的组装。(6)候选lncRNA筛选
  • 基本的筛选。基础筛选分为三步:首先筛选长度大于200bp且外显子数量大于2个的转录本;然后,通过Cufflinks计算每个成绩单的覆盖率,选择最小阅读覆盖率大于3的成绩单;最后,通过与已知非lncRNA的比较筛选出非lncRNA,并用Cuffmerge的结果进行位置筛选(不同种类的lncRNA选择不同的class-code)。
  • 编码潜力评价。编码潜能是判断lncRNA的关键因素。目前,编码势分析的主流方法有编码势计算器(CPC)分析、编码非编码指数(CNCI)分析、PFAM蛋白结构域分析和PhyloCSF分析。
(7)表达分析。主要包括表达水平比较、差异表达分析、差异表达lncRNA筛选、lncRNA表达聚类分析和组织或表型特异性分析。这些分析通常使用DESeq或Cuffdiff进行。(8)先进的分析
  • LncRNA靶基因预测。lncRNA的功能与邻近的编码蛋白基因有关。确定lncRNA邻近的蛋白质编码基因进行功能富集分析,并在lncrnatgets中预测lncRNA的主要功能。
  • 特异性lncRNA的功能富集分析。特异性lncRNA一般是指差异表达或组织或表型特异性表达的lncRNA。可以分别用GO和KEEG对这些特异性lncrna进行功能富集分析。
  • 相互作用分析。LncRNA与mRNA通过靶向关系关联,mRNA通过蛋白质关联,形成LncRNA -mRNA-蛋白质的相互作用网络。这种相互作用可以通过Cytoscape可视化。
如果您对我们的lncRNA测欧宝体育官网网址序服务人员,请随时与我们的科学家联系。除此之外,我们还提供一揽子的ob 体育 服务涉及RNA-seq小核糖核酸测序欧宝体育官网网址circRNA测欧宝体育官网网址序degradome测欧宝体育官网网址序,ob 体育在线竞猜

引用:

  1. 阿里戈尼,兰扎尼,V.,罗塞蒂,G.,潘采里,I.,阿布里格尼,S.,博纳尔,R. J. P.,.(2016)。“分析RNA-seq和非编码RNA”。Polycomb组蛋白.施普林格纽约。
  2. Anders, S.和Huber, W.(2010)“序列计数数据的差分表达式分析”。基因组生物学.11: R106。
  3. 郭小霞,高亮,王燕,赵德凯,王涛,邓燕(2015)。“长非编码rna的进展:识别、结构预测和功能注释”。功能基因组学简介, 38-46 15(1)。
  4. Guttman, M., Garber, M., Levin, J. Z., Donaghey, J., Robinson, J., Adiconis, X.,.(2010)。小鼠细胞类型特异性转录组从头计算重建揭示了lincRNAs的保守多外显子结构。自然生物技术, 28(5): 503 - 510。
  5. C.特拉普内尔,A.罗伯茨,L.戈夫,G.珀特提,D.金,dr .凯利,.(2012)。TopHat和Cufflinks RNA-seq实验差异基因和转录本表达分析。自然的协议,7(3): 562 - 578。
*只供研究用途。不用于诊断程序。
和我们的科学家谈谈

你想讨论什么?

我们要和谁谈话?

验证码

*为必填项。

从CD基因组学获取最前沿的科学信息,每个月直接发送到您的收件箱。

订阅我们的通讯
CD基因组——基因组服务公司
欧宝娱乐平台正规安全吗


服务

Baidu