本文简要介绍了生物信息学分析的良好实践16 s rRNA欧宝体育官网网址测序通过NGS(下一代测序)。欧宝体育官网网址生物信息学管道涉及两个主要阶段:数据预处理(质量控制)和量化(包括分类学分析和预测宏基因组分析)。
图1。基于ngs的16S rRNA扩增子测序的生物信息学管道(Mataragas欧宝体育官网网址等.2018)。
表1。软件和统计测试用于管道的每个阶段(Mataragas等.2018)。
管道的步骤 | 使用的统计测试和软件 | 选择软件 |
处理 | Qiime v.1.9.0 | SILVAngs管道 BMPOS管道 |
分类分析(辣子鸡) | SILVAngs管道使用SILVA数据库 | 使用Greengenes数据库的BMPOS管道 EzBioCloud数据库 一个法典管道 |
宏基因组样本的统计比较 | ANOSIM使用过去的软件 | 邮票 MicrobiomeAnalyst Explicet |
微生物群落的概述 | Community-Analyzer 堆叠柱状图使用GraphPad Prism软件 |
MicrobiomeAnalyst Explicet |
所识别的OTUs的统计学意义 | METAGENassist | MicrobiomeAnalyst Explicet |
微生物群落内的共生和对抗关系 | 热图使用METAGENassist软件 | MicrobiomeAnalyst Explicet |
预测宏基因组分析(PMP) | Tax4Fun | Picrust Piphillin MicrobiomeAnalyst |
PMP结果的统计分析 | 根据Benjamini-Hockberg, Kruskal-Wallis H-test与Tuckey-Kramer校正了多次测试 使用Stamp软件的错误发现率 |
MicrobiomeAnalyst |
KEGG途径最丰富的宏基因组样本的定位 | 利用Past软件进行主成分分析 | MicrobiomeAnalyst 邮票 |
微生物群落内的代谢相互作用 | MMinte | - |
去除适配器、PCR引物和低质量碱基是序列质量控制的必要步骤。有各种各样的集成工具已经被开发出来了。' Q '是Illumina平台的输出质量评分(Q10表示每10个碱基预期出现1个错误;Q20表示每100个基地预计会有1个错误…)去除低质量分数序列可以提高生物信息学分析的准确性。与霰弹枪测序相比,这在16S rRNA扩增子欧宝体育官网网址测序中更为显著。对于16S rRNA基因测序,应该设欧宝体育官网网址置一个尽可能高的质量阈值,并沿着整个长度修剪序列。
在分类分类之前,细菌16S rRNA基因主要有两种聚类方法。一种是根据序列与参考数据库的相似度将其聚类为系统型,另一种是仅根据序列的相似度,使用97%的相似度阈值将序列聚类为操作分类单元(OTUs)。目前可供16S rRNA基因注释的参考数据库包括Greengenes数据库、核糖体数据库项目(RDP)、SILVA和人类微生物组项目(HMP)。
β (β)多样性衡量的是不同样品的细菌群落组成的差异。在量化β多样性之前,必须将读取计数(映射到每个分类单元的读取数)归一化,以最小化样本之间的技术可变性。有两种常见的归一化程序:总数和上四分位数归一化。
β多样性的量化主要有两种方法:一种是考虑群落间进化差异的系统发育β多样性(如UniFrac),另一种是非系统发育或基于分类的方法(如布雷-柯蒂斯差异)。一旦确定了样本之间的距离或差异,就可以在低维空间中对它们进行排序,以更好地说明它们彼此之间的密切程度。两个最常用的排序工具是主坐标分析(PCoA)和非度量多维缩放(NMDS)。
图2。NMDS和PCoA用于beta多样性的量化(Jovel等.2016)。
OTU丰度表可进一步用于推测代谢功能。了解微生物组在宿主代谢和疾病中的作用是一个过程。目前有三种强大的预测宏基因组分析(PMP)工具:PICRUSt、Tax4Fun和Piphillin。
未来的视角
16S rRNA扩增子测序欧宝体育官网网址因其具有成本效益、时间效益和信息丰富的特点而受欢迎。但它也有一些缺点。首先,16S非常适合于多患者、纵向研究,但提供的分类和功能信息有限。其次,16S rRNA基因不同区域的PCR扩增可能会产生不一致的结果,这不仅是因为其对应的侧翼保守区域的结合亲和性不同,还因为每个可变区域在类群中的分辨率不同。因此,全长16S rRNA测序欧宝体育官网网址或猎枪宏基因组有时可能更有利,特别是后者。
引用:
从CD基因组学获取最前沿的科学信息,每个月直接发送到您的收件箱。