CD基因组学 - 基因组服务公司
支持文件 CD基因组学思维方式 探索我们开发的科学文档,包括遗传技术的样本提交指南,原理,应用和生物信息学。欧宝官网app苹果下载
/资源/支持文件/基因组研究/从抽样到数据分析的shot弹枪宏基因组学简介

从抽样到数据分析的shot弹枪宏基因组学简介

宏基因组学是应用高通量测序技术和生物信息学工具的科学,直接获得微生物群落的遗传含量,而无需隔离和培欧宝体育官网网址养单个微生物物种。宏基因组学使研究不仅能够研究微生物群落的功能基因组成,还可以研究进化研究。宏基因组学已用于鉴定新型的生物催化剂或酶,并产生微生物功能的新假设,这是一种强大而实用的工具。相比16s/18s/其扩增子测序欧宝体育官网网址,宏基因组学可以提供有关微生物群落和全基因组序列功能潜力的更多信息。高通量测序的快速发展和大幅下降的成本大大促进了shot弹枪宏基因组测序的发展。欧宝体育官网网址

本文概述了从抽样到数据分析的元素学。一个典型的宏基因组学项目涉及样品制备,测序和数据分析(包括组装,安装,注释,统计分析和数据提交)。欧宝体育官网网址

从抽样到数据分析的shot弹枪宏基因组学简介图1.典型元基因组项目的流程图。

样品制备

样品制备通常涉及两个步骤:样品收集和DNA提取,两者都会影响元基因组实验的质量AD准确性。商业套件可用于采样和DNA隔离。它的关键目标是收集足够的微生物生物量,以进行测序并最大程度地减少污染。欧宝体育官网网址使用低生物质样品时,应使用超清洁试剂和“空白”测序控件来最大程度地减少“真实”信号。欧宝体育官网网址

图书馆准备和排序欧宝体育官网网址

常见的高通量测序平台包括Illumina Sy欧宝体育官网网址stems,Roche 454,Ion Torrent Instruments和PACBIO SMRT系统。

  • 下一代测序欧宝体育官网网址

弗雷。(2014年)评估了三个下一代测序(NGS)平台(Illumina Miseq,Roche 454钛和离子欧宝体育官网网址Torrent PGM)在临床上相关的血液样本中鉴定低滴度病原体(病毒或细菌)的能力。他们发现,离子Torrent PGM和Illumina平台在识别稀缺的微生物物种方面的表现更好,对于细菌样品,只有Miseq平台才能提供明确分类为起源于起源的读取。炭疽芽孢杆菌

Illumina平台由于其非常高的输出(每次运行高达1.5tb),高精度(错误率在0.1-1%之间)和广泛的可用性,因此shot弹枪宏欧宝体育官网网址基因组学测序已成为主导地位。离子Torrent仪器和PACBIO SMRT乐器正在该领域变得艰难的竞争对手。Illumina平台的总输出和最大读取长度主要不同。Illumina Hiseq 2500(2x250 nt,180 GB输出或2x125 nt,1TB输出)是元基因组学的经典选择。较新的HISEQ 3000和4000系统增加了运行的吞吐量,但仅限于阅读长度(150 nt)。Miseq仪器仅在2x300模式下生成高达15GB,但对于单标记基因微生物组研究或有限数量的样品仍然有用。

基于单分子,实时(SMRT)检测的Pacific Biosciences(PACBIO)仪器在零模式波导井中提供的读取长度(平均读取长度高达30 kb)比NGS仪器提供更大的读取长度(平均读取长度)。短阅读测序(即NGS)欧宝体育官网网址组装复合或低覆盖区域的能力有限,而长阅读宏基因组测序欧宝体育官网网址PACBIO SMRT测序能够欧宝体育官网网址重建先前未表征的微生物物种的高质量和闭合基因组。

数据分析

  • 集会

如果该研究旨在获得全长CD或恢复微生物基因组,则需要进行组装以产生更长的基因组重叠群。集会可以分为两种策略:基于参考的组装和从头部件。如果元基因组数据集包括可用的参考基因组,基于参考的组件是快速准确的,如果包含序列。可以使用NewBler,Amos,Mira等软件包进行基于参考的组件。从头组装需要更大的计算资源。de Bruijin图形方法是最受欢迎的元基因组从头组装方法。

如果该研究旨在进行分类学分析,则无需组装和融合。无装配的宏基因组分析可以减轻装配问题,并可以识别无法组装的低丰度物种从头。该方法受到限制,因为以前未表征的微生物很难概况,但是参考基因组的数量正在迅速增加。

  • binning

元基因组组件仅是碎片重叠群。我们不知道Contig从哪个基因组中得出。我们甚至都不知道有多少种物种。binning是将重叠群分组为物种的过程。有两种框架的策略,包括基于组成和基于相似性的方法。基于组成的分配算法的示例包括S-GSOM,Thylypopythia,Pcahier和Tacao。基于相似性的算法包括IMG/M,MG-RAST,MEGAN,CARMA,SORT-ITEMS,METAWATT,SCIMM和SCIMM。某些算法同时考虑组成和相似性,例如phymmbl和metaCluster。

  • 注解

注释有两个步骤:基因识别和功能注释。包含手动注释和计算预测蛋白家族的组合的数据库可用于元基因组的基因和代谢途径。下表结束了常见的数据库和工具。

表1.元基因组数据注释的常见数据库和工具。

数据库/工具 细节
kegg KEGG是一种数据库资源,用于了解生物系统的功能和实用性。
Uniprot UniProt提供了宏基因组序列数据的存储库,并允许您查看分类学和功能分析。
tigrfam Tigrfams是蛋白质家庭定义的数据库。
蛋酒 蛋酒用于鉴定直系同源基因组和功能注释。直系同源基因组的其他数据库包括KEGG,COG,M5NR和Metacyc。
席尔瓦 SILVA是用于检查质量检查和对齐核糖体RNA序列数据的在线资源。
绿色 Greengenes是由嵌合体检查的16S rRNA基因数据库和工具的组合。
RDP 核糖体数据库项目(RDP)包括对齐和注释的RRNA基因序列数据和工具。
Humann Pipeline Humann是用于准确确定元基因组数据中微生物途径的存在/不存在和丰度的管道。
Cazy Cazy(碳水化合物活性酶)数据库可用于预测编码碳水化合物活性酶和相关性分析的基因。
卡片 综合抗生素耐药性数据库(CARD)可用于预测抗性基因和相关分析。
mg rast MG-RAST是用于元基因组系统发育和功能分析的开源Web应用程序服务器。

结论

由于环境样本的整个DNA测序首先欧宝体育官网网址是由Banfield和Venter在2004年领导的团队进行的,因此Shotgun Metagenomics已成为研究微生物社区的必不可少的工具。测序的成本下降和计算方法的发展促进了元基因组欧宝体育官网网址学的广泛适应。

参考:

  1. Faust K,Lahti L,Gonze D,。宏基因组学符合时间序列分析:揭示微生物社区动态。当前的微生物学意见,2015,25:56-66。
  2. Frey K G,Herrera-Galeano J E,Redden C L,。比较三个下一代测序平台,用于血液中病原体的宏基因组测序和鉴定。欧宝体育官网网址BMC基因组学,2014,15(1):96。
  3. Quince C,Walker A W,Simpson J T,。从采样到分析,shot弹枪宏基因组学。Nature Biotechnology,2017,35(9):833。
  4. Thomas T,Gilbert J,Meyer F.元基因组学 - 来自采样到数据分析的指南。微生物信息学和实验,2012,2(1):3。
*仅用于研究。不用于诊断过程。
与我们的科学家交谈

您想讨论什么?

我们会和谁说话?

验证码

*是必需的项目。

从CD基因组学中获取尖端的科学信息,每个月直接发送到您的收件箱。

订阅我们的新闻
CD基因组学 - 基因组服务公司
欧宝娱乐平台正规安全吗


服务

Baidu