CD基因的博客

探索我们开发的博客,包括基因组教育,基因组技术,基因组进步,基因组新闻和观点。

转录因子简介

调控基因表达的重要分子是转录因子。通常它们是蛋白质,尽管它们也由短的非编码RNA组成。转录变量也通常以群体或复合体的形式工作,建立多个连接,允许对转录速率的不同程度的控制。

转录因子(tf)附着于可获得的或“开放的”启动子和增强子区域,通过促进或阻碍RNA聚合酶结合,在调节基因表达中发挥关键作用。不同的结合作用导致基因表达的异质性和细胞群,这可以产生特定的细胞身份。细胞植物的监督者是转录因子,它调节从细胞个体性到对外界刺激的反应的一切。成千上万的人受到转录因子突变的影响,因为它们在基因组分析中具有重要意义,导致了各种各样的症状。此外,在调控位点发现了许多其他致病突变,如增强子,它们富含TF结合位点。因此,TF结合谱的表征对于了解基因调控系统和细胞分化为独立亚群至关重要。

研究转录因子结合活性的技术

要分析转录因子的相互作用,需要理解转录因子的两个主要作用:与DNA的结合和转录重组。转录因子是一种TF识别基序,附着在特定的DNA序列上。为了确定和分类这些识别基元,已经使用了许多方法。一种评估整个基因组中转录因子结合活性的技术是分析染色质可及性分析,如脱氧核糖核酸酶超敏感位点测序(DNase-seq)、甲醛辅助分离调控元件测序(FAIRE-seq)和转座酶可及性染色质测序(ATAC-seq)。欧宝体育官网网址蛋白质和DNA之间的联系也可以在测序之前通过染色质免疫沉淀(欧宝体育官网网址ChIP-seq).不幸的是,多个证据表明并非所有的结合环境都影响转录。

另一种识别单个蛋白质-DNA结合区域的方法是通过DNA脚印推断大量的结合事件。结合转录因子的存在保护了小区域不发生裂解,通过对DNase I裂解位置的密集定位来识别。虽然最初的脚印研究定义了大量最近描述的防止切割的基序,这意味着许多新的转录因子,但目前的研究表明,这些区域可能影响DNase I酶的基于序列的切割偏好性。此外,现在也很明显,大多数tf(80%)没有显示出可量化的足迹,因此限制了该方法的有效性。

一些最早的关于转录因子作为调控因子的研究是根据表达数据进行的,因为转录因子可以修饰转录。近二十年来,大量的表达信息被用来推断基因调控网络。通常,这些方法在不同的环境中寻找共同调控基因的组成部分和编译。特异性TF通过检测附近的TF识别基元或协同调节的转录因子与它们控制的基因模块相联系。基因调控网络技术已经涉及到大规模调控网络的解释,但由于依赖于信息进行稳态表达的现实,这些技术受到了先天的限制。稳态表达(微阵列或RNA-seq)的测定不仅代表转录,还代表RNA的加工、成熟和稳定性。因此,它们是干扰对转录变量影响的间接解读。相对地,如果没有不切实际的重复数量,它们通常无法可靠地检测短时间点上的微小变化。新生转录分析有效地描述了与细胞聚合酶相关的RNA (GRO-seq和PRO-seq)。因此,新生分析是对干扰引起的转录修饰的直接解读。

ATAC-Sequ欧宝体育官网网址encing方法

两种常用的全基因组检测开放染色质的方法是DNase-I超敏感位点测序和转座酶可达染色质测序分析。欧宝体育官网网址DNase-seq和ATAC-seq是建立在使用裂解酶(分别是DNase-I和Tn5)在开放染色质区域识别和裂解DNA。通过区分具有多个reads的基因组间隔,测序和从这些片段中排列reads使开放染色质的识别成为可能。欧宝体育官网网址然而,在没有核小体的区域,与DNA相连的转录因子(tf)的存在限制了酶的裂解。这给出了称为脚印的小区域,其中读作用域在重作用域峰值区域内突然减少。

转座酶可达染色质测序(ATAC-seq)是一种分析开放染色质区域的方法,特别有趣,因为在小细胞计数的样本中,它快速、欧宝体育官网网址简单、负担得起和便携。ATAC-seq特征通常用来区分开放染色质区域,如果这些区域与蛋白质结合位点相互纠缠,就可以用来推断TF结合的发生。与此相关,最近的研究表明,TF的作用可以通过染色质可用性的调整来决定。特别地,BagFoot将足迹与差分可用性相结合,在干扰存在的情况下定义与染色质可及性谱改变相关的tf。他们主要集中在来自DNase I的超敏信息上,但也分析了来自ATAC-seq的一小部分数据集。

利用atac测序方法预测转录因欧宝体育官网网址子在单个细胞中的结合

图1。单细胞ATAC测序分析。欧宝体育官网网址(门敏,2020)

根据大块ATACseq数据或单细胞ATAC-seq (scATAC-seq)数据的组合作为大块数据,开发了一个先前发表的模型HINT-ATAC,用于评估细胞群体水平上的TF绑定。近年来,深度学习方法已成为分析TF结合结构的有力技术,如共同进化神经网络(CNNs)。诸如因子网和深度ATA等技术利用基于深度学习的方法来定义开放染色质区域,并使用大量染色质可访问性信息来派生TF结合区域。然而,所有这些技术都做出了种群级别的TF绑定假设,因此没有考虑到细胞群落内的异质性。

单细胞表观基因组测序的最新进展使得单细胞水平的染色质可用性得以表征。欧宝体育官网网址例如,scATAC-seq已经可以用于测试单细胞内染色质的可用性,允许识别顺式和反式调控因子,并测试这些调控因子如何合作影响不同细胞的命运。与所有单细胞测序技术一样,仅使用scATAC-seq信息是困难的,因为它们不仅受到浅测序等技术限制,而且受到细胞均匀性等生物现实的限制欧宝体育官网网址。

参考文献

  1. 傅磊,张磊,多林杰,.通过深度学习预测单细胞内转录因子结合。科学的进步.2020年12月18日,6(51)。
  2. Baek S, Lee I.单细胞ATAC测序分析:从数据预处理欧宝体育官网网址到假设生成。计算与结构生物技术杂志.2020年1月1;18。
  3. 王晓燕,王晓燕,王晓燕,等。ATAC-seq数据中差异转录因子活性的检测。分子.2018年5月,23(5)。

留下一个回复

您的电邮地址将不会公布。必填项已标记

Baidu