一文读懂 ChIPseq

一、介绍

  • ChIP-seq,测序方法
    • ChIP 指染色质免疫共沉淀技术(Chromatin Immunoprecipitation,ChIP),
    • seq 指的是二代测序方法
  • 作用:识别蛋白质与DNA互相作用情况
  • 原理:染色质免疫共沉淀 + 二代测序
  • 应用:常用于转录因子结合位点和组蛋白修饰位点的研究

二、测序原理

1、使用甲醛将目标蛋白(组蛋白,转录因子等)与染色质交联固定起来

mark

2、从细胞裂解液分离基因组DNA,通过超声打断DNA为一定长度的小片段

mark

3、添加与目标蛋白质特异的抗体,该抗体会与目标蛋白形成免疫结合复合体沉淀,收集这些沉淀

免疫结合复合体 = 靶蛋白 + 抗体 + 靶蛋白结合的DNA

mark

4、去交联,分开蛋白与DNA,纯化DNA即可得到染色质免疫沉淀的DNA样本

mark

5、建立好文库,用测序仪进行测序

详细测序过程可以参考:https://zhuanlan.zhihu.com/p/58708887

mark

三、检测蛋白质与DNA序列的结合峰

1、测序片段匹配到参考基因组

将测序得到的 DNA 片段(sequenced fragments)匹配到参考基因组。

很显然,如果在基因组的某个位置蛋白质结合的概率越大,那么在该位置检测到 DNA 片段堆叠就会越高。反之,如果没有蛋白结合,在该位置就会几乎没有DNA 片段堆叠。为了研究方便,我们将这些DNA片段堆叠叫做峰 (Peak)。

mark

2、检测峰

将覆盖到参考基因组的DNA片段堆叠用柱状图画出来,就会看到峰。

这里需要知道,ChIPseq是利用抗体去结合特异的靶蛋白,进而去沉淀靶蛋白结合的DNA。理论上,只要抗体设计的好,与蛋白质结合的 DNA 的都可以检测到。

我们一般用 ChIPseq 检测转录因子的结合,以及检测组蛋白修饰,二者有着截然不同的峰形:

转录因子结合的特征峰,峰型高,而且窄:

mark

组蛋白修饰结合的特征峰,峰型起伏,而且分布广泛:

mark

当然我们也可以使用,UCSC基因组浏览器显示。

mark

3、提高峰质量

一般在做ChIPseq时,会加入一组空白对照(control),提高峰质量,那么为什么?

  • 一般检测出的峰值会有背景噪音,也就是文库会夹渣一些没有用抗体捕获的DNA片段也被测序了。
  • 开放的染色质区域比封闭的区域更容易断裂
  • 序列在基因组中分布不均
  • 允许我们在比对的控件中与相同区域进行比较
  • 消除 ENCODE 的 Black list的影响

所以会准备空白对照,排除假阳性,对照组有有两种类型:

  • input DNA:不用任何抗体捕获的DNA;
  • mock IP DNA:用不含有抗体的DNA

这样一来,就会让我们检测到的峰更明显更接近真实的生物学特征。

四、影响ChIPseq测序结果的因素

1、免疫共沉淀的影响
  • 高效特异性抗体
  • 起始样本量
  • ChIP DNA 产量
    • 细胞类型
    • 标记或蛋白质丰富程度(组蛋白比TF具有更高的结合覆盖率)
    • 抗体质量

对于组蛋白,使用来自T细胞的20ug染色质DNA作为起始材料,总共会得到15-50ng DNA。

对于TF,通常从2500万个细胞(200ug染色质)中得到5-25ng。

-Subhash Tripathi,ResearchGate

  • 染色质片段
    • 片段大小:影响ChIP-seq中的信噪比
    • 因细胞类型而异
    • 偏向启动子区域的片段会在ChIP 和对照样品中的启动子上引起ChIP-seq富集
2、测序的影响
  • Reads 长度
    • 较长的 Reads 和双末端 Reads 可提高匹配率
    • 对于等位基因特异性染色质事件,转座因子研究是必需的
  • 避免分批次
  • 序列输入对照的深度等于或大于IP样本
  • 测序深度
    • 对于转录因子:最小5-10M
    • 对于组蛋白修饰宽谱图则更高:标准为20-40M
测序深度的对组蛋白修饰检测的影响

下面是在不同测序深度下检测人的 H3K4me3 组蛋白修饰ChIP图谱。

绿色框对应于基于SPP宽峰检测方法得到的显著富集区域。

在 5M (500 Reads) 中,未检测到突出显示的富集区域。

mark

同样,我们换成 H3K27me3 组蛋白修饰。

这时在3.5M和10M 的低深度处未检测到突出显示的HOXD11和HOXD-AS1基因座处的富集区域(蓝色框)。 mark

从每个子样本中H3K4me3,H3K36me3和H3K27me3回收的全部数据中获得的显著富集区域的百分比mark

总的来说,随着测序深度增加,组蛋白修饰检测比例开始会快速增加,随后达到平稳。测序深度饱和点取决于组蛋白修饰和所研究的物种基因组。

3、重复样和重现性
  • 重复多次通常比更高的深度更有效
  • 最好是低深度测序高质量样本,而不是高深度低质量样本

参考:

https://academic.oup.com/nar/article/42/9/e74/1248114

https://en.wikipedia.org/wiki/ChIP_sequencing#/media/File:Chromatin_immunoprecipitation_sequencing.svg

https://www.abcam.com/epigenetics/studying-epigenetics-using-chip

白墨石 CSDN认证博客专家 生物信息学 CSDN博客专家 知乎专栏作家
生物信息学在读博士,主要研究生信流程自动化,生物序列分析,web应用及数据库搭建。
联系方式在左栏,欢迎学习交流,咨询提问 ^.^
已标记关键词 清除标记
相关推荐
©️2020 CSDN 皮肤主题: 成长之路 设计师:Amelia_0503 返回首页