跳到主要内容

06 ATAC-seq 分析要点

ATAC-seq 和 ChIP-seq 共享大部分分析流程(比对 → peak calling → 注释 → 差异),但有几个关键差异需要单独说明。

和 ChIP-seq 的区别

维度ChIP-seqATAC-seq
测什么特定蛋白结合位点所有开放染色质区域
需要 input/control是(IgG 或 input DNA)通常不需要
fragment size单一分布多模态(nucleosome-free + mono/di/tri-nucleosome)
peak calling 参数--nomodel 或默认--nomodel --shift -100 --extsize 200
核心 QCFRiP、IDRTSS enrichment、fragment size 分布、FRiP

Fragment size 分布

ATAC-seq 最重要的 QC 图是 fragment size 分布:

~100-150 bp → nucleosome-free fragments(信号最好的部分)
~200 bp → mono-nucleosome
~400 bp → di-nucleosome
~600 bp → tri-nucleosome

好的 ATAC-seq 数据应该在 < 150bp 处有一个明显的 peak(nucleosome-free),然后在 ~200bp 处有第二个 peak。如果第一个 peak 不明显,说明 Tn5 转座效率低或者细胞核裂解不充分。

MACS2 参数

macs2 callpeak \
-t sample.bam \
-f BAMPE \
--nomodel \
--shift -100 --extsize 200 \
-g hs \
-n sample_atac \
--keep-dup all \
-q 0.05

关键参数:

  • -f BAMPE:paired-end 模式,用实际 fragment 长度
  • --nomodel --shift -100 --extsize 200:不做 fragment size 建模,直接用 Tn5 切割位点两侧 100bp
  • --keep-dup all:ATAC-seq 的 PCR duplicate 已经在前面用 Picard 去过了

和单细胞 scATAC 的关系

单细胞实践 10 scATAC-seq 里用的 Signac 流程,底层思路和 bulk ATAC 一样(TF-IDF + LSI),只是把"每个样本"换成了"每个细胞"。bulk ATAC 的 peak 可以直接作为 scATAC 的参考 peak set。

推荐流水线

如果不想手动跑每一步,推荐用 nf-core/atacseq:

nextflow run nf-core/atacseq \
--input samplesheet.csv \
--genome GRCh38 \
--outdir results/

它会自动完成 trim → align → dedup → shift → peak call → QC report 全流程。

参考资源

静态文件

离线资料下载

手册 HTML / PDF 已在后台预生成,点击后直接下载网站静态资源。