跳到主要内容

01 实验类型与数据格式

表观组学实验类型多,但分析思路可以归为两大类:开放区域检测(ATAC-seq、DNase-seq)和蛋白-DNA 结合检测(ChIP-seq)。两者的分析流程几乎一样,区别在 peak calling 参数和质量指标。

三种主要实验

实验测什么peak 类型典型 QC 指标
ATAC-seq染色质开放区域narrowTSS enrichment、fragment size 分布
ChIP-seqTF 结合位点 / 组蛋白修饰narrow (TF) / broad (histone)FRiP、IDR
WGBS/RRBSDNA 甲基化不做 peak calling覆盖度、转化率

本专栏前 4 个模块聚焦 ATAC-seq 和 ChIP-seq(它们共享 peak-based 分析框架)。甲基化后续单独开。

从 FASTQ 到 peak 文件

不管是 ATAC 还是 ChIP,从原始数据到可分析的 peak 文件,标准流程是:

FASTQ → fastp (trim) → Bowtie2/BWA (align) → samtools (sort/filter)
→ Picard (dedup) → MACS2 (peak calling) → narrowPeak / broadPeak

BioF3 的表观组教程从 peak 文件开始。如果你需要从 FASTQ 跑起,参考 nf-core/chipseqnf-core/atacseq 流水线。

peak 文件格式

MACS2 输出的 .narrowPeak 是 BED6+4 格式:

chr1 9356548 9356648 peak_1 100 . 5.0 10.5 7.2 50
含义
1-3染色体、起始、终止
4peak 名
5score
6strand(通常 .
7fold enrichment
8-log10(pvalue)
9-log10(qvalue)
10summit 相对于 start 的偏移

R 里用 ChIPseeker::readPeakFile()rtracklayer::import() 读入,得到 GRanges 对象。

下一步

参考资源

静态文件

离线资料下载

手册 HTML / PDF 已在后台预生成,点击后直接下载网站静态资源。