跳到主要内容

01 数据类型:WGS vs WES vs Panel

基因组测序有三种主要策略,选择取决于研究目的和预算:

策略覆盖范围数据量/样本适用场景
WGS全基因组 ~3Gb30-60x, ~90GB FASTQ结构变异、非编码区、群体遗传
WES外显子区 ~60Mb100-200x, ~6GB FASTQ肿瘤体细胞突变、遗传病诊断
Panel几十~几百个基因500-1000x, ~1GB临床检测、已知热点突变

WGS vs WES 的分析差异

维度WGSWES
变异类型SNV + Indel + SV + CNV主要 SNV + Indel
参考区域全基因组需要 BED 文件定义 target 区域
覆盖度均匀性受捕获效率影响,边缘区域覆盖低
数据分析工具GATK / DeepVariantGATK + Mutect2(肿瘤)
下游重点群体遗传、GWAS、SV肿瘤驱动突变、maftools、OncoKB

肿瘤 WES 的特殊性

肿瘤样本通常配对测序(tumor + matched normal),用 Mutect2 做体细胞突变检测。输出的 MAF 文件是 maftools 的标准输入。

# Mutect2 典型调用
gatk Mutect2 \
-R reference.fa \
-I tumor.bam \
-I normal.bam \
-normal normal_sample_name \
-O somatic.vcf.gz

# VCF -> MAF 转换
vcf2maf.pl --input-vcf somatic.vcf.gz --output-maf somatic.maf \
--tumor-id tumor --normal-id normal --ref-fasta reference.fa

下一步

参考资源

静态文件

离线资料下载

手册 HTML / PDF 已在后台预生成,点击后直接下载网站静态资源。