单细胞转录组分析入门指南
· 阅读需 4 分钟
单细胞转录组测序(scRNA-seq)技术已经成为现代生物学研究的重要工具。本文将介绍单细胞数据分析的基本概念和学习路径。
什么是单细胞转录组测序?
单细胞转录组测序(Single-cell RNA sequencing, scRNA-seq)是一种在单细胞水平测量基因表达的技术。
与传统 bulk RNA-seq 的区别
| 特性 | bulk RNA-seq | scRNA-seq |
|---|---|---|
| 分辨率 | 细胞群体平均 | 单个细胞 |
| 细胞异质性 | 无法检测 | 可以检测 |
| 稀有细胞类型 | 难以发现 | 容易发现 |
| 数据量 | 较小 | 较大 |
| 成本 | 较低 | 较高 |
为什么要学习单细胞分析?
1. 技术普及
单细胞测序技术已经广泛应用于:
- 发育生物学
- 免疫学
- 肿瘤学
- 神经科学
- 再生医学
2. 数据爆发
- 公共数据库中的单细胞数据集快速增长
- 越来越多的研究项目采用单细胞技术
- 需要大量的数据分析人才
3. 职业发展
掌握单细胞数据分析技能可以:
- 提升科研竞争力
- 拓展就业机会
- 参与前沿研究
单细胞数据分析流程
标准分析流程
原始数据 (FASTQ)
↓
质量控制 (QC)
↓
比对和定量 (Alignment & Quantification)
↓
数据预处理 (Preprocessing)
↓
降维和聚类 (Dimensionality Reduction & Clustering)
↓
细胞类型注释 (Cell Type Annotation)
↓
差异表达分析 (Differential Expression)
↓
功能富集分析 (Functional Enrichment)
↓
高级分析 (轨迹推断、细胞通讯等)
主要分析步骤
-
质量控制
- 过滤低质量细胞
- 去除双细胞
- 过滤低表达基因
-
标准化和归一化
- 去除技术噪音
- 批次效应校正
-
特征选择
- 识别高变异基因
- 降维(PCA、UMAP、t-SNE)
-
聚类分析
- 识别细胞亚群
- 细胞类型注释
-
下游分析
- 差异表达分析
- 轨迹推断
- 细胞通讯
- 功能富集
常用工具和软件
R 语言生态
- Seurat: 最流行的单细胞分析包
- SingleCellExperiment: Bioconductor 框架
- Monocle: 轨迹推断
- CellChat: 细胞通讯分析