单细胞cellranger质量评估工具
质量评估公式
Q =
(G × C) / (D × S)
× A × P
G
× P
D
× P
S
× P
C
其中:
Q
base
= (G × C) / (D × S)
- 基础质量分数
G
- 中位基因数
C
- 细胞数
D
- 测序量reads数
S
- 测序饱和度
A
- 公式系数,校正Q值大小
P
- 惩罚系数,增加风险阈值
以下阈值默认不修改,仅和惩罚系数相关
基因数阈值 (G
min
)
测序量阈值 (D
min
)
饱和度低阈值 (S
low
)
饱和度高阈值 (S
high
)
细胞数低阈值 (C
min
)
细胞数高阈值 (C
max
)
公式系数 (A)
样本参数
测序量 (D),每个细胞的reads数,如25000
基因数 (G),每个细胞中位基因数,如1500
细胞数,如12000 (C)
测序饱和度,0-1之间,如0.3 (S)
计算质量评分
重置参数
质量评估结果
0.000000
等待计算...
问题诊断:
示例测试数据
点击下面的样本卡片加载示例数据并自动计算质量评分(页面会滚动到结果部分):
好样本
D: 50,000
G: 3,000
S: 0.40
C: 15,000
中等样本
D: 28,000
G: 900
S: 0.50
C: 8,000
差样本
D: 50,000
G: 600
S: 0.9
C: 38,000
评估指标说明
质量评估规则:
细胞数(C)相同,基因数(G)越高
→ 测序饱和度(S)越低 → 质量越好
基因数(G)相同,测序量(D)越低
→ 测序饱和度(S)越低 → 质量越好
细胞数(C)合理范围内(5000-30000)质量更稳定
- 过高或过低都可能影响数据质量
测序饱和度(S)相同,基因数(G)越高越好
,测序量(D)越低越好
质量评级标准:
好数据
:所有参数都在理想范围内且基础分数越高越好
中等数据
:一个参数低于/高于阈值
差数据
:两个及以上参数低于/高于阈值
问题诊断:
测序量低于阈值
:提示测序不足
饱和度低于阈值
:提示文库覆盖不足
饱和度高于阈值
:提示文库质量偏低
基因数低于阈值
:提示基因不足
细胞数低于低阈值
:统计效力不足
细胞数高于高阈值
:数据噪声可能增大
惩罚系数:
P
G
:基因数惩罚因子 (G ≥ Gmin ? 1 : G/Gmin)
P
D
:测序量惩罚因子 (D ≥ Dmin ? 1 : D/Dmin)
P
S
:饱和度惩罚因子 S < Slow ? S/Slow S > Shigh ? Shigh/S 否则为1
P
C
:细胞数惩罚因子 C < Cmin ? C/Cmin C > Cmax ? Cmax/C 否则为 1
公式系数A说明:
用于调整基础质量分数的比例常数,默认为0.01
较高的A值会提高质量分数的绝对值,但不改变样本间的相对评估
调整A值可针对特定研究需求进行分数缩放