Nat Commun | 臻和科技多癌种早检新技术亮相国际著名期刊
导读 | 癌症的早期发现和治疗有助于改善治疗效果,提高患者生存率,具有重大的临床价值和社会意义。 |
近日,国家级研究中心的癌症早期检测研究在线发表于Nature Communications(影响因子:16.6),臻和科技自主研发的多癌种早筛早检液体活检技术THEMIS®(THorough Epigenetic Marker Integration Solution)为该研究的核心技术平台。该研究由中国医学科学院肿瘤医院团队牵头完成,臻和科技核心参与并提供了创新的检测与分析方法,展示了基于外周血cfDNA全甲基化组测序的多维度分析在中国七大高发癌种(肺癌、结直肠癌、胃癌、肝癌、乳腺癌、食管癌、胰腺癌)早检中的高敏感度、特异性和组织溯源准确性。
为解决这一技术难题,臻和THEMIS®平台创新性的探索了基于温和的酶转化法进行cfDNA全甲基化组测序(Whole-Methylome Sequencing, WMS)文库构建,从而最大程度的保护DNA分子的完整性以实现一份文库同时进行甲基化(MFR)、片段长度(FSI)、拷贝数变异(CAFF)和片段末端基序(FEM)等多种维度的分析(图1)。基于大规模多中心临床样本数据进行开发和验证,结合独特的生物标志物提取及整合算法,THEMIS®平台展现出优异的检测性能和模型稳定性。
利用512例平行血浆样本对WMS和“金标准”全基因组测序(WGS)平台进行技术比较,发现血浆的拷贝数变异(CNA;相关系数:0.988)和片段化特征(FSI;相关系数:0.961)在两个平台高度一致(图2),证明WMS平台可适用于拷贝数和片段组学等维度的分析。
通过对cfDNA的四种维度特征进行t-SNE数据降维,发现各维度特征对癌症血浆样本和健康人对照均具备一定的区分效果(图3a)。为增强检测灵敏度,首先对单个维度在训练集样本中构建机器学习模型,继而对各单维度的预测结果通过ensemble方法进行整合构建最终的癌症预测分类器(THEMIS®)。在ROC曲线分析中,THEMIS模型的AUC(训练集:0.972,测试集:0.966)高于各单维度,且在训练集和验证集中保持一致,证明模型的良好泛化性(图3b)。
不同于传统的单癌种筛查,多癌种早检需要对下游诊断路径提供指导,因此需要注重高特异性以降低假阳性率,避免将健康个体错误诊断为阳性导致不必要的后续检查和患者心理负担。本研究以99%特异性为cutoff值,来评估THEMIS®模型对各癌种和分期的检测性能(图4b)。经过训练集锁定模型后,THEMIS®模型在独立测试集中表现出83%的综合灵敏度,且灵敏度随癌症分期的上升而增加。对于ctDNA丰度低的I/II期样本,THEMIS®模型在测试集中的灵敏度达到73%。该性能与当前国内外已发表的多癌种早检研究数据相当或更优。
癌症信号的组织溯源(Cancer Signal Origin,CSO) 是多癌种早检的重要部分,可为下游诊疗路径提供指导。该研究创新性地探索了利用癌种特异的染色质可及区域的表观遗传状态进行组织溯源,合并相似器官后,测试集CSO的预测准确率为65%(图5)。 未来通过积累更丰富的组织甲基化和染色质可及性研究数据,有望进一步提升CSO的准确性。
还没有人评论,赶快抢个沙发