【突破行业技术瓶颈】求臻医学MSIsensor-ct新算法,实现ctDNA检测限0.05%,助力bMSI检测临床大规模应用
导读 | 作为MSIsensor和MSIsensor2算法工作的延续,求臻医学与美国圣路易斯华盛顿大学医学院合作发表肿瘤ctDNA样本NGS-MSI检测的新算法MSIsensor-ct,基本形成了肿瘤样本检测多层次应用场景的NGS-MSI算法体系。 |
导语
目前临床上广泛使用MSI-PCR以及MMR-IHC方法探测MSI,但由于检测位点或蛋白较少,且检测结果高度依赖主观经验判断,经常无法准确预测病人的MSI状态,且这两种方法都是为诊断遗传性错配修复缺陷或者林奇综合征而设计,用于其它癌种分析可能有偏倚,会造成一定程度的假阴性结果,从而导致部分癌症患者失去从免疫治疗中获益的机会。
MSIsensor的诞生将MSI检测带入了精准量化时代,MSKCC将其评定为比PCR更灵敏的泛癌种NGS-MSI检测算法;与此同时,国际知名的美国杰克逊实验室(The Jackson Laboratory)采用真实样本,专门对来自求臻医学的MSIsensor2算法进行了全面的第三方测试,得出并公布了MSIsensor2算法具有最高准确性的结论。然而,传统的检测方法几乎都局限于组织样本,基于血浆ctDNA样本的bMSI检测方法则存在血浆ctDNA含量低及克隆性造血对检测的干扰等问题,因此,对于晚期或者多线治疗进展而无法取得手术组织的患者,开发基于血浆ctDNA样本的bMSI检测方法具有巨大的临床价值,而提高bMSI的灵敏度和特异性是突破液体活检技术瓶颈的重要途经。近日,求臻医学生信团队与美国圣路易斯华盛顿大学(WUSTL)医学院丁莉(Li Ding)教授团队合作开发了基于NGS数据检测血浆ctDNA中MSI状态的新算法——MSIsensor-ct。该算法在bMSI检测上取得了新的突破,解决了现有的ctDNA MSI检测方法在ctDNA含量<0.4%的样品中表现较差的问题。目前,该研究成果已在国际生物信息学领域重要科技期刊Briefings in Bioinformatics(SCI影响因子:8.99,中科院JCR数学与计算生物学1区Top期刊)上在线发表。
文章对1,565例癌症样本的全外显子组测序数据进行了MSI相关特征的深度挖掘,对自主的MSIsensor算法进行了系统的优化升级,建立了高精度的机器学习模型,对ctDNA含量0.05%以上的样本MSI检测准确率高达99%以上,突破了现有的ctDNA MSI检测方法在ctDNA含量上的限制。
该研究结果让液体活检筛查MSI状态有望成为肿瘤组织取样困难或不足的晚期实体瘤患者的常规检查工具,帮助“不限癌种”的抗癌疗法筛查有效人群,同时求臻医学也将该算法应用于ChosenOne599?等产品血液样本的检测中,将进一步用于描绘中国癌症人群的MSI图谱,助力肿瘤的精准免疫治疗。
MSIsensor-ct是基于机器学习技术的MSI通用计算方法,该算法具备阈值稳定、检测限低、普适性强等特点;同时该算法占用内存小,计算速度快,无需通过先验人群队列构建检测基线,足以满足大规模产业应用需求,有助于bMSI检测在临床上大范围的推广和使用。
1.MSIsensor-ct是泛癌种(Pan-Cancer)bMSI检测算法
在MSI强相关癌种中,ctDNA样本与组织样本MSI-H检测结果的一致性高达80%。研究人员利用包含子宫内膜癌、结直肠癌、胃癌、食管癌和子宫癌肉瘤等癌种的全外显子组NGS测序数据建立了高精度的机器学习模型,并用模拟数据和泛癌种样本对模型进行了验证,均取得了99%以上的灵敏度和特异性。
2.MSIsensor-ct的灵敏度和特异性636个ctDNA模拟数据被用于验证MSIsensor-ct对于极低ctDNA含量(0.1%-0.4%)样本的检测性能,并与现行MSI算法——MSIsensor-pro (version v1.0.a) 和mSINGS (version v3.6)进行对比,发现在测序深度10,000X,ctDNA含量0.1%-0.4%的情况下,AUC值均能达到1,在真实样本中,对求臻医学39例不同ctDNA含量的样本进行MSI探测,AUC值亦能达到1。测试结果表明,MSIsensor-ct对低ctDNA含量样本的MSI检测性能优于其它两种算法;这也说明,专门针对基于肿瘤组织样本的MSI计算方法(MSIsensor-pro和mSINGS)在bMSI检测领域仍有提升空间。
图2. MSIsensor-ct性能对比
特别需要指出的是,对于测序深度超过3,000X,且ctDNA含量高于0.05%的模拟数据,MSIsensor-ct的敏感度和特异性均高达100%。
图3. MSIsensor-ct的检测限分析
3. MSIsensor-ct阈值稳定MSIsensor-ct提供稳定的检测分类阈值:20%。实验结果显示:当模拟数据ctDNA浓度分别为0.1%,0.2%,0.3和0.4%时, MSIsensor-ct均能有效区分MSS和MSI样本,检测准确率均可达100%。
图4. MSIsensor-ct阈值分析
4.MSIsensor-ct普适性强,用户友好利用模拟数据对MSIsensor-ct的鲁棒性测试结果表明,仅用MSIsensor-ct中随机10个位点分类器进行检测时,平均AUC可达到0.96;当分类器数目提升到30时,平均AUC无限接近1,这表明了MSIsensor-ct对个性化基因检测Panel的强适用性。求臻医学泛癌种基因检测Panel-ChosenOne599?包含MSIsensor-ct算法中的84个位点分类器,平均检测用时仅需16s,最大内存占用不超过2MB,具备大规模数据分析能力。相比于同类型算法,MSIsensor-ct只需要BAM文件,不依赖于繁琐的基线构建流程且阈值稳定,具有更强的普适性。
图5. MSIsensor-ct鲁棒性分析
目前MSIsensor/MSIsensor2/MSIsensor-ct系列算法已经被超过260篇论文引用,为国际上引用数最高的泛癌种NGS-MSI探测工具集,基本形成了肿瘤样本多层次应用场景的NGS-MSI算法体系,且被应用于超过20个国家的473个基因检测企业产品、药企的研发和科研团队的项目中,实际检测超过115,000例癌症病人的MSI状态,助力于多个重要的科学发现,为人类癌症的精准诊治做出了一定贡献。
作为专注肿瘤多基因检测的国家高新技术企业,求臻医学以新一代基因测序和先进信息挖掘技术为基础,全面布局肿瘤液体活检领域。求臻医学通过借助自身技术优势,将这些高性能的数据解读学习模型、算法整合到自身检测产品中并不断进行优化升级,不仅能够提高自身检测的准确性及权威性,还将有助于其所参与的《中国肿瘤基因图谱计划》的落地实施,同时将助力bMSI检测在充分发挥其微创、简单、准确等优势的同时,扩展其在临床的大规模应用,满足更多无法获取组织样本患者的需求,为更多肿瘤患者带来福音。
关于MSI
MS, 即微卫星, 一般是由1-6个核苷酸组成的短而重复的DNA串联重复序列。而MSI,即微卫星不稳定性,是指由于在DNA复制时插入或缺失等变异引起的微卫星序列长度改变的现象,常与错配修复功能缺陷有关。2017年5月23日,FDA批准pembrolizumab(K药)用于MSI-H/dMMR的不可切除或转移性实体肿瘤患者,MSI-H/dMMR一举成为第一个泛癌种的生物标志物。目前MSI已经成为临床广泛认可的、指导晚期癌症患者进行免疫治疗的生物标志物,对于多种实体瘤的治疗和预后均具有重要的指导意义。
参考文献:
2. PD-1 blockade in tumors with mismatch-repair deficiency. N Engl J Med 2015, 372:2509-20.
3. Detection of microsatellite instability biomarkers via nextgeneration sequencing. Methods Mol Biol. 2020 ; 2055: 119–132.
4. Detection of mismatch repair deficiency and microsatellite instability in colorectal adenocarcinoma by targeted next-generation sequencing. J Mol Diagn. 2017 Jan;19(1):84-91.
5. Validation of microsatellite instability detection using a comprehensive plasma based genotyping Panel. Clin Cancer Res 2019;25:7035–45.
6. Capture-based targeted ultradeep sequencing in paired tissue and plasma samples demonstrates differential subclonal ctDNA-releasing capability in advanced lung cancer. J Thorac Oncol 2017;12:663–727. Clinical utility of circulating DNA analysis for rapid detection of actionablemutations to select metastatic colorectal patients for antiEGFR treatment. Ann Oncol. 2017;28:2149–59.
8. Cellfree DNA profiling of metastatic prostate cancer reveals microsatellite instability, structural rearrangements and clonal hematopoiesis. Genome Med. 2018;10:1–13.
9.Monitoring microsatellite instability (MSI) in circulating tumor DNA by next-generation DNA-seq. American Society of Clinical Oncology 2018;36:12025.
10. False-positive plasma genotyping due to clonal hematopoiesis. Clin Cancer Res2018;24:4437–43.
11.Detection of microsatellite instability from circulating tumor DNA by targeted deep sequencing.J Mol Diagn 2020;22:860–70.
12. Mutational landscape and significance across 12 major cancer types. Nature. 2013 Oct 17;502(7471):333-339.
13. Multiplatform analysis of 12 cancer types reveals molecular classification within and across tissues of origin. Cell. 2014 Aug 14;158(4):929-944.
14. Pathogenic germline variants in 10,389 adult cancers. Cell. 2018 Apr 5; 173(2): 355-370.e14.
15. MSIsensor: microsatellite instability detection using paired tumor-normal sequence data. Bioinformatics. 2014 Apr 1;30(7):1015-6.
16. Mutation detection in patients with advanced cancer by universal sequencing of cancer-related genes in tumor and normal DNA vs guideline-based germline testing. JAMA. 2017 Sep 5;318(9):825-835.
17. Microsatellite instability is associated with the presence of Lynch Syndrome pan-cancer. J Clin Oncol. 2019 Feb 1;37(4):286-295.
18. Genetic diversity of tumors with mismatch repair deficiency influences anti-PD-1 immunotherapy response. Science. 2019 May 3;364(6439):485-491. 19. MSIsensor-pro: fast, accurate, and matched-normal-sample-free detection of microsatel- lite instability. Genomics Proteomics Bioinformatics 2020;18: 65–71.
20. Microsatellite instability detection by next generation sequencing. Clin Chem 2014;60:1192–9.
21. Detection of microsatellite instabil- ity from circulating tumor DNA by targeted deep sequencing. J Mol Diagn 2020;22:860–70.
还没有人评论,赶快抢个沙发