根据《自然·医学》杂志8月7日发表的一篇论文,美国麻省理工学院和达纳-法伯癌症研究所的研究人员开发了一种新方法,使识别一些神秘癌症的原发灶位置变得更容易。
研究人员利用近3万名22种已知癌症的患者数据来训练机器学习模型,它可分析大约400个基因序列,这些基因经常在癌症中发生突变。然后,研究人员使用这些信息来预测给定的肿瘤在体内的起源位置。
他们在约7000个肿瘤上测试了新模型OncoNPC,这些肿瘤以前从未见过,但其起源已知。该模型能以80%的准确率预测它们的起源。对于占总数约65%的具有高置信度预测的肿瘤,其准确率达到约95%。研究人员表示,利用该模型,他们可在约900名患者的数据集中准确地对至少40%的不明来源肿瘤进行高置信度分类。这种方法使符合基因组指导、根据癌症起源位置进行靶向治疗的患者数量增加了2.2倍。
在3%—5%的癌症患者中,特别是在肿瘤已转移到全身的情况下,肿瘤学家没有一种简单的方法来确定癌症的起源。这些肿瘤被归类为原发灶不明癌症。许多抗癌药物通常用于特定癌症,无法确定原发灶位置往往使医生无法为患者精准地对症下药。
研究人员计划扩展他们的模型,以涵盖更多类型的数据,例如病理图像和放射图像,从而提供更全面的预测。这也将为模型提供肿瘤的全面视角,使其不仅能够预测肿瘤类型,甚至还可预测最佳治疗方案。