图片展示

8+干细胞+多组机器学习,结合机器学习与干细胞技术,鉴定生物标志基因,创新性很赞!!!

2023-10-14 10:31:11

浏览:



导语


今天给同学们分享一篇肿瘤+干细胞+多组机器学习的生信文章“A novel stemness classification in acute myeloid leukemia by the stemness index and the identification of cancer stem cell-related biomarkers”,这篇文章于2023年6月19日发表在Front Immunol期刊上,影响因子为8.738。


干细胞在急性髓系白血病(AML)中扮演着重要角色。然而,它们对AML肿瘤发生和进展的确切影响仍不清楚。本研究旨在表征AML中与干细胞相关的基因表达,并鉴定干细胞特性的生物标志基因。


1. 识别出具有差异表达基因的两个干细胞特性亚群

作者通过OCLR算法计算了mRNAsi值,该算法基于训练集中的基因表达和PSCs。这些151个mRNAsi值按升序排列,并将mRNAsi的中位数值作为阈值(图1A)。根据阈值,将所有TCGA-AML患者分为高mRNAsi组和低mRNAsi组。然后,对这两组进行差异表达分析,共鉴定出143个差异表达基因(DEGs),其中包括7个下调基因和136个上调基因。作者为这些DEGs绘制了火山图(图1B)。通过enrichGO函数对这些DEGs进行了GO功能富集分析(图1C),包括细胞外基质结合、免疫球蛋白结合、吞噬小泡、胶原三聚体、血管生成调节和呼吸爆发。基于143个DEGs,作者通过无监督一致性聚类确定了干细胞性子群I和II(图1D)。干细胞性子群I中有59名患者,其余92名患者属于干细胞性子群II。热图显示不同的干细胞性子群具有各自独特的表达模式。作者还发现了干细胞特性组I和组II之间的免疫细胞组成差异(图1E)。

图1 高和低mRNAsi组之间的差异表达分析


2. 不同的干细胞亚群展示出不同的突变和生存模式

如前所述,所有TCGA-AML样本被分为两组,分别命名为干细胞亚群I和干细胞亚群II。如图2A、B所示,不同的干细胞亚群显示出不同的突变模式。对于干细胞亚群I的患者来说,核仁蛋白酸性核磷蛋白(NPM1)是***常见的突变基因,它属于核仁蛋白酸性核磷蛋白/核磷蛋白家族。而对于干细胞亚群II来说,RUNX1是***常见的突变基因,它是一种在造血细胞中广泛表达且对于确立成熟造血至关重要的转录因子。DNMT3A是干细胞亚群I和II中第二常见的突变基因,它编码一种DNA甲基转移酶,并且与不良预后独立相关(47)。此外,这两个干细胞亚群还展示了各自特定的突变模式,包括不同的突变基因。考虑到年龄、形态和性别对生存的影响,作者在调整了这些协变量后进行了生存分析。在纠正其他混杂因素后,这两个干细胞亚群之间存在显著的生存差异(图2C)。然而,当作者仅基于M1、M2和M3组的患者进行生存分析时,结果显示TCGA-AML患者中干细胞亚群II的整体生存率明显优于干细胞亚群I(p = 0.046)。干细胞亚群II患者的中位总生存时间为396天,比干细胞亚群I患者(365天)更长。这一结果表明,突变可能重构肿瘤发展,从而改变其预后。

图2 干细胞特性亚型I和II之间的体细胞变异和生存比较


3. 干细胞亚组I的患者对尼洛替尼敏感

作者使用pRRophetic R软件包在训练集中为AML患者筛选了候选化疗药物。为每个患者估计了每种药物的IC50值。IC50值与药物敏感性呈负相关。***,作者发现在干细胞亚组I中,尼洛替尼的IC50值显著较低(图2D),这表明亚组I的患者对尼洛替尼更敏感,而亚组II的患者则相对较不敏感。Beat-AML研究提供了药物反应信息,因此作者直接分析了IC50值。作者发现亚组I的患者对尼洛替尼更敏感,这与训练集中的结果一致。因此,尼洛替尼有望成为干细胞亚组I患者的特定药物。类似地,MK-2206和阿昔替尼更适合干细胞亚组I的患者。


4. 干细胞特性亚群与肿瘤免疫微环境之间的关联

为了确定与免疫相关的亚群,作者使用ssGSEA获得了代表整体免疫活性的29个免疫标志物的富集分数。所有TCGA-AML患者被分为三个与免疫相关的亚群:高免疫组(48名患者),中等免疫组(77名患者)和低免疫组(26名患者)。如图3A所示,这三个免疫亚群的模式是不同的。为了***了解免疫系统的情况,作者使用ESTIMATE和CIBERSORT方法评估了微环境组分。免疫与干细胞性之间的皮尔逊相关系数如图3B所示。mRNAsi与基质评分之间的相关值为-0.36(p<0.001),在mRNAsi与免疫评分之间的相关性中也发现了类似的趋势(R = -0.43,p<0.001)。因此,这些结果表明干细胞性与免疫之间存在负相关关系。有趣的是,mRNAsi与ESTIMATE评分之间的关系与先前的研究结果一致。此外,作者还比较了这三个免疫亚群中22种免疫细胞的丰度(图3C)。作者发现在这些免疫亚群中存在着几种免疫细胞类型的差异,包括肥大细胞、浆细胞、CD4 T细胞、原始B细胞、嗜酸性粒细胞、单核细胞、自然杀伤细胞、巨噬细胞和记忆B细胞。再次,结果表明免疫亚群代表了不同的免疫活动和细胞。如图3D所示,mRNAsi得分、基质得分、免疫得分和ESTIMATE得分在不同的免疫相关亚群中有显著差异。免疫与干细胞特性之间的关联可能为AML患者提供一种联合治疗策略。

图3 与mRNAsi相关的AML的肿瘤免疫微环境模式和免疫基因组特征


5. 干细胞亚群分类的构建和验证

在训练集中,采用了LASSO、RF和XGBoost等三种机器学习方法,基于筛选出的143个差异表达基因(DEGs)来识别在干细胞特性中起重要作用的关键基因。这三种机器学习方法分别鉴定出了25个、33个和27个基因(图4A),***终的8个关键基因是这三个基因列表的交集。为了探索这三种机器学习方法的性能,使用AUC来衡量特征选择能力(图4B)。无论在训练集中采用哪种方法,AUC都大于0.975,而在测试集中这个值有所下降,但仍然接近0.9。测试集中的多变量生存分析结果表明,干细胞亚组II的患者整体生存率比干细胞亚组I的患者要好(p<0.001)(图4C)。这个结果与训练集中的生存分析结果一致。因此,作者的干细胞分类对AML患者可能带来临床益处。通过绘制测试集中的关键基因表达谱,干细胞亚组清晰可见。这些结果证实了这8个关键基因在干细胞过程中确实起着重要作用(图4D)。

图4 构建和验证干细胞特性亚型预测器

 

6. 与干细胞特性相关的***重要基因分析

对于在干细胞过程中起重要作用的8个关键基因,作者计算了这些基因与尼洛替尼的IC50值之间的皮尔逊相关系数。作者旨在研究这8个与干细胞相关的基因对尼洛替尼治疗反应的影响,并确定它们的潜在生物学功能。如图5A所示,大多数基因与尼洛替尼的IC50值呈负相关,包括SLC43A2、CYBB、CFP、GRN、CST3、TIMP1和CFD。SLC43A2与尼洛替尼的IC50值之间的相关系数为-0.34,表明SLC43A2与尼洛替尼的敏感性相关。有趣的是,只有IGLL1与尼洛替尼的IC50值呈正相关(0.12)。然后,作者还绘制了这些基因与mRNAsi之间的皮尔逊相关系数,并发现了类似的趋势(图5B)。值得注意的是,SLC43A2与mRNAsi之间的关系***为密切,进一步证明了SLC43A2的重要功能。接下来,作者研究了SLC43A2与RNA调控基因表达之间的相关性。令人惊讶的是,作者发现在TCGA-AML数据集中,高SLC43A2表达与大多数RNA调节基因相关,包括m1A、m5C和m6A(图5C)。有趣的是,除了TRMT6、TET2和ALKBH5之外,大多数关系都是负相关的。接下来,作者发现SLC43A2与多个错配修复(MMR)基因在AML中呈负相关(图5D),这表明SLC43A2受MMR的影响。因此,作者预计SLC43A2可能是AML中与干细胞特性相关的潜在生物标志物。

图5 LC43A2在肿瘤发生中起着重要作用


总结

总之,作者使用共识聚类为AML患者开发了一种新的干细胞分类方法,以指导临床治疗。发现了八个生物标志基因与AML干细胞特征密切相关,七个基因与mRNAsi评分呈负相关。SLC43A2有望成为AML中与干细胞特性相关的潜在生物标志物。


往期回顾:
***强攻略1:史上***全单细胞生信数据库汇总解读
***强攻略2:史上***全非编码RNA生信数据库汇总解读
***强攻略3:史上***全外泌体生信数据库汇总解读
***强攻略4:史上***全甲基化表观调控生信数据库汇总解读
***强攻略5:史上***全转录调控生信数据库汇总解读
***强攻略6:史上***全网络药理学生信数据库汇总解读

在看,SCI马上发表

文章内容如有侵权,请联系站长删除。

相关推荐

我们的理念是“用我们的努力,为您创造更新颖的分析,更快速的响应”,我们将继续辅助各位老师,希望各位老师通过自己一步一步的努力始终以发表SCI为目的,让每一位老师都能感受到我们带给您的服务。

  • 专注生信,所以专业
  • 免费咨询
  • 硕博团队1V1服务
  • 7x24客服

联系我们

电话:15322234761

微信:15322234761(电话同步)

邮箱:pubmedgene@163.com

总部:广州市海珠区昌岗达镖国际中心

关注我们

企业微信

生信风暴公众号

智汇基因  粤ICP备10202590号-2

我们的理念是;用我们的努力,为您创造更新颖的分析,更快速的响应;,我们将继续辅助各位老师,希望各位老师通过自己一步一步的努力始终已发表SCI为目的,让每一位老师都能感受到我们带给您的服务。

关注我们

生信分析

定制服务

   公众号

联系我们

电话:15322234761

微信:15322234761(电话同步)

邮箱:pubmedgene@163.com

总部:广州市海珠区昌岗达镖国际中心


© 2010-2021 智汇基因ICP备10202590号-2

添加微信好友,详细了解产品
使用企业微信
“扫一扫”加入群聊
复制成功
添加微信好友,详细了解产品
我知道了