生信学习,咨询,代做,请关注公众号:生信风暴。或添加客服微信:ShengxinBoss1

劲爆机器学习,好写又好发的8+生信思路

生信精讲 管理员 195℃ 0评论
劲爆机器学习,好写又好发的8+生信思路插图

今天给同学们分享一篇关于干细胞特征影响胶质瘤预后和免疫的文章“Machine learning revealed stemness features and a novel stemness-based classification with appealing implications in discriminating the prognosis, immunotherapy and temozolomide responses of 906 glioblastoma patients”,这篇文章于今年1月份发表在BRIEFINGS IN BIOINFORMATICS杂志上,影响因子IF=8.99,即时IF=10.38。文章作者基于GBM患者的干性指数以及干细胞特征,运用机器学习的方法对患者进行分析,为GBM的潜在治疗提供了新的思路。

Machine learning revealed stemness features and a novel stemness-based classification with appealing implications in discriminating the prognosis, immunotherapy and temozolomide responses of 906 glioblastoma patients

机器学习揭示了干细胞特征和基于干细胞的新分类,对于胶质母细胞瘤患者的预后、免疫治疗和替莫唑胺反应的鉴别具有重要意义

结果解读

1高干性指数与临床特征的关系

作者通过一类回归算法(OCLR),计算518名GBM患者的基因表达谱的干细胞指数(从低到高排序),以探索mRNAsi与临床特征之间的联系(图1A和C)。如图1B所示,年龄小于40的患者mRNAsi评分明显高于老年患者。此外,进展期患者、G-CIMP患者和MGMT患者显示出较高的mRNAsi评分;并且PTEN突变体样品的干指数明显低于PTEN野生型样品,但TP53突变体、IDH突变体和ATRX突变体样品的干指数明显高于野生型样品(图1D)。

劲爆机器学习,好写又好发的8+生信思路插图1

GBM患者的临床和分子特征与干细胞指数的相关性

2.干性指数与TIME的关系模式

作者通过ssGSEA量化了29个GBM免疫特征的富集水平,将患者分为高、中、低三个免疫亚型,并绘制热图(图2A)。然后,通过估计和分类排序算法评估TIME模式。高干指数与免疫、基质和估计评分显著负相关,表明免疫和基质细胞的浸润水平随着GBM高干度的升高而降低(图2B)。此外,免疫和基质评分在高免疫肿瘤中都显著最高,表明免疫细胞和基质细胞的丰度较高,其次是中免疫和低免疫肿瘤(图2C)。相比之下,从高免疫组到低免疫组,肿瘤纯度增加,而干性指数降低。然后,通过CIBERSORT算法对22种免疫细胞的丰度进行量化(图2D),结果如图E所示。

劲爆机器学习,好写又好发的8+生信思路插图2

GBM的肿瘤免疫微环境模式和免疫遗传学特征与干性指数相关

3.干性指数、OS、DFS影响GBM预后

根据干细胞指数的中值把518名GBM患者分为高低两组。K-M生存分析表明,高mRNAsi组表现出明显更好的OS和更差的DFS(图3A和B)。考虑到高低mRNAsi预后差异,我们进一步对两组患者进行差异分析,共鉴定出130个差异基因,包括41个上调基因和89个下调基因(图3C)。再对差异基因进行富集分析,结果如图3D所示。此外,在130个差异基因中,有35个突变频率>1(图3E)。

劲爆机器学习,好写又好发的8+生信思路插图3

生存分析和高、低mRNAsi组差异表达分析

4.识别具有不同生存结果、功能注释和临床特征的两种干细胞亚型

基于机器学习的方法,作者使用无监督一致性聚类探索一种新的GBM患者分子分类,根据CDF曲线下面积的相对变化、PAC算法和一致性热图,确定最佳聚类数为2(Figure 4A–C)。因此,所有GBM患者被分为两组,分别命名为干细胞亚型1(233例)和干细胞亚型2(285例)(图4D)。K-M生存分析表明,干细胞亚型一组的GBM患者表现出更好的OS 和更差的PFS(图4E和F)。随后,作者通过GSVA分析,旨在探索与GBM干细胞亚型相关的分子通路和潜在机制。共鉴定出36个差异富集的分子通路,包括4个与干细胞亚型I正相关的途径和32个与干细胞亚型II正相关的途径(图4G)。

劲爆机器学习,好写又好发的8+生信思路插图4

两种具有不同生存结果和功能注释的干细胞亚型的鉴定

5.干细胞亚型1具有较高的CNA负荷和TMB

作者对干细胞亚型1和2组的GBM患者的人口统计学和临床病理特征进行了比较。如图5A所示,干细胞亚型1组患者的诊断年龄明显小于干细胞亚型2组患者。因此,对两组亚型患者进行了CNA分析和体细胞突变分析,以探索不同干细胞亚型的不同基因组变异。如图5B所示,干细胞亚型1的患者倾向于承担更大的拷贝。体细胞突变分析显示,每个干细胞亚型都有特定的顶端突变基因(图5C和D)。。关于GBM最常见的生物标志物,干细胞亚型1组中TP53突变患者的比例明显高于干细胞亚型2组。IDH和ATRX也观察到相同的情况,表明IDH的突变频率和ATRX 在干细胞亚型1组中显著较高(图5E)。

劲爆机器学习,好写又好发的8+生信思路插图5

干细胞亚型1和亚型2临床病理和体细胞变异的比较

6.干细胞亚型具有不同的TIME和免疫基因模式,且亚型1对免疫疗法更敏感,但对TMZ耐药

作者使用ESTIMATE估计算法来揭示两种干细胞亚型的TIME组成。与干细胞亚型2相比,干细胞亚型1的免疫、基质和估计评分明显较低,肿瘤纯度评分明显较高,表明干细胞亚型1的免疫和基质细胞丰度较低,肿瘤纯度较高(图6A)。再通过CIBERSORT算法对TIICs在GBM中的入渗丰度进行定量研究,大多数CD4+和CD8+ T细胞亚群、NK细胞、单核细胞、巨噬细胞和中性粒细胞在干细胞亚型2中更丰富(图6B),但是浆细胞、T细胞等在干细胞亚型1中更丰富(图6B)。在GBM免疫分类中,高、中免疫肿瘤所占比例较高,而低免疫肿瘤所占比例较高(图6C)。PD1/PD-L1/PD-L2和CTLA/CD80/CD86在两种干细胞亚型中的表达水平完全相反(图6D)。PD1及其配体(PD-L1和PD-L2)在干细胞亚型1中的表达水平显著较高。随后,作者用TIDE算法用于预测GBM患者免疫治疗反应的可能性。如图6E所示,干细胞亚型一组中免疫治疗应答者的比例是干细胞亚型二组的两倍多

劲爆机器学习,好写又好发的8+生信思路插图6

两种干细胞亚型的不同时间和免疫基因模式导致对免疫疗法和TMZ的不同敏感性

7.干细胞亚型预测因子的构建与验证及临床应用

在训练集中,作者使用四种机器学习算法,通过130个基于干细胞的DEGs的表达水平来确定最关键的干细胞亚类型相关特征。LASSO、RFB、SVM和XGBoost分析分别鉴定出43、112、30和71个基因。ROC曲线分析表明,四种机器学习算法在特征选择方面表现优异,训练集的AUC为1.00,测试集的AUC > 0.95(图7A)。韦恩图确定了四种特征选择算法共有的七个关键基因(图7B)。ROC分析表明,在训练集中,区分干细胞亚型1和2的AUC为0.9889,敏感性为94.86%,特异性为97.51%,准确性为96.28%(图7C)。作者还利用了CGGA和PUMCH患者的qRT聚合酶链反应数据,通过应用干细胞亚型预测因子,计算了每个患者的评分,然后根据诊断预测因子的临界值和七个关键基因的表达谱将患者分为两组。CGGA队列由58名干细胞亚型1患者和292名干细胞亚型2患者组成(图7D),而PUMCH队列中包含28名干细胞亚型1患者和10名干细胞亚型2患者(图7F)。K-M生存分析表明,在CGGA和PUMCH队列中,干细胞亚型1的患者表现出明显更好的OS和更差的DFS(图7E和G)。

劲爆机器学习,好写又好发的8+生信思路插图7

干细胞亚型预测因子的构建与验证

小结

免疫治疗在GBM中有很大的潜力和挖掘空间,筛选可能受益于免疫治疗的患者是目前研究的重要任务之一。在本研究中,作者根据GBM干性指数将患者分为两个不同的亚型组,并预测不同亚型患者对免疫治疗的反应,为未来筛选免疫治疗患者提供了一种潜在的方法。作者还确定了干细胞亚型预测因子,这使得基于干细胞的亚分组在临床上的可行性。生信分析加上机器学习算法,再结合自己的临床样本简单验证,非常值得借鉴。对本思路感兴趣的同学,欢迎咨询。

劲爆机器学习,好写又好发的8+生信思路插图8
扫码或添加微信沟通:ShengxinBoss1
往期回顾:
最强攻略1:史上最全单细胞数据库汇总解读
最强攻略2:史上最全非编码RNA数据库汇总解读
最强攻略3:史上最全外泌体数据库汇总解读
最强攻略4:史上最全甲基化表观调控数据库汇总解读
最强攻略5:史上最全转录调控数据库汇总解读
最强攻略6:史上最全网络药理学数据库汇总解读

劲爆机器学习,好写又好发的8+生信思路插图9

转载请注明:智汇基因 » 劲爆机器学习,好写又好发的8+生信思路

喜欢 (0)
发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址