图片展示

非同一般的5+机器学习+分型+免疫的生信思路,请接收!

2023-11-15 09:26:39

浏览:

导语


今天给同学们分享一篇非肿瘤结合机器学习和免疫的生信文章“Immune-Associated Gene Signatures and Subtypes to Predict the Progression of Atherosclerotic Plaques Based on Machine Learning”,这篇文章于2022年4月26日发表在Front Pharmacol期刊上,影响因子为5.988。实验和临床证据表明,动脉粥样硬化是一种慢性炎症性疾病。作者的研究旨在揭示免疫相关基因在动脉粥样硬化斑块进展过程中的作用。


1. 动脉粥样硬化斑块进展和免疫相关基因的鉴定

为了研究免疫相关基因在动脉粥样硬化斑块进展中的作用,作者结合了来自GSE28829和GSE43292队列的45个早期和48个晚期动脉粥样硬化斑块标本的表达谱(图1A)。为后续分析调整了批次效应(图1B)。在1242个免疫相关基因中,与早期动脉粥样硬化斑块相比,114个呈现下调,21个呈现上调(图1C,D)。这些动脉粥样硬化斑块进展和免疫相关基因与免疫反应相关,例如细胞因子受体相互作用和趋化因子信号通路(图1E-H)。

图1 鉴定动脉粥样硬化斑块进展和免疫相关基因


2. 关键动脉粥样硬化斑块进展和免疫相关基因的鉴定

关键动脉粥样硬化斑块进展和免疫相关基因(图2A)。进一步分析表明,它们主要参与细胞因子-细胞因子受体相互作用、Toll样受体信号通路、趋化因子信号通路、TNF信号通路、自然杀伤细胞介导的细胞毒作用、NF-kappaB信号通路、IL-17信号通路和细胞粘附分子(图2B-E),表明关键的动脉粥样硬化斑块进展和免疫相关基因的关键作用。

图2 关键动脉粥样硬化斑块进展和免疫相关基因的鉴定


3. 通过机器学习筛选关键基因

应用三种算法在关键的动脉粥样硬化斑块进展和免疫相关基因中选择特征基因。对于LASSO算法,十倍交叉验证后的***lambda为0.014。因此,作者选择构建LASSO,因为比较准确率更高,并确定了12个特征基因,包括ITGAL、IL7R、IL18、CCL19、BTK、TLR8、CD14、CCL5、IL1B、IL6、GZMB和TNFSF13B(图3A、B)。对于随机森林算法,确定了30个相对重要性>0.25的特征基因,包括MMP9、ICAM1、PTPRC、LCP2、C3AR1、CCL2、IL10RA、IL6、FCGR3A、CD28、TNFSF13B、TLR2、CCL5、CD4、CD86、TLR1、CSF2RB、TYROBP、CCL4、ITGB2、FCER1G、CSF1R、CYBB、CCL19、HCK、CCR1、ITGAL、CD14、GZMB和BTK(图3C、D)。对于SVM-RFE算法,当特征数为26时,分类器误差***小,包含CD14、ITGAL、TNFSF13B、IL18、CCL5、PTPRC、CCRL2、IL7R、MMP9、BTK、IL10RA、CD28、GZMB、ICAM1、HCK、CSF2RB、CD74、TLR2、CCR1、C3AR1、CCL19、IL2RG、TYROBP、CSF1R、CXCR4和IL1B(图3E)。经过交集,***终确定了LASSO、随机森林和SVM-RFE算法共享的7个特征基因(TNFSF13B、CCL5、CCL19、ITGAL、CD14、GZMB和BTK;图3F)。

图3 通过机器学习筛选关键基因


4. 特征基因预测动脉粥样硬化斑块进展的诊断效能

七个特征基因(TNFSF13B、CCL5、CCL19、ITGAL、CD14、GZMB和BTK)在晚期动脉粥样硬化斑块中的表达高于早期阶段(图3G),表明它们在动脉粥样硬化斑块进展过程中的潜在作用。当所有这些都适合一个变量时,ROC曲线的AUC为0.918,表明在预测动脉粥样硬化斑块进展方面具有良好的诊断效率(图3H)。作者还评估了每个特征基因在预测联合GSE28829和GSE43292队列中动脉粥样硬化斑块进展方面的诊断性能。ROC曲线的AUC值为BTK的0.888(图4A)、CCL5的0.753(图4B)、CCL19的0.834(图4C)、CD14的0.854(图4D)、GZMB的0.862(图4E)、ITGAL的0.872(图4F)和0.816的TNFSF13B(图4G),证明这些特征基因能够估计动脉粥样硬化斑块的进展。

图4 特征基因预测动脉粥样硬化斑块进展的诊断效能


5. 特征基因在估计动脉粥样硬化斑块进展中的诊断性能的外部验证

在GSE41571数据集中,CCL19在稳定斑块中的表达高于破裂斑块,而ITGAL、CD14和GZMB在破裂斑块中的表达高于稳定斑块(图4H)。在GSE120521数据集中,已证实不稳定斑块中的TNFSF13B、CD14和BTK表达高于稳定斑块(图4I)。在GSE41571数据集中,ROC曲线的AUC值为BTK的0.717、CCL5的0.567、CCL19的0.917、CD14的0.900、GZMB的0.933、0.900的ITGAL和0.700的TNFSF13B,这表明它们在区分破裂斑块和稳定斑块方面的潜力。此外,在GSE120521数据集中,ROC曲线的AUC值为1.000的BTK、0.812的CCL5、0.938的CCL19、1.000的CD14、0.875的GZMB、0.812的ITGAL和0.969的TNFSF13B,表明它们能够区分不稳定斑块和稳定斑块。因此,特征基因在预测动脉粥样硬化斑块的进展方面具有出色的诊断性能。


6. 从早期到晚期动脉粥样硬化斑块的免疫学特征的改变

根据免疫细胞浸润和免疫检查点表达评估免疫学特征。与早期动脉粥样硬化斑块相比,大多数先天性和适应性免疫细胞在晚期动脉粥样硬化斑块中呈现出更高的浸润水平(图5A)。此外,动脉粥样硬化斑块中的免疫细胞群之间存在显着的相互作用(图5B)。如图5C所示,大多数免疫检查点在晚期动脉粥样硬化斑块中的表达高于早期动脉粥样硬化斑块。此外,分析显示特征基因与免疫细胞浸润之间存在正相互作用(图5D)。特征基因与动脉粥样硬化斑块上的免疫检查点呈正相关(图5E)。因此,特征基因可能在动脉粥样硬化斑块进展过程中调节免疫学特征。

图5 GSE28829和GSE43292组合数据集中免疫学特征从早期到晚期动脉粥样硬化斑块的变化以及特征基因与免疫学特征之间的相关性


7. 特征基因涉及的信号通路

通过GSEA,作者评估了参与特征基因的信号通路。作者的结果表明BTK(图6A)、CCL5(图6B)、CCL19(图6C)、CD14(图6D)、GZMB(图6E)、ITGAL(图6F)和TNFSF13B(图6G)免疫反应(细胞因子-细胞因子受体相互作用、Toll样受体信号通路、B细胞或T细胞受体信号通路等)均呈正相关。

图6 GSEA识别特征基因涉及的信号通路


8. 预测动脉粥样硬化斑块进展的特征基因列线图的建立

如图7A所示,特征基因之间存在显着的相互作用。通过结合特征基因,构建了列线图作为动脉粥样硬化斑块进展的诊断工具(图7B)。在列线图中,每个特征基因对应一个分数,将所有特征基因的分数相加得到总分。总分对应于动脉粥样硬化的不同风险。校准曲线表明列线图能够准确估计动脉粥样硬化斑块的进展(图7C)。如决策曲线分析中所述,被诊断患有动脉粥样硬化的患者可以在临床上受益于列线图(图7D)。

图7 基于特征基因的列线图的建立和潜在小分子化合物的选择


9. 基于动脉粥样硬化斑块进展和免疫相关基因预测抗动脉粥样硬化的小分子化合物

在动脉粥样硬化斑块进展和免疫相关基因的基础上,通过CMap分析预测了潜在的抗动脉粥样硬化的小分子化合物,如图7E所示。其中alvespimycin、pifithrin-mu和radicicol共享HSP抑制剂,而IKK-2-inhibitor-V和radicicol共享NF-kappaB通路抑制剂。


10. 基于动脉粥样硬化斑块进展和免疫相关基因构建动脉粥样硬化的两种免疫亚型

通过共识聚类方法,根据135个动脉粥样硬化斑块进展和免疫相关基因的表达谱对动脉粥样硬化斑块进行聚类。这是使用一致矩阵图、CDF图、CDF曲线下面积的相对变化确定的(图8A-D)。这两种免疫亚型被命名为C1和C2。PCA证明了亚型之间的显着差异(图8E)。发现亚型之间动脉粥样硬化斑块进展和免疫相关基因的表达存在显着异质性(图8F)。

图8 基于GSE28829和GSE43292组合数据集中的动脉粥样硬化斑块进展和免疫相关基因构建动脉粥样硬化的两种免疫亚型


11. 具有不同免疫学特征和分子机制的两种免疫亚型

在图9A中,作者注意到所有特征基因在C1中的表达均高于C2亚型。与C2亚型相比,大多数免疫检查点在C1亚型中显着上调(图9B)。如图9C所示,C1亚型比C2亚型具有更高的免疫激活。进一步分析表明,C1亚型对大多数免疫细胞群的浸润水平高于C2亚型(图9D)。总的来说,作者将C1鉴定为免疫亚型,将C2鉴定为非免疫亚型。

图9 具有不同免疫学特征和分子机制的两种免疫亚型

 

总结

作者的研究结果确定了七种特征性的动脉粥样硬化斑块进展和免疫相关基因(TNFSF13B、CCL5、CCL19、ITGAL、CD14、GZMB和BTK),它们可以预测动脉粥样硬化斑块的进展。此外,作者提出了一种新的分子分类,包括跨动脉粥样硬化斑块的免疫和非免疫亚型。总的来说,作者的研究结果可能有助于设计更***定制的心血管免疫疗法。对机器学习和免疫相关感兴趣的老师,欢迎扫码咨询!

生信分析定制服务

请扫描下方二维码

或添加微信沟通:ShengxinBoss1
往期回顾:
***强攻略1:史上***全单细胞生信数据库汇总解读
***强攻略2:史上***全非编码RNA生信数据库汇总解读
***强攻略3:史上***全外泌体生信数据库汇总解读
***强攻略4:史上***全甲基化表观调控生信数据库汇总解读
***强攻略5:史上***全转录调控生信数据库汇总解读
***强攻略6:史上***全网络药理学生信数据库汇总解读

在看,SCI马上发表

文章内容如有侵权,请联系站长删除。

相关推荐

我们的理念是“用我们的努力,为您创造更新颖的分析,更快速的响应”,我们将继续辅助各位老师,希望各位老师通过自己一步一步的努力始终以发表SCI为目的,让每一位老师都能感受到我们带给您的服务。

  • 专注生信,所以专业
  • 免费咨询
  • 硕博团队1V1服务
  • 7x24客服

联系我们

电话:15322234761

微信:15322234761(电话同步)

邮箱:pubmedgene@163.com

总部:广州市海珠区昌岗达镖国际中心

关注我们

企业微信

生信风暴公众号

智汇基因  粤ICP备10202590号-2

我们的理念是;用我们的努力,为您创造更新颖的分析,更快速的响应;,我们将继续辅助各位老师,希望各位老师通过自己一步一步的努力始终已发表SCI为目的,让每一位老师都能感受到我们带给您的服务。

关注我们

生信分析

定制服务

   公众号

联系我们

电话:15322234761

微信:15322234761(电话同步)

邮箱:pubmedgene@163.com

总部:广州市海珠区昌岗达镖国际中心


© 2010-2021 智汇基因ICP备10202590号-2

添加微信好友,详细了解产品
使用企业微信
“扫一扫”加入群聊
复制成功
添加微信好友,详细了解产品
我知道了