图片展示

8+生物信息学+机器学习,机器学习加持生物信息学,文章高分也easy!!

2023-10-27 10:28:59

浏览:


导语


今天给同学们分享一篇生物信息学+机器学习的生信文章“Identification of immune-related genes in diagnosing atherosclerosis with rheumatoid arthritis through bioinformatics analysis and machine learning”,这篇文章于2023年3月9日发表在Front Immunol期刊上,影响因子为8.786。

越来越多的证据表明,类风湿性关节炎(RA)可能会加重动脉粥样硬化(AS),作者的目标是探索AS和RA患者的潜在诊断基因。


1. 鉴定差异表达基因

从RA组合数据集中,共鉴定出2,705个差异表达基因(DEGs),其p值<0.05且|log2FC| > 1.2。图1A和B分别展示了这些DEGs的火山图和热图,揭示了它们的差异表达模式。同样地,对于AS,使用相同的截断标准(p值<0.05且|log2FC| > 1.2),共鉴定出5,322个DEGs。图2A和B描述了这些DEGs在AS中的差异表达模式。

图1 AS组和对照组之间的不同表达基因

图2 通过Limma和WGCNA模块基因在RA中鉴定DEGs


2. 加权基因共表达网络分析和关键模块识别

作者使用加权基因共表达网络分析(WGCNA)构建了一个无标度的共表达网络,以识别与RA***相关的模块。基于尺度独立性和平均连接性,作者选择了一个“软”阈值β为7(图2C、D)。生成了RA和对照的聚类树状图,并得到了26个不同颜色的基因共表达模块,合并阈值为0.25,***小大小为50(图2E-G)。临床相关性分析结果显示,粉色模块与RA的关联***(r = 0.73,p值<0.001)(图2H)。因此,作者选择了由206个基因组成的粉色模块进行进一步分析。作者进行了模块成员和基因重要性之间的相关性分析,并发现它们之间存在显著正相关(相关系数=0.64,p值<0.001)(图2I)。这些结果表明,粉色模块中的基因与RA***密切相关。


3. RA的功能富集分析

为了验证GSE55457的可靠程度,作者对Limma和模块基因的交集进行了富集分析。共获得了164个共同基因,如图3A所示。

图3 RA基因交集的功能富集分析


KEGG分析表明,常见基因参与了“p53信号通路”和“凋亡”过程,如图3B所示。GO分析结果显示,常见基因富集在生物过程(BP)方面,包括“免疫系统过程”、“免疫应答”和“免疫应答调节”,如图3C所示。对于细胞组分(CC)本体论,常见基因参与了“细胞质”、“细胞核部分”和“细胞核腔”,如图3D所示。在分子功能(MF)方面,结果显示“药物结合”是常见基因中***显著的术语,如图3E所示。


结果表明,RA的常见基因与免疫反应有关,与RA的发病机制高度相关。


4. 通过蛋白质相互作用网络对AS与RA进行富集分析和筛选节点基因

AS和RA的DEGs交集中包括53个基因,如图4A所示。为了探索RA相关基因与AS发病机制之间的关系,基于这些基因进行了富集分析。KEGG分析显示,这53个基因主要富集在“NF-kappaB信号通路”和“神经营养因子信号通路”,这些通路与免疫系统密切相关,如图4B所示。GO分析显示,这些基因参与了“NF-kappaB信号通路”、“I-kappaB磷酸化”(BP)、“细胞质”、“细胞骨架”(CC)和“转移酶活性”(MF),如图4C-E所示。

图4 对RA与AS的共同基因进行功能富集分析,并利用PPI网络识别节点基因


构建了一个蛋白质相互作用网络,其中有22个基因可以相互作用,如图4F所示。节点基因在图4G中按节点编号进行了排名。


5. 通过机器学习识别候选关键基因

利用LASSO回归和RF机器学习算法,作者确定了与AS伴RA诊断相关的潜在候选基因。LASSO回归分析确定了与该疾病密切相关的22个基因(图5A、B)。在RF算法中,作者根据平均准确率下降(MDA)和平均基尼指数下降(MDG)等指标评估了基因的重要性(图5C、D)。计算了这些基因在LASSO回归中的AUC和95% CI,以及在RF机器学习算法中MDA和MDG的交集,并绘制了ROC曲线。结果显示,LASSO回归(AUC 0.999,CI 0.971–1)和RF机器学习算法(AUC 0.995,CI 0.971–0.986)具有较高的准确性(图5E、F)。RF中排名前15位***重要基因与LASSO中的22个基因的交集在图5E中可视化,确定了六个基因(NFIL3、EED、GRK2、MAP3K11、RMI1和TPST1)作为***终验证的关键诊断基因。


图5 机器学习在识别AS相关的RA关键诊断基因方面的应用


6. 诊断价值评估

作者使用六个关键的诊断基因构建了一张图表,如图6B所示。通过构建ROC曲线计算这些基因的AUC和95% CI,以评估其诊断效能,如图6A所示。结果如下:NFIL3(AUC 0.907,CI 0.8515–0.9622),EED(AUC 0.915,CI 0.8582–0.9712),GRK2(AUC 0.986,CI 0.9669–1),MAP3K11(AUC 0.954,CI 0.9089–0.9984),RMI1(AUC 0.953,CI 0.9157–0.9903),TPST1(AUC 0.815,CI 0.723–0.9076),以及nomogram(AUC 0.996,CI 0.9839–1)。作者使用GSE55235和GSE73754验证了该模型,如图6A所示。所有基因和nomogram对于AS伴有RA的诊断具有很高的价值。

图6 建立诺莫图和诊断价值评估。


7. 免疫浸润分析

由于与RA相关的关键诊断基因可以调节AS的发病机制,并且主要富集在免疫系统中,免疫浸润分析可以更好地探索免疫在AS中的作用。对于AS组和对照组,22种免疫细胞的比例如图7A所示。箱线图显示,与对照组相比,AS组中的原始B细胞、浆细胞、CD4+原始T细胞、CD4+记忆激活T细胞、滤泡辅助T细胞、活化NK细胞、单核细胞、M0巨噬细胞、M1巨噬细胞、M2巨噬细胞、静止肥大细胞和活化树突细胞水平较低,而记忆B细胞、调节性T细胞、γδT细胞和活化肥大细胞水平较高,如图7B所示。22种免疫细胞的相关性表明,CD4+记忆静止T细胞与单核细胞呈正相关(r = 0.55),单核细胞与M0巨噬细胞呈负相关(r = -0.64),CD4+记忆静止T细胞与M0巨噬细胞呈负相关(r = -0.72),所有相关关系如图7C所示。总之,免疫细胞在类风湿关节炎患者中的不同程度渗透可能成为潜在的治疗目标。

图7 AS和对照组之间的免疫浸润分析


总结

在这项研究中,作者成功地通过生物信息学分析和机器学习算法鉴定出了六个与免疫相关的中心基因(NFIL3、EED、GRK2、MAP3K11、RMI1和TPST1)。这些基因显示出潜力成为类风湿性关节炎(RA)患者中强直性脊柱炎(AS)的诊断候选基因。此外,作者的研究还突显了AS合并RA患者中的免疫功能紊乱。作者还构建了一个用于诊断AS合并RA的图表,可辅助临床决策。总的来说,作者的发现可能为AS合并RA的发病机制和诊断提供新的见解。进一步的验证研究有必要确认这些基因在AS合并RA中的临床相关性。对这篇文章的思路感兴趣的老师,欢迎扫码咨询!



生信分析定制服务

请扫描下方二维码

或添加微信沟通:ShengxinBoss1
往期回顾:
***强攻略1:史上***全单细胞生信数据库汇总解读
***强攻略2:史上***全非编码RNA生信数据库汇总解读
***强攻略3:史上***全外泌体生信数据库汇总解读
***强攻略4:史上***全甲基化表观调控生信数据库汇总解读
***强攻略5:史上***全转录调控生信数据库汇总解读
***强攻略6:史上***全网络药理学生信数据库汇总解读

在看,SCI马上发表

文章内容如有侵权,请联系站长删除。

相关推荐

我们的理念是“用我们的努力,为您创造更新颖的分析,更快速的响应”,我们将继续辅助各位老师,希望各位老师通过自己一步一步的努力始终以发表SCI为目的,让每一位老师都能感受到我们带给您的服务。

  • 专注生信,所以专业
  • 免费咨询
  • 硕博团队1V1服务
  • 7x24客服

联系我们

电话:15322234761

微信:15322234761(电话同步)

邮箱:pubmedgene@163.com

总部:广州市海珠区昌岗达镖国际中心

关注我们

企业微信

生信风暴公众号

智汇基因  粤ICP备10202590号-2

我们的理念是;用我们的努力,为您创造更新颖的分析,更快速的响应;,我们将继续辅助各位老师,希望各位老师通过自己一步一步的努力始终已发表SCI为目的,让每一位老师都能感受到我们带给您的服务。

关注我们

生信分析

定制服务

   公众号

联系我们

电话:15322234761

微信:15322234761(电话同步)

邮箱:pubmedgene@163.com

总部:广州市海珠区昌岗达镖国际中心


© 2010-2021 智汇基因ICP备10202590号-2

添加微信好友,详细了解产品
使用企业微信
“扫一扫”加入群聊
复制成功
添加微信好友,详细了解产品
我知道了