生信学习,咨询,代做,请关注公众号:生信风暴。或添加客服微信:ShengxinBoss1

IF=7.561|非肿瘤+机器学习+纯生信分型,快来抄作业!

生信精讲 管理员 2125℃ 0评论
IF=7.561|非肿瘤+机器学习+纯生信分型,快来抄作业!插图

今天给同学们分享一篇基于免疫细胞类型无监督聚类的胆道闭锁的生信文章“ Unsupervised Clustering Reveals Distinct Subtypes of Biliary Atresia Based on Immune Cell Types and Gene Expression ”,这篇文章于今年9月份发表在 FrontImmunol 杂志上,影响因子=7.561。在这项研究中,作者应用机器学习方法识别与BA潜在发病机制相关的不同亚型并进行生物分析。

1. 胆道闭锁的亚型鉴定

 作者研究的流程图如图1所示。首先下载了数据集GSE46995。然后使用xCell评估基因图谱的相对富集程度,从而得出各组不同的免疫细胞和基质细胞类型(图2A)。作者发现三组之间的细胞类型存在显著差异。此外,采用最大方差法筛选出前5000个最大方差基因。生成最佳聚类数,并通过FactorExtra软件包(图2B,C)可视化。通过应用SNF-CC的集成方法,BA数据集被分为三个不同的子类型(图2D,E),轮廓系数为0.91,这表明(图2D)中每个子类型之间具有高度的内聚性和分离性。使用数据集GSE15235进行验证:基于基因表达和免疫细胞,47个样本聚集为三个不同的亚型,轮廓系数为0.89。然后应用基因集变异分析检测GSE46995数据集中的细微路径活动变化,该数据集同样将样本分为3个亚型。

IF=7.561|非肿瘤+机器学习+纯生信分型,快来抄作业!插图1

图1 研究流程图

IF=7.561|非肿瘤+机器学习+纯生信分型,快来抄作业!插图2

图2 胆道闭锁亚型的鉴定

2. BA亚型的差异表达谱

使用Venn图确定每个亚型的代表性基因。亚型1、2和3分别由839、1173和1447个代表性差异表达基因组成(图3A)。这些基因在三种亚型中的表达随后在热图上显示(图3B)。此外,亚型1、2和3分别由10、14和24个代表性细胞组成(图3C),代表性细胞在热图上显示(图3D)。亚型1的代表性细胞包括platelets, smooth muscle, plasma cells, hepatocytes, macrophages, Hepatic Stellate Cells (HSC), B cells and Conventional dendritic cells (cDC)。亚型2包括astrocytes, mesenchymal stem cells (MSC), iDC, aDC, microvascular endothelial cells, macrophages, macrophages M1, Granulocyte-Monocyte Progenitor (GMP), preadipocytes, neutrophils, monocytes and high stroma score while,亚型3包括myocytes, skeletal muscle, melanocytes, eosinophils。

IF=7.561|非肿瘤+机器学习+纯生信分型,快来抄作业!插图3

图3 每个亚型的代表性基因和免疫细胞

3.通路富集分析

为了探讨各BA亚型可能的病理机制,作者提取了代表性基因,进行了分子功能( MF )富集和Reactome通路分析。亚型1基因的MF分析显示候选基因富集GDP binding,rRNA processing等信号通路(图4A )。亚型2基因的MF分析显示候选基因富集cell adhession等信号通路(图4B)。亚型3富集基因如图4C所示

IF=7.561|非肿瘤+机器学习+纯生信分型,快来抄作业!插图4

图4分子功能和反应通路分析

4.不同亚型的Hub基因

作者进一步从每个亚型的代表性基因中确定了hub基因,并构建了PPI网络,将结果导入Cytoscape进行进一步的模块分析。MCODE插件用于计算前3个簇,获得每个簇中的中心基因。亚型1、2和3的中枢基因分别如图5A-C所示。亚型1的中枢基因包括TCEB1、UBE2D1、RPS27A、TYROBP、FCGR2A、CSF1R、COX6C、ATP5G1和COX7A2。亚型2的中枢基因为WDR36、MRTO4、NIFK、ANXA1、C5AR1、TAS2R20、IL1B、CD68和IL10。此外,第3亚型的中枢基因为RPS29、RPLP0、RPS2、C3AR1、ITGB2、CYBB、CDK1、CCNE2和MAD2L1。

IF=7.561|非肿瘤+机器学习+纯生信分型,快来抄作业!插图5

图5 各亚型代表基因的PPI网络

小结

在此,作者对病因异质性的机制提供了新的见解。通过基因表达芯片和免疫细胞成分分析,BA可分为三个亚型:自身免疫亚型、病毒相关亚型和胚胎亚型,并推断亚型1可能与靶向胆管的自身免疫反应有关从而导致BA。非肿瘤分型思路感兴趣的老师(可拓展到免疫亚型、自噬亚型、铁死亡亚型等),欢迎扫码咨询。

IF=7.561|非肿瘤+机器学习+纯生信分型,快来抄作业!插图6
扫码或添加微信沟通:ShengxinBoss1
往期回顾:
最强攻略1:史上最全单细胞数据库汇总解读
最强攻略2:史上最全非编码RNA数据库汇总解读
最强攻略3:史上最全外泌体数据库汇总解读
最强攻略4:史上最全甲基化表观调控数据库汇总解读
最强攻略5:史上最全转录调控数据库汇总解读
最强攻略6:史上最全网络药理学数据库汇总解读

IF=7.561|非肿瘤+机器学习+纯生信分型,快来抄作业!插图7

转载请注明:智汇基因 » IF=7.561|非肿瘤+机器学习+纯生信分型,快来抄作业!

喜欢 (3)
发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址