生信学习,咨询,代做,请关注公众号:生信风暴。或添加客服微信:ShengxinBoss1

一看就会的3+非肿瘤纯生信分析

生信精讲 管理员 190℃ 0评论

一看就会的3+非肿瘤纯生信分析插图今天和大家分享的是2019年11月发表在Frontiers in Genetics杂志(IF=3.517)上的一篇文章,“Identifying Key Genes and Functionally Enriched Pathways in Sjögren’s Syndrome by Weighted Gene Co-Expression Network Analysis”。文章中作者使用GEO数据库中的干燥综合征(SS)数据集进行DEGs筛选,对DEGs进行WGCNA分析鉴定出与SS相关的共表达模块以及核心基因,最后对核心基因进行了外部数据集验证以及GSEA通路富集分析。

Identifying Key Genes and Functionally Enriched Pathways in Sjögren’s Syndrome by Weighted Gene Co-Expression Network Analysis

通过加权基因共表达网络分析鉴定干燥综合征的核心基因与功能通路

一、研究背景

干燥综合征(Sjögren’s syndrome ,SS)是一种系统性自身免疫性疾病,以口干、眼干为主要症状,主要累及外分泌腺体的慢性炎症性自身免疫病,并可伴有多器官系统性表现。迄今为止,其病因的确切的分子机制仍未解开。这项研究的目的是使用加权基因共表达网络分析(WGCNA)来确定与SS相关的关键基因以及具体调控通路。

二、结果解读

01 SS组和正常对照组的差异表达基因

作者从GEO数据库下载了SS的mRNA表达谱,数据集提供了190名SS患者和32名对照患者,随后用limma R包在表达数据中筛选了SS患者和对照之间的差异表达基因(DEG),共鉴定1,483个差异表达基因用于后续分析。

一看就会的3+非肿瘤纯生信分析插图1

表1 SS组和正常对照组的差异表达基因

02 WGCNA分析样本中基因共表达网络

基于上述差异基因,作者进一步通过WGCNA分析,构建了17个共表达模块,其中蓝绿色模块是参与SS的主要模块(与表型相关性最高),包含278个基因,其次是黑色、蓝色和黄色。

一看就会的3+非肿瘤纯生信分析插图2

图1 WGCNA共表达网络

03 SS模块特质相关性和Hub基因鉴定

蓝绿色模块与表型相关性最高,根据蓝绿色模块确定了19个基因确定为关键基因基因(筛选条件:MM>0.9 & GS>0.4),作者选择其中5个没有在SS中研究过的基因做为后续要验证的对象,包括GBP1,PARP9,EPSTI1,LOC400759,STAT1。

一看就会的3+非肿瘤纯生信分析插图3

图2 模块-特征相关性分析和hub基因鉴定

04 关键模块的功能注释

GO功能富集分析表明,蓝绿色模块中的基因主要富集于生物过程,对病毒的反应,免疫反应,防御反应,对细胞因子刺激的反应以及炎症反应,表明这些这些基因可能与SS发生的免疫调控机制有关。

一看就会的3+非肿瘤纯生信分析插图4

图3 GO富集分析

05 hub基因的验证与效能评估

在数据集GSE51902中, EIF2AK2,GBP1,PARP12,TDRD7和PARP14基因的表达在SS患者中显着增加。据此,作者对另外两个数据集GSE84844和GSE66795也研究了上述五个关键基因的表达水平,表达趋势均与GSE51902相同。

一看就会的3+非肿瘤纯生信分析插图5

图4 GSE51092数据集中5个hub基因的表达差异分析

一看就会的3+非肿瘤纯生信分析插图6

图5 GSE84844数据集中5个hub基因的表达表达分析

一看就会的3+非肿瘤纯生信分析插图7

图6 GSE66795数据集中5个hub基因的差异表达分析

此外,绘制了ROC曲线5个基因的诊断价值,计算曲线下的面积(AUC)以区分SS与对照,并且在数据集GSE51092,GSE 84844中五个真实hub基因的每个AUC均大于0.7 和GSE66795,表现出较高的诊断价值。

一看就会的3+非肿瘤纯生信分析插图8

图7 5个hub基因在3个数据集中的ROC曲线

06 hub基因的单基因GSEA分析

通过基因集富集分析,作者进一步展示了5个hub基因分组中差异表达基因的富集分析结果。

一看就会的3+非肿瘤纯生信分析插图9

图8 基于关键基因分组的通路富集分析

作者从完整基因集列表中选择了与免疫相关的基因集以进行进一步分析。在具有高表达的EIF2AK2和TDRD7的样品中富集了三个基因集,包括“炎症反应”,“干扰素α反应”和“γ干扰素反应”。同样,在高表达GBP1的样品中,“免疫应答的调节”,“防御应答的调节”和“对细胞因子的应答”等通路也具有显著性意义。此外,在具有高表达的PARP12或PARP14的样品中富集了“炎症反应”和“干扰素α反应”信号通路。

一看就会的3+非肿瘤纯生信分析插图10

图9 GSEA免疫相关基因集富集分析

三、小结:

在本研究中,作者首先鉴定出1,483个差异基因并进行WGCNA分析鉴定出与SS相关的共表达模块以及核心基因,并对关键基因进行GO富集分析与GSEA分析,为SS的管理提供了新的见解。本研究总体思路是筛选差异基因进行WGCNA分析,并通过外部数据集来验证关键基因表达模式的稳定性,如果再简单加上实验验证整体效果会更好。对上述思路感兴趣的同学欢迎咨询。

一看就会的3+非肿瘤纯生信分析插图11
扫码或添加微信沟通:ShengxinBoss1
往期回顾:

最强攻略:史上最全单细胞数据库汇总解读

最强攻略2: 史上最全非编码RNA数据库汇总解读

最强攻略3: 史上最全外泌体数据库汇总解读一看就会的3+非肿瘤纯生信分析插图12

 

转载请注明:智汇基因 » 一看就会的3+非肿瘤纯生信分析

喜欢 (0)
发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址