2023-10-30 10:21:50
浏览:
导语
今天给同学们分享一篇非肿瘤+WGCAN+机器学习的生信文章“Identification and validation of immune and oxidative stress-related diagnostic markers for diabetic nephropathy by WGCNA and machine learning”,这篇文章于2023年2月22日发表在Front Immunol期刊上,影响因子为8.786。
糖尿病肾病(DN)以蛋白尿、高血压和肾功能逐渐减退为特征,在发达***是终末期肾脏疾病***常见的原因,也给社会和经济带来了严重负担。研究表明,随着全球糖尿病患病率的上升,患有DN的人数也在增加,预计在未来20年左右,糖尿病患者将从5.37亿增加到7.83亿。然而,目前的治疗方法主要侧重于肾素-血管紧张素系统的阻断、血压管理和血糖控制。因此,迫切需要寻找糖尿病肾病诊断和治疗的新靶点。随着生物信息学的进步,近年来其研究技术已经广泛应用于探索多种疾病的靶点,包括糖尿病肾病。
图1 流程图
1. 差异表达基因的鉴定
从GSE30528中获得了1696个差异表达基因(DEGs),并从Genecard数据库中挖掘出了另外855个与氧化应激相关的基因。通过对这两者的交集,生成了111个差异表达氧化应激基因(DEOSGs)(图2A-C)。
图2 筛选差异表达基因(DEGs)
2. 免疫浸润分析和加权基因共表达网络的构建
使用CIBERSORT算法,证明了五种免疫细胞类型在DN和对照样本中是可比较的,包括T细胞CD4初级、T细胞γδ、静息NK细胞、静息树突状细胞和静息肥大细胞(图3A)。
图3 免疫浸润分析和加权基因共表达网络的构建
在这项研究中,软阈值功率被校准为14(无标度R 2 = 0.85)(图3B)。***,WGCNA分析揭示了11个模块的总和(图3C)。特别是,绿色模块和品红色模块与T细胞CD4幼稚和γδ亚群呈强正相关。由于它们与免疫浸润细胞的关联显著,绿色和品红色模块被视为额外调查的对象。
3. DEIOSG的获取和功能丰富性分析
DEIOSGs是与WGCNA生成的品红色和绿色模块重叠的基因,共鉴定出24个DEIOSGs(图4A)
图4 DEIOSG的获取和功能丰富性分析
此外,作者通过GO和KEGG对24个差异表达的内源性氧化应激基因(DEIOSGs)进行了功能富集分析。在BP评估中,DEIOSGs主要参与超氧化物代谢过程、中性粒细胞激活等功能。在CC中,DEIOSGs定位于质膜外侧、内吞泡等结构。与MF相关的DEIOSG变化包括酰胺结合、整合素结合和超氧化物生成的NAD(P)H氧化酶活性(图4B)。根据KEGG分析,DEIOSGs在白细胞经内皮迁移、中性粒细胞外细胞陷阱形成、脂质和动脉粥样硬化、糖尿病心肌病、自然杀伤细胞介导的细胞毒作用等通路中特别丰富(图4C、D)。
4. 通过机器学习和蛋白质相互作用网络筛选中心基因
首先,使用LASSO回归算法从DEIOSGs中提取了6个基因(图5A)。其次,SVM-RFE算法确定了6个基因(图5B)。然后,RF算法选择了7个基因(图5C)。随后,通过Venn图将这三个基因重叠,***终得到了两个基因,即CD36和SLC1A3(图5D)。同时,通过PPI网络,作者通过cytoHubba插件获得了一个基因,即ITGB2(图6A,B)。***,通过这两种方法共同确定了3个中心基因,所有这些基因都上调表达。
图5 通过机器学习筛选核心基因
图6 通过蛋白质相互作用网络筛选关键基因
5. 表达中心基因和外部数据集的验证
与正常对照样本相比,作者在GSE30528数据集中发现这些基因在DN中的表达更高(图7A-C)。作者接下来使用另一个数据集确认了这些基因的表达情况,结果显示在GSE104948中,这些基因在DN中的表达也比对照组更强,并且它们在统计学上都具有显著性(图7D-F)。
图7 表达中心基因并验证外部数据集
6. ROC分析
为了探索这3个中心基因的诊断效能,作者进行了ROC曲线分析,其中AUC值大于0.7的中心基因被用作诊断标记。在GSE30528数据集中,CD36的AUC值为0.8215,SLC1A3的AUC值为0.9402,ITGB2的AUC值为0.9060(图8A-C)。
图8 ROC曲线分析
在GSE104948数据集中,CD36的AUC值为1.000(95% CI: 1.000-1.000),SLC1A3的AUC值为0.7937(95% CI: 0.5244-1.000),ITGB2的AUC值为0.9921(95% CI: 0.9669-1.000)(图8D-F)。
7. GSEA分析
根据GSEA的研究结果,CD36高表达组在原发性免疫缺陷和病毒蛋白与细胞因子及细胞因子受体的相互作用方面富集(图9A)。ITGB2高表达组主要集中在柠檬酸循环(TCA循环)和蛋白酶体(图9B)。移植物排斥、原发性免疫缺陷和系统性红斑狼疮都与SLC1A3表达增加有关(图9C)。
图9
8. 临床分析
在DN患者中,相关性分析显示CD36表达与肾小球滤过率(GFR)呈负相关(r = -0.860,p < 0.001),CD36表达与血清肌酐呈正相关(r = 0.887,p < 0.001)(图10A、B)。ITGB2表达与肾小球滤过率(GFR)呈负相关(r = -0.2031,p = 0.6002),但差异无统计学意义,而ITGB2表达与血清肌酐呈正相关(r = 0.5590,p = 0.020)(图10C、D)。
图10 相关性分析
9. 转录调控构建和潜在药物预测
使用JASPAR数据库,***终获得了31个转录因子(TFs),其中有9个转录因子的度≥2,它们是FOXC1,FOXL1,YY1,PPARG,STAT3,HINFP,MAX,USF1,USF2(图11A)。通过TarBase数据库预测了可能的miRNA,其中有10个miRNA的度≥2(图11B)。
图11 调控网络
在DSigDB数据库中筛选了87个潜在的治疗药物,筛选标准为调整后的p值<0.05。
10. 单细胞RNA测序
通过单细胞RNA测序,作者确定了CD36、ITGB2和SLC1A3在12个细胞群中的分布(图12A),其中CD36主要分布在内皮细胞中,而ITGB2和SLC1A3在白细胞中高度表达(图12B-D)。
图12 单核RNA测序
总结
总之,通过将三种机器学习算法与WGCNA分析相结合,本研究确定了三个中心基因,这些基因可能成为DN诊断和治疗的新靶点。
点在看,SCI马上发表
文章内容如有侵权,请联系站长删除。
相关推荐
卷王必看!非肿瘤+WGCNA+单细胞,快...
7+差异分析+WGCNA+PPI网络,学...
探讨m6调控因子与人类癌症之间的因果关系...
单基因泛癌+实验简单验证,要素丰富,没研...
快来看看如何拿下7+干湿结合生信思路!赶...
经典泛癌纯生信思路,适合小白学习!赶紧来...
5+泛癌+免疫,这种生信思路?看这篇就够...
5+单基因泛癌范文式教学,适合小白学习!...
39+!又是一篇惊鸿巨作,教你如何打造高...
5+单细胞+铜死亡+实验,干湿结合生信思...
3+铜死亡+WGCNA,铜死亡为什么打得...
3+单细胞+代谢+WGCNA+机器学习,...
4+m6A+机器学习+分型,要素过多,没...
5+非肿瘤+细胞凋亡相关生信思路,请自行...
又见非肿瘤泛癌分析!学会这个8+非肿瘤+...
热点机制推荐!5+缺氧+铁死亡+分型生信...
非同一般的5+机器学习+分型+免疫的生信...
8+非肿瘤免疫浸润+机器学习+动物验证,...
5+单基因+甲基化+实验分析,强烈推荐!
8+单细胞marker基因生信思路,快来...
双重热点,8+M2巨噬细胞+分型生信思路...
8+双疾病+转录调控+分子对接生信思路,...
简单易懂的7+非肿瘤生信思路,轻松复现!
高分文章秘籍!10+炎症反应相关+分型生...
双热点机制结合!5+铜死亡+铁死亡相关基...
8+机器学习+TRP+体外实验高分思路,...
***6+双癌种+激素代谢相关构建预后模型...
***6+TRP+泛癌分析生信思路,不容错...
想发文章还没思路?5+基于肿瘤免疫的ln...
5+差异+PPI+生存分析鉴定关键基因,...
3+肿瘤+预后模型+甲基化,经典组合机制...
7+线粒体相关基因预后模型+肿瘤微环境+...
非肿瘤纯生信拿下7+!!多种机器学习算法...
内质网应激又玩出了什么新花样?脂质代谢+...
16+sci!!多重免疫组织化学+CIB...
8+肿瘤+多组机器学习+分型,汇集10种...
模范思路!单基因泛癌+实验轻松拿捏sci...
国自然研究热点SUMO化如何开展研究?这...
强势得分套路之一:单基因泛癌+实验验证轻...
不到一个月就接收的文章!!这篇5+铁死亡...
常规生信思路内再创新!泛凋亡+分型+预后...
11+单基因泛癌,转录组+单细胞+机器学...
8+容易拿分的思路!共病+WGCNA+机...
8+单细胞生信发文思路:探讨肿瘤微环境的...
探讨肠道微生物群与癌症之间的因果关系,纯...
8+线粒体自噬+铁死亡+分型+实验,双热...
8+内质网应激+分型+分子对接,结合WG...
5+肿瘤+预后模型+实验,这种文章课题两...
凋亡+自噬+焦亡!三重经典热点联手,预后...
5+单细胞+分子对接生信思路,干湿结合的...
聚焦“泛素化修饰”的生信分析思路,搭配分...
8+非肿瘤分析!WGCNA+机器学习筛选...
8+NETosis+机器学习+表达验证,...
强烈推荐!5+共病+MPL网络生信思路,...
8+机器学习+分型,一文剖析常见的双疾病...
8+肠道微生物群+孟德尔随机化,高分SC...
8+生物信息学+机器学习,机器学习加持生...
5+泛癌+孟德尔随机化生信思路,SCI轻...
8+双硫死亡+分型+预后模型生信思路,既...
6+孟德尔随机化生信思路,简单几张图教你...
5+非肿瘤生信思路经典思路,没有机器学习...
5+基于谷氨酰胺代谢在肿瘤中的分型,结合...
10+非肿瘤!热点基因集+单细胞+多数据...
涨分利器!8+单基因泛癌+甲基化+实验,...
5+m6A/m5C+分型生信思路,研究调...
热点机制推荐!!8+双硫死亡+分型+预后...
紧跟2023国自然热点!8+线粒体自噬+...
9+氧化应激+肠道微生物群+孟德尔随机化...
6+肠道微生物群+孟德尔随机化,孟德尔随...
5+乳酸化修饰+预后模型,肿瘤纯生信分析...
5+肿瘤+预后模型+实验,胶原家族蛋白如...
8+中性粒细胞+分型+单细胞,结合WGC...
6+孟德尔随机化,孟德尔随机化已成大热趋...
5+肿瘤+预后模型,探讨胶原蛋白相关基因...
9+代谢+分型,基于代谢通路对肝癌进行分...
8+结合10种机器学习算法构建模型,可复...
6+单细胞+多组机器学习,搭配热点基因集...
8+干细胞+多组机器学习,结合机器学习与...
8+双疾病联合生信分析搭配机器学习+实验...
墙裂推荐!8+中性粒细胞+预后模型+分子...
11+肠道微生物群+孟德尔随机化,孟德尔...
11+孟德尔随机化+GWAS分析,又是一...
10+家族基因+泛癌+空间转录组生信思路...
8+铜死亡+铁死亡+分型生信思路,多热点...
6+孟德尔随机化,套路简约却不简单,教你...
9+单细胞+代谢+分型,基于代谢通路对肝...
5+m7G+分型+单细胞生信思路,这个热...
10+肿瘤+分型生信思路解析,还没有设计...
6+非肿瘤+Friends分析+实验生信...
8+脂肪酸代谢+预后模型,刚发布一周的高...
想发“肿瘤+分型+微生物”的文章真不难,...
***4+单基因+单细胞生信思路!可借鉴可...
看看RNA结合蛋白+人工神经网络+外部验...
这篇15+的纯干货生信文章教你如何玩转孟...
5+Bluk+单细胞+分型+实验,经典好...
12+单细胞+泛癌生信思路,要素丰富,思...
8+失巢凋亡+分型+风险模型+泛癌生信思...
8+NAM+分型+单细胞生信思路,纯生信...
8+非肿瘤+线粒体+实验生信思路解析,好...
被这篇6+单基因泛癌生信思路的“骚操作”...