生信学习,咨询,代做,请关注公众号:生信风暴。或添加客服微信:ShengxinBoss1

这样运用生信分析新冠肺炎的方法你见过吗,8.99+SCI也太简单了吧?

基因组分析 管理员 236℃ 0评论
这样运用生信分析新冠肺炎的方法你见过吗,8.99+SCI也太简单了吧?插图

今天给同学们分享一篇关于新冠肺炎PBMC中的DEGS关键基因模块的生信文章 “Bioinformatics and machine learning approach identifies potential drug targets and pathways in COVID-19”,这篇文章于今年4月份发表在 Brief Bioinform 杂志上,影响因子IF=8.990。在本研究中,作者对新冠肺炎PBMC中的DEGS关键基因模块(通过WGCNA鉴定)进行了系统生物学研究。根据基因模块(MMHub)和蛋白质互作网络(PPIHub),分别从关键基因模块中筛选出关键基因。然后,作者采用机器学习的方法来确定这些关键基因的有效性。最后,作者确定了几种候选药物,将这些枢纽基因作为治疗靶点。作者的结果可能为新冠肺炎的发病机制和潜在的分子靶点提供新的见解。

Bioinformatics and machine learning approach identifies potential drug targets and pathways in COVID-19

生物信息学和机器学习方法确定新冠肺炎中潜在的药物靶点和通路

1. DEGS识别

数据集(GSE152418)包含60683个基因,17个COVID-19和17个健康对照样本。在排除低表达基因后,作者选择了20251个基因进行差异分析。作者从这个数据集中得到1520个差异基因(其中有1299个上调和221个下调,p < 0.05),用于进一步的WGCNA分析。作者从COVID-19样品中的验证集(CRA002390)中筛选出了1733个差异基因(1139个上调和594个下调)。

2. 加权基因共表达网络与模块分析

用GSE152418数据集中的16个COVID-19样品进行WGCNA分析。这些样本的聚类树状图在图2A中可视化。作者选择了优化的软阈值为6(图2B)。然后利用这个软阈值功率构建共表达网络,获得10个共表达模块,即黑色、蓝色、棕色、绿色、灰色、洋红色、粉红色、红色、绿松石和黄色。这10个模块的聚类树状图如图2D所示。作者分别观察到黑色,蓝色,棕色,绿色,品红色,粉红色,红色,绿松石和黄色模块中分布含有63,273,259,95,46,58,77,426和198个基因。其中灰色模块包含25个非共表达的基因。图2C显示了具有这九个模块的所有基因的网络热图。这些共表达模块之间的相互作用,用模块eigengene树状图和eigengene网络热图呈现(图2E)。在模块保存分析中,作者使用了GSE152418以17个健康控制样本作为测试集的数据集。通过保守性分析,作者确定绿松石,蓝色,棕色和粉红色模块最稳定。其余模块被认为是不稳定的(图2G)。图2F显示绿松石,蓝色,棕色和粉红色模块在所有模块中保守性最好的。

这样运用生信分析新冠肺炎的方法你见过吗,8.99+SCI也太简单了吧?插图1

图2.WGCNA共表达模块的构建

3. 四个模块基因的富集分析

为了进一步了解所选四个模块的基因,在该研究中进行了GO和KEGG通路富集分析。重要的生物过程(BP)主要富集于免疫反应,分裂和裂变相关的BP(图3A)。重要的分子功能(MF)主要富含结合相关功能(图3B)。四个模块中最重要的细胞组分(CC)富集在几个细胞区室中(图3C)。四个模块基因的KEGG分析显示,基因在几种通路中显着富集,例如感染相关通路(即:单纯疱疹病毒1感染,人乳头瘤病毒感染),自身免疫疾病相关(即:系统性红斑狼疮,类风湿性关节炎,i型糖尿病),ECM受体相互作用,IL-17信号通路和p53信号通路(图3D)。有趣的是,酒精中毒和系统性红斑狼疮显着富集了这四个模块的基因。

这样运用生信分析新冠肺炎的方法你见过吗,8.99+SCI也太简单了吧?插图2

图3.GO和KEGG四个关键模块的富集分析

4. 关键基因的鉴定和验证

作者使用模块连接阈值标准,在具有高连通性的绿松石,蓝色,棕色和粉红色模块中鉴定了422个关键基因(MMhub> 0.8)。 此外,作者通过具有连接度的STRING数据库为PPI中的四个模块确定了240个关键基因,本研究进一步分析了CRA002390验证集,以确认这些关键基因作为COVID-19候选生物标志物基因的作用。作者在MMhub,PPIhub和CRA002390中鉴定了52个常见基因(图5A)。这些常见基因在COVID-19和健康对照样品上的表达值显示在图5C中。就COVID-19感染的样品和对照样品而言,热图显示了图5B中这52个关键基因的两个主要簇。

这样运用生信分析新冠肺炎的方法你见过吗,8.99+SCI也太简单了吧?插图3

图5.Hub基因表达谱

5.基于分类算法的关键基因性能评价

为了研究在两种不同分析(即:MMhub和PPIhub)中鉴定的hub DEGs的有效性,在该研究中执行了五种流行的分类算法。根据MMHub基因和PPIhub基因的数据分别计算了性能指标。作者使用五倍交叉验证执行了20次这些计算,基于测试精度和AUC的五个机器学习分类器的箱线图如图4所示。作者观察到,支持向量比其他四种分类器(RF 0.955、PLDA 0.821、NBLDA 0.956和voomDLDA 0.988)对具有MMHub基因的数据集提供更高的准确率0.996。作者还观察到,对于具有PPIhub基因的数据集,voomDLDA比其他四个分类器(SVM 0.986,RF 0.981,PLDA 0.768和NBLDA 0.976)提供更高的0.999精度。

这样运用生信分析新冠肺炎的方法你见过吗,8.99+SCI也太简单了吧?插图4

图4.基于五分类器性能的接收器操作曲线ROC图

6. P‌PI网络分析鉴定关键基因

通过Cytoscape中的STRING构建了52个常见基因的PPI网络。图6A显示了这些基因之间的网络相互作用,并基于更高程度的连通性鉴定了10个关键基因(PLK1AURKB、AURKA、CDK1、CDC20、KIF11、CCNB1、KIF2C、DTL和CDC6)

7.已鉴定关键基因的转录调控因子

作者从TFs基因相互作用网络中确定了FOXC1、GATA2、YY1、E2F1、NFIC、FOXL1和SRF枢纽TFs(图6B)。从miRNAs基因相互作用网络即“mir-16-5p”、“mir-124-3p”、“mir-34a-5p”、“mir-147a”、“mir-1-3p”、“mir-129-2-3p”、“mir-107”和“mir-195-5p”中检测到重要的关键miRNAs(图6C)。

这样运用生信分析新冠肺炎的方法你见过吗,8.99+SCI也太简单了吧?插图5

图6.PPI网络构建

 

小结

本研究旨在确定与正常血细胞相比,SARS-CoV-2在血细胞中改变的关键基因和分子通路。通过模块保存分析,检测到四个关键模块。根据模块统计和PPI网络,从422和240个枢纽基因中筛选出52个常见基因,并从52个基因的PPI网络中鉴定出10个枢纽基因。作者的结果可能为新冠肺炎的发病机制提供新的见解,并为新的介入治疗提供潜在的分子靶点。对该思路感兴趣的老师,欢迎扫码咨询

这样运用生信分析新冠肺炎的方法你见过吗,8.99+SCI也太简单了吧?插图6
扫码或添加微信沟通:ShengxinBoss1
往期回顾:
最强攻略1:史上最全单细胞数据库汇总解读
最强攻略2:史上最全非编码RNA数据库汇总解读
最强攻略3:史上最全外泌体数据库汇总解读
最强攻略4:史上最全甲基化表观调控数据库汇总解读
最强攻略5:史上最全转录调控数据库汇总解读
最强攻略6:史上最全网络药理学数据库汇总解读

这样运用生信分析新冠肺炎的方法你见过吗,8.99+SCI也太简单了吧?插图7

转载请注明:智汇基因 » 这样运用生信分析新冠肺炎的方法你见过吗,8.99+SCI也太简单了吧?

喜欢 (0)
发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址