生信学习,咨询,代做,请关注公众号:生信风暴。或添加客服微信:ShengxinBoss1

7+非肿瘤生信:单细胞联合bulk seq数据分析思路,很好的模板,快来抄作业!!

生信精讲 管理员 488℃ 0评论
7+非肿瘤生信:单细胞联合bulk seq数据分析思路,很好的模板,快来抄作业!!插图

今天给同学们分享一篇关于非肿瘤+单细胞联合bulk数据的生信文章 “ Expression of Immune Related Genes and Possible Regulatory Mechanisms in Alzheimer’s Disease ”,这篇文章于今年发表在 Frontiers in Immunology 杂志上,影响因子=7.561。本研究通过结合单细胞RNA(scRNA)和bulk-seq测序数据的生信分析,研究了IRG在AD中的表达特征和可能的调控机制。

1.AD中PBMC的scRNA分析

分析了来自GEO数据库的scRNA测序数据集(GSE181279),其中包括36849个PBMC,包括来自AD患者的22775个细胞和来自对照组(NC)的14074个细胞。过滤后,保留了24679个细胞,包括来自AD患者的14033个细胞和来自NC的10646个细胞。每个样本的表达特征如图1A所示。nCount_RNA表示唯一分子标识符(UMI)的数量,与表示基因数量的nFeature_RNA正相关,相关系数为0.92(图1B)。确定了前10个HVG(图1C)。S100A8和S100A9是前两个HVG,它们是在炎症条件下高度表达的small calcium-binding proteins。PCA识别了所有15个P值<0.05的PC,如图1D所示(图1D),使用10个PC识别了8个集群,并列出了每个集群的前10个差异基因(图1E)。

7+非肿瘤生信:单细胞联合bulk seq数据分析思路,很好的模板,快来抄作业!!插图1

图1 AD中PBMC的scRNA分析

根据之前的一项研究,这些集群可以通过标记基因分配给已知的细胞谱系。使用t-SNE分析可视化了八个聚类(图2A)。椭圆标记的NK集群显示AD组中NK集群的百分比降低(图2B)。细胞类型标记基因的表达显示在点阵图(图2C)和小提琴图(图2D)中。每个集群中细胞的数量和比例分别如图2E所示。与NC组相比,AD组的NK集群显着减少(5%对21%),而CD4 T细胞在AD组中显示出增加的趋势(图2F)。在随后的分析中,作者主要关注PBMCs的NK集群。

7+非肿瘤生信:单细胞联合bulk seq数据分析思路,很好的模板,快来抄作业!!插图2

图2 每个集群的标记基因表达

2.AD中PBMC细胞集群的IRG评分

为了研究AD中PBMC的IRG表达特征,基于ImmPort数据库对各集群的EG进行筛选以生成IRG,该数据库总结了已发表研究的IRG,并从PBMC中每个集群的差异基因中获得了212个IRG。AUCell R包用于确定每个细胞系的IRG活性(图3A)。表达更多基因的细胞表现出更高的AUC值,这些细胞主要在NK和DC细胞中,颜色为黄色(图3B)。由于AD组中NK聚类显着减少(图2B,F),作者进一步对来自PMC的NK聚类中的差异基因进行了GO和KEGG分析。这些功能与富集通路主要与抗原处理和免疫应答有关(图3C,D)。

7+非肿瘤生信:单细胞联合bulk seq数据分析思路,很好的模板,快来抄作业!!插图3

图3 AD中PBMC细胞集群的IRG评分

3.来自bulk seq测序数据的AD差异基因

为了研究AD中脑组织的表达特征,分析了包括310名AD患者和157名对照组的散装RNA测序数据集GSE33000,以探索AD大脑中的差异基因,并筛选PBMC和脑组织之间的常见IRG。调整后的 P 值< 0.05 的差异基因和 |logFC|>0.03。此后,在AD大脑中保留了5339个上调和5542个下调差异基因(图4A)。图中显示了top100上调和top100下调差异基因的热图,并且在组内观察到相对一致性(图4B)。有趣的是,与AD的PBMC中NK集群的表达特征类似,AD大脑中差异基因的前10个GO功能通路也集中在免疫反应上(图4C,D)。这些数据表明,AD PBMC中NK集群的差异基因与AD大脑中的差异基因具有相似的GO通路,这表明NK细胞在AD患者大脑中的潜在作用。

7+非肿瘤生信:单细胞联合bulk seq数据分析思路,很好的模板,快来抄作业!!插图4

图4 来自GSE33000数据集的AD差异基因

4.常见IRG和相关监管转录因子

由于来自PBMC的NK集群中GO的差异基因和来自AD大脑的GO的差异基因主要集中在免疫反应上,作者进一步研究了NK cells与AD脑之间IRGs的共同表达特征。在PBMC NK集群和AD大脑中共发现了70个常见的IRG(图5A)。GSE33000中前40个常见IRG的表达主要活跃于来自PBMCs的NK集群(图5B)。

为了研究IRG的转录调控活性,从HumanTFDB(http://bioinfo.life.hust.edu.cn)获得了1665个TF的列表。保留了来自PBMC的AD NK集群中的34个TF和AD大脑中的765个TF。此外,此外,17种常见的TFs在AD周边NK集群和AD大脑中均表达(图5C)。FindAllMarkers 函数是使用默认参数应用的。在这种情况下,仅选择在超过25%的细胞中表达的阳性基因,logFC截止值为0.25。在所有集群中共鉴定出1979个独特的标记基因。对于NK集群,共鉴定出778个标记基因,仅34个基因属于TF。因此,周边NK标记基因、AD脑差异基因和TF数据库交集的TF仅为17个。显示了GSE33000和AD周边NK集群中17个TF的表达式(图5D,E)。13个TF在AD大脑中上调,所有17个TF在NK和NKT细胞中活跃。PPI网络表明,STAT3可能作为IRG转录调控中的中枢基因发挥关键作用(图5F)。

7+非肿瘤生信:单细胞联合bulk seq数据分析思路,很好的模板,快来抄作业!!插图5

图5 常见的IRG和相关转录因子

5.确认NK在AD大脑的浸润情况

确认NK细胞浸润到大脑中。作者从GEO数据库中选择了scRNA测序数据集GSE142853,该数据库对来自3XTg-AD小鼠大脑的分选NK细胞进行了测序。共有3250个细胞,包括来自AD小鼠的1634个细胞和来自NC小鼠的1616个细胞。生成了十个集群(图6A)。AD组的聚类6百分比高于NC组(4.6%对2.9%)(图6B)。cytotoxic molecule (Cstd), pro-inflammatory chemokines (Ccl3, Ccl4), adhesion molecules (Icam1)和NK cell activation molecules (Tbx21, Nfatc1, Nfkbia, and Klra9) 在集群6中高度表达(图6C,D)。此外,使用SingleR和Celldex R包对这些聚类进行注释,并使用分数计算预测准确性。SingleR是一种用于scRNA测序数据的自动注释方法。SingleR提供具有已知细胞类型标签的样本的参考表达数据集,并且可以根据与参考的相似性来标记新细胞。celldex R包提供了一种简单的方法来应用SingleR包来注释scRNA测序数据。分数越高表示预测越准确,NK细胞被注释为最高分。结果表明,GSE142853的10个集群中有9个被注释为NK细胞,而一个集群被注释为小胶质细胞。NK和小胶质细胞注释都标记为黄色,表示更高的精度(图6E)。tSNE图显示3XTg-AD小鼠大脑中小胶质细胞和大多数NK细胞的比例非常小(图6F)。综上所述,GSE142853数据集证实了AD大脑中NK细胞的发生,一些浸润的循环NK细胞在AD大脑中被激活。

7+非肿瘤生信:单细胞联合bulk seq数据分析思路,很好的模板,快来抄作业!!插图6

图6 AD脑中NK细胞的scRNA分析

小结

在这项研究中,作者提出外周NK细胞可能渗透到大脑中,并使用结合scRNA和bulk seq数据的生物信息学分析,探讨AD中的神经炎症变化。此外,STAT3可能参与IRG的转录调控,浸润和NK细胞的活化。对非肿瘤+单细胞联合bulk数据思路感兴趣的老师,也可以选择其他热点基因集来做(本文主要做的免疫调控相关),欢迎扫码咨询。

生信分析定制服务

请扫描下方二维码

7+非肿瘤生信:单细胞联合bulk seq数据分析思路,很好的模板,快来抄作业!!插图7
或添加微信沟通:ShengxinBoss1
往期回顾:
最强攻略1:史上最全单细胞数据库汇总解读
最强攻略2:史上最全非编码RNA数据库汇总解读
最强攻略3:史上最全外泌体数据库汇总解读
最强攻略4:史上最全甲基化表观调控数据库汇总解读
最强攻略5:史上最全转录调控数据库汇总解读
最强攻略6:史上最全网络药理学数据库汇总解读

7+非肿瘤生信:单细胞联合bulk seq数据分析思路,很好的模板,快来抄作业!!插图8

转载请注明:智汇基因 » 7+非肿瘤生信:单细胞联合bulk seq数据分析思路,很好的模板,快来抄作业!!

喜欢 (0)
发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址