2023-09-26 14:43:50
浏览:
导语
今天给同学们分享一篇单细胞测序结合Bulk测序构建预后模型的生信文章“Comprehensive analysis of scRNA-Seq and bulk RNA-Seq reveals dynamic changes in the tumor immune microenvironment of bladder cancer and establishes a prognostic model”,这篇文章于2023年3月27日发表在J Transl Med期刊上,影响因子为8.44。
膀胱癌(BLCA)的预后管理仍然是临床医生面临的一大挑战。***近,批量RNA-seq测序数据已被用作许多癌症的预后标志物,但不能准确检测肿瘤细胞中的关键细胞和分子功能。在目前的研究中,将大量RNA-seq和单细胞RNA测序(scRNA-seq)数据结合起来,构建BLCA的预后模型。
1.BLCA细胞亚型的鉴定
本研究的总体示意图如下所示:首先,作者过滤了不合格的细胞,并产生了13,490个关键细胞用于后续分析(图1A). 对关键细胞进行了基因方差分析,作者发现2000个基因变化很大(图1B)。1对三个单细胞样品进行PCA(图1C),并将单细胞样品分散并分布,得出逻辑结果。同时,在PCA中,作者还选择了p值<20.0的05个主成分(PC)进行后续分析(图1D)。1然后,使用umap算法将关键细胞分类为19个独立的细胞集群(图1E,F).通过“singleR”包、CellMarker数据库和参考文献[17]寻找标记基因,对不同的集群进行注释,得到七个细胞,即B细胞、内皮细胞、T细胞、单核细胞、成纤维细胞、平滑肌细胞和上皮细胞(图1G)。通过气泡图可视化每种细胞类型的重要标记基因的表达(图1H)。散点图显示了标记基因在不同细胞类型中的表达。此外,作者探索了不同细胞类型中癌症相关成纤维细胞(CAFs)的标记基因(PDPN,THY1,PDGFRB,PDGFRA和POSTN)的表达,发现所有标记基因在成纤维细胞中均高表达。可以总结每个已鉴定的标记基因在特定细胞中的高表达,进一步说明了细胞类型测定的可靠性。
图1.单细胞RNA-seq数据鉴定细胞集群,揭示BLCA肿瘤中的高细胞异质性
2.关键细胞鉴定及其标记基因功能富集分析
通过使用FindAllMars和Wilcoxon测试,获得了474个显着不同的标记基因进行鉴定。通过计算每个细胞显著不同的标记基因的ssGSEA评分,作者发现所有七个细胞在BLCA中都显着下调,因此七个细胞被认为是后续分析的关键细胞(图2A)。2关键细胞的标记基因富集了GO和KEGG功能(图2B-E)。作者注意到,除平滑肌细胞外,所有六种细胞类型的标记基因都与细胞活化的正向调节有关,包括淋巴细胞和白细胞(图2B)。2此外,单核细胞和T细胞的标记基因与细胞因子-细胞因子受体相互作用有关。B细胞的标记基因与p53信号通路相连。内皮细胞、上皮细胞和平滑肌细胞的标记基因与局灶粘附和ECM-受体相互作用有关(图2E). 对所有注释的细胞分别进行伪时间分析,以使用 Monocle 2 算法探索其分化方向。结果表明,BLCA细胞逐渐遵循3个分化方向(图3A)。上皮细胞比其他细胞分化更早,分化成两个分支,其中一个由内皮细胞主导,另一个由平滑肌细胞、成纤维细胞主导(图3C)。此外,作者推断了细胞-细胞通讯网络,以根据特定的途径和配体受体预测细胞间通讯。配体-受体对数量的热图显示,成纤维细胞、T细胞、单核细胞、内皮细胞和上皮细胞的细胞通讯发生的频率更高(图)。3具体而言,内皮细胞与上皮细胞之间、内皮细胞与成纤维细胞之间以及内皮细胞与T细胞之间相互作用的频率和强度较高(图3D)。此外,B细胞与其他细胞的相互作用相对罕见。
图2.基于7个关键细胞的标记基因功能富集分析
图3.具有不同分化模式的三个BLCA细胞亚群的轨迹和细胞间通信分析
3.Bulk-RNA测序数据中DEG的鉴定和功能富集分析
共获得1556个显著DEG,其中上调基因708个,下调基因848个(图4A,B)。GO分析表明,DEGs主要富集于细胞分裂、细胞器裂变、有丝分裂核分裂等细胞周期相关功能(图4C-E)。KEGG富集结果表明,PI3K-Akt信号通路、MAPK信号通路、贴壁点和细胞周期是DEGs的富集通路(图4F)。
图4.BLCA患者和对照组之间DEG的鉴定和功能富集分析
4.识别与BLCA相关的关键模块
WGCNA用于鉴定参与BLCA发育和进展的基因。在共表达网络构建过程中,当无标度拓扑的拟合指数达到5.0时,软阈值功率β为85(图5A,B).将MEDissThres设置为0.2以合并动态剪切树算法分析的类似模块,合并后,***终共有10个模块可用(图5C,D)。.基于相关系数和P值,作者选择MEbrown作为关键模块(包含2334个基因)(图5E)。关键模块基因详见图5F,具有临床相关性的棕色模块的散点图。
图5. BLCA相关基因由WGCNA筛选
5.基于3个特征基因的预后模型的构建与验证
使用Ven图证明了细胞亚型的标记基因,BLCA模块基因和DEG的交叉,共取123个交叉基因并定义为候选基因(图6A)。然后,利用TCGA-BLCA中的训练集进行单因素Cox回归分析,10个基因与OS显著相关(图6B)。接下来,使用LASSO算法筛选基因以进行模型构建。结果如图6C所示,以***小的交叉验证错误筛选3个特征基因:PCOLCE2,MAP1B和ELN。风险评分 = 0.09876179 × PCOLCE2 + 0.04635731 × MAP1B + 0.01686333 × ELN。根据临界值=0.15,患者分为高风险组和低风险组(图6D)。Kaplan-Meier分析显示,高风险评分患者的OS和无病生存期(DFS)明显低于低风险评分的患者(图6E)。为了进一步评估风险模型的有效性,计算了OS的ROC曲线,1、2、3、4和5年的AUC值均大于0.59,表明风险模型的有效性更好(图6F)。作者还在内部验证集和外部验证集中对模型进行了功能验证。GSE13507和GSE32548,结果表明该模型具有准确性。总之,作者的预后模型在BLCA中显示出出色的预测效率。
图6.在TCGA队列中构建风险特征
6.分析风险评分和不同的临床特征
为分析风险评分表达与临床特征的相关性,根据不同组别的临床特征分别比较患者风险评分的差异。结果表明,风险评分在N期、T期和OS状态上存在显著差异(图7B)。风险模型的热图和临床特征如图7A所示。临床特征分层分析显示,临床M0期,男性,III-IV期,T1-T2期,年龄>60岁和TMB_hight在高危和低风险组中生存率存在显着差异。综上所述,作者基于3个特征基因的预后模型具有优异的预后价值。
图7.风险评分与临床特征的相关性分析
7.独立预后因素的筛查和列线图的构建
为了筛选独立的预后因素,对临床特征和风险评分进行了单变量和多变量Cox分析。作者发现RiskScore和Stage是患者的独立预后因素(图8A,B)。列线图模型中包括两个独立的预后因素(图8C)。此外,校准曲线表明该模型具有较高的预测效果(图8D)。因此,作者的结果表明,风险评分是一个独立的预后因素,列线图对预测BLCA患者的OS具有较高的预测效果。
图8.列线图模型基于单变量和多元cox回归分析构建
8.高危和低危人群之间的 GSEA病
为了分析高风险和低风险亚组对癌症进展的影响,作者进行了GSEA以确定两组之间***重要的富集途径。结果表明,高危人群在免疫应答中涉及的细胞活化和体液免疫应答等免疫过程显著富集(图9A)。KEGG表明,趋化因子信号通路、补体和凝血级联反应等通路在高危组中富集,低危组富集吞噬体相关通路(图9B)。作者还使用GSVA分析了高风险和低风险组的所有基因。结果表明,高表达组在肌生成、MYC靶点V2、早期雌激素反应、胰腺β细胞、DNA修复、MYC靶点V1、顶端连接、KRAS信号通路、过氧化物酶体、IL6 JAK STAT3和血管生成MYC靶点的标记条目中被激活,而低表达组在缺氧、脂肪生成、 血红素代谢、胆汁酸代谢、干扰素α反应途径、凝血等标志物条目(图9C,D)。
图9.高危和低危人群之间的生物学特征
9.评估BLCA免疫治疗的可能性
使用ssGSEA估计不同风险组中28个免疫细胞的浸润评分。结果表明,除天然免疫细胞外,25种免疫细胞的浸润水平差异具有统计学意义。killers.cell,Monocyte和T.helper.cell(图10A)。皮尔逊相关结果显示,预后基因和风险评分均与免疫细胞浸润显著相关(图10B)。16个GEP基因(炎症基因)和4个免疫检查点在高危和低危组中差异显著(图10C)。16个差异GEP基因和排名前4的途径(T细胞活化,T细胞活化调节,白细胞细胞间粘附调节,白细胞细胞间细胞粘附)的相互作用网络如图10D所示,它强调了GEP基因与这些途径之间的密切联系。差异GEP基因的PPI网络显示了每个GEP基因之间的联系(图10E)。PD-1、PD-L1、CTLA-4和TIGIT在高危和低危组中是不同的(图10F)。通过SubMap,在免疫治疗队列(Roh队列)中,对ICB进行高危和低风险组的反应进行评估。作者发现CTLA-4免疫位点在Roh队列中是敏感的(图10G)。作者发现BLCA患者主要以错义突变和SNPs为主(图11A)。高危组和低危组突变结果显示,高危组和低危组多数突变类型为错义突变。高危组突变比例高于低危组,高危组突变负荷指数TMB指数总体高于低危组(图11B)。***重要的是,作者的结果表明免疫疗法在BLCA中具有发展潜力。
图10.高低危人群肿瘤免疫微环境分析
图11.BLCA中的突变景观分析
10.高危和低危人群药敏分析
从GDSC数据库中,作者发现12种药物与风险评分呈负相关(R < -0.4和p < 0.05),图12A中仅显示前7种药物。此外,作者探讨了12种药物的靶点和途径,其中5种没有相应的数据。12种化疗药物在高危组和低危组间差异显著(图12B)。在CTRP数据库中,药物星形孢素,CCT036477,XL765,TGX.221和舒尼替尼与风险评分的负相关性***强(图12C)。同时,5种药物的AUC值在高危组和低危组均存在显著差异(图12D)。总之,这些药物可能对BLCA的治疗有希望。
图12.基于风险模型筛选BLCA治疗药物
总结
通过整合scRNA-seq和批量RNA-seq数据,作者进行了多种机器学习方法,并建立了一种新的BLCA患者OS预测预后模型,可用于预测BLCA患者的生存概率。此外,风险评分是一个有希望的独立预后因素,与免疫微环境和临床病理特征密切相关。总体而言,这项研究可以作为BLCA疗效的可靠预测指标,为未来BLCA的靶向治疗开辟了新的途径。对这篇文章的思路感兴趣的老师,欢迎扫码咨询!
生信分析定制服务
请扫描下方二维码
点在看,SCI马上发表
文章内容如有侵权,请联系站长删除。
相关推荐
卷王必看!非肿瘤+WGCNA+单细胞,快...
7+差异分析+WGCNA+PPI网络,学...
探讨m6调控因子与人类癌症之间的因果关系...
单基因泛癌+实验简单验证,要素丰富,没研...
快来看看如何拿下7+干湿结合生信思路!赶...
经典泛癌纯生信思路,适合小白学习!赶紧来...
5+泛癌+免疫,这种生信思路?看这篇就够...
5+单基因泛癌范文式教学,适合小白学习!...
39+!又是一篇惊鸿巨作,教你如何打造高...
5+单细胞+铜死亡+实验,干湿结合生信思...
3+铜死亡+WGCNA,铜死亡为什么打得...
3+单细胞+代谢+WGCNA+机器学习,...
4+m6A+机器学习+分型,要素过多,没...
5+非肿瘤+细胞凋亡相关生信思路,请自行...
又见非肿瘤泛癌分析!学会这个8+非肿瘤+...
热点机制推荐!5+缺氧+铁死亡+分型生信...
非同一般的5+机器学习+分型+免疫的生信...
8+非肿瘤免疫浸润+机器学习+动物验证,...
5+单基因+甲基化+实验分析,强烈推荐!
8+单细胞marker基因生信思路,快来...
双重热点,8+M2巨噬细胞+分型生信思路...
8+双疾病+转录调控+分子对接生信思路,...
简单易懂的7+非肿瘤生信思路,轻松复现!
高分文章秘籍!10+炎症反应相关+分型生...
双热点机制结合!5+铜死亡+铁死亡相关基...
8+机器学习+TRP+体外实验高分思路,...
***6+双癌种+激素代谢相关构建预后模型...
***6+TRP+泛癌分析生信思路,不容错...
想发文章还没思路?5+基于肿瘤免疫的ln...
5+差异+PPI+生存分析鉴定关键基因,...
3+肿瘤+预后模型+甲基化,经典组合机制...
7+线粒体相关基因预后模型+肿瘤微环境+...
非肿瘤纯生信拿下7+!!多种机器学习算法...
内质网应激又玩出了什么新花样?脂质代谢+...
16+sci!!多重免疫组织化学+CIB...
8+肿瘤+多组机器学习+分型,汇集10种...
模范思路!单基因泛癌+实验轻松拿捏sci...
国自然研究热点SUMO化如何开展研究?这...
强势得分套路之一:单基因泛癌+实验验证轻...
不到一个月就接收的文章!!这篇5+铁死亡...
常规生信思路内再创新!泛凋亡+分型+预后...
11+单基因泛癌,转录组+单细胞+机器学...
8+容易拿分的思路!共病+WGCNA+机...
8+单细胞生信发文思路:探讨肿瘤微环境的...
探讨肠道微生物群与癌症之间的因果关系,纯...
8+线粒体自噬+铁死亡+分型+实验,双热...
8+内质网应激+分型+分子对接,结合WG...
5+肿瘤+预后模型+实验,这种文章课题两...
凋亡+自噬+焦亡!三重经典热点联手,预后...
5+单细胞+分子对接生信思路,干湿结合的...
聚焦“泛素化修饰”的生信分析思路,搭配分...
8+非肿瘤分析!WGCNA+机器学习筛选...
8+NETosis+机器学习+表达验证,...
强烈推荐!5+共病+MPL网络生信思路,...
8+机器学习+分型,一文剖析常见的双疾病...
8+肠道微生物群+孟德尔随机化,高分SC...
8+生物信息学+机器学习,机器学习加持生...
5+泛癌+孟德尔随机化生信思路,SCI轻...
8+双硫死亡+分型+预后模型生信思路,既...
6+孟德尔随机化生信思路,简单几张图教你...
5+非肿瘤生信思路经典思路,没有机器学习...
5+基于谷氨酰胺代谢在肿瘤中的分型,结合...
10+非肿瘤!热点基因集+单细胞+多数据...
涨分利器!8+单基因泛癌+甲基化+实验,...
5+m6A/m5C+分型生信思路,研究调...
热点机制推荐!!8+双硫死亡+分型+预后...
紧跟2023国自然热点!8+线粒体自噬+...
9+氧化应激+肠道微生物群+孟德尔随机化...
6+肠道微生物群+孟德尔随机化,孟德尔随...
5+乳酸化修饰+预后模型,肿瘤纯生信分析...
5+肿瘤+预后模型+实验,胶原家族蛋白如...
8+中性粒细胞+分型+单细胞,结合WGC...
6+孟德尔随机化,孟德尔随机化已成大热趋...
5+肿瘤+预后模型,探讨胶原蛋白相关基因...
9+代谢+分型,基于代谢通路对肝癌进行分...
8+结合10种机器学习算法构建模型,可复...
6+单细胞+多组机器学习,搭配热点基因集...
8+干细胞+多组机器学习,结合机器学习与...
8+双疾病联合生信分析搭配机器学习+实验...
墙裂推荐!8+中性粒细胞+预后模型+分子...
11+肠道微生物群+孟德尔随机化,孟德尔...
11+孟德尔随机化+GWAS分析,又是一...
10+家族基因+泛癌+空间转录组生信思路...
8+铜死亡+铁死亡+分型生信思路,多热点...
6+孟德尔随机化,套路简约却不简单,教你...
9+单细胞+代谢+分型,基于代谢通路对肝...
5+m7G+分型+单细胞生信思路,这个热...
10+肿瘤+分型生信思路解析,还没有设计...
6+非肿瘤+Friends分析+实验生信...
8+脂肪酸代谢+预后模型,刚发布一周的高...
想发“肿瘤+分型+微生物”的文章真不难,...
***4+单基因+单细胞生信思路!可借鉴可...
看看RNA结合蛋白+人工神经网络+外部验...
这篇15+的纯干货生信文章教你如何玩转孟...
5+Bluk+单细胞+分型+实验,经典好...
12+单细胞+泛癌生信思路,要素丰富,思...
8+失巢凋亡+分型+风险模型+泛癌生信思...
8+NAM+分型+单细胞生信思路,纯生信...
8+非肿瘤+线粒体+实验生信思路解析,好...
被这篇6+单基因泛癌生信思路的“骚操作”...