图片展示

5+肿瘤+预后模型,探讨胶原蛋白相关基因在LUAD中的预后价值,可复现!!

2023-10-16 14:41:00

浏览:

导语


今天给同学们分享一篇肿瘤+预后模型的生信文章“A five-collagen-based risk model in lung adenocarcinoma: prognostic significance and immune landscape”,这篇文章于2023年7月5日发表在Front Oncol期刊上,影响因子为5.738。


作为肿瘤微环境(TME)的一部分,胶原蛋白在癌症纤维化的形成中起着重要作用。然而,胶原家族在肺腺癌(LUAD)中的表达谱和临床特征尚不清楚。本工作的目的是研究LUAD中胶原家族基因的表达模式,并开发基于胶原家族的预测信号。


1. 胶原蛋白风险模型的构建

从TCGA数据库下载了总共598个LUAD样本的表达谱,以确定与预后相关的胶原家族蛋白,并找出影响LUAD起始和进展的重要因素。本研究的标准是FDR<0.01和|log2(倍数变化)|>1。44种胶原家族蛋白被纳入TCGA-LUAD转录组数据中。根据筛选标准,共有5542个基因,包括26个胶原家族成员,在LUAD患者中表达显著不同。胶原家族中26个DEG的表达模式和特征如火山图和热图所示,其中5个胶原家族基因下调,21个胶原家族蛋白上调(图1A、B)。根据单变量Cox回归分析,胶原家族中的26个DEG中有6个与OS显著相关(图1C)。通过LASSO-Cox回归分析,对这些基因进行了进一步的检测。通过套索分析找出了5个***重要的基因,即COL1A1、COL4A3、COL5A1、COL11A1和COL22A1(图1D、E)。根据多变量Cox分析结果,COL4A3和COL22A1被证明是独立的预后风险变量(P<0.05)(图1F)。

图1 TCGA-LUAD预后胶原家族基因的鉴定及胶原风险模型的构建

 

2. 胶原风险模型的特点及预测意义

根据风险评分的中值,将所有LUAD患者分为高风险组和低风险组。散点图用于显示风险评分的分布以及风险评分与生存状态之间的关系,显示高危人群的死亡率较高(图2A)。在LUAD中,图2B比较了高风险组和低风险组胶原家族的五个基因的表达。虽然COL4A3的表达在低风险组中较高,但COL5A1、COL1A1、COL1A 2和COL22A的表达在高风险组中上调。使用K-M生存分析比较高危组和低危组之间的OS。根据研究结果,高危组患者的预后更差(P=0.0019)(图2C)。为了更好地探讨胶原风险评分在LUAD不同病理阶段的预后意义。作者将LUAD分为早期和晚期,I和II阶段为早期,III和IV阶段为晚期。在早期阶段,作者发现胶原蛋白风险评分是OS的可靠指标,高风险组患者的预后明显低于低风险组。(p=0.01)(图2D)。在另一个亚组分析中,高危组患者在晚期的OS比低危组短,但差异无统计学意义(P=0.05)(图2E)。

图2 胶原蛋白风险模型的特征及其预测意义


3. 胶原风险模型的生存分析

首先,作者分析了不同临床特征(包括性别、病理分期和TNM分期)患者的胶原风险评分分布。作者发现,N分期和病理分期较高的患者风险评分较高(N1 vs N0,p<0.05;N2-3 vs N0;II期vs I期,p<0.01;III/IV期vs I阶段,p<0.01)。男性和女性患者之间,或M期或T期患者之间的风险评分没有显著差异(p>0.05)(图3A)。

图3 胶原蛋白风险模型的生存分析


其次,根据胶原蛋白风险评分的中位数,将五个GEO数据集中的患者分为高风险组和低风险组。作者使用五个GEO队列作为外部验证集,评估了胶原蛋白风险评分在预测OS方面的性能。与TCGA队列生存分析一样,在验证数据集中,低风险组患者的生存期更长(P=0.0051,GSE11969;P<0.001,GSE72094;P=0.0062,GSE12313;P=0.002,GSE31210;P=0.02,GSE30219)(图3B-F)。高风险组的RFS显著低于低风险组,这表明胶原蛋白风险评分是LUAD患者RFS的良好预测指标。接下来,为了进一步证明该模型在预测癌症预后方面的优越性,使用ROC曲线评估Collagen-Risk模型的能力,在六个数据集中AUC范围为0.60至0.74(图3G-L)。一般来说,时间依赖性AUC表明,在TCGA和GEO数据集中,胶原蛋白风险评分在预测LUAD患者的OS方面具有相当大的价值。


4. 胶原风险模型对LUAD的诊断价值

使用单变量和多变量Cox回归分析研究胶原风险模型对预后的预测能力。作者通过TCGA和Geo数据集中的单变量和多变量Cox回归分析来评估胶原风险模型的预后意义。单变量Cox回归分析结果显示,TCGA LUAD队列和5个GEO队列中的胶原风险评分均与OS显著相关(TCGA,HR=2.115,95%CI=1.602-2.792,P<0.001;GSE11969,HR=2.432,95%CI=1.376-4.300,P=0.002;GSE13213,HR=2.514,95%CI=1.413-4.471,P=0.002,GSE30219,HR=25.441,95%CI=1.488-4.342,P=0.001;GSE31210,HR=2.174,95%CI=1.6922.901,P<0.001,GSE372094,HR=2.022,95%CI=1.536-2.63,P<0.001)(图4A)。多变量Cox回归分析证明,在TCGA LUAD队列和四个GEO队列中,胶原风险评分是OS的重要预测指标(P<0.001,HR=2.49,95%CI=1.618-3.822,TCGA;P=0.013,HR=2.134,95%CI=1.174-3.880,GSE11969;P=0.014,HR=2.339,95%CI=1.18-4.604,GSE13213;P=0.002,HR=24.79,95%CI=1.411-4.356,GSE30219;P<0.001,HR=2.347,95%CI=1.709-3.23,GSE72094)(图4A)。同时,作者通过单变量和多变量Cox回归分析,分析了不同数据集中临床特征的预后价值。在TCGA数据集的测试集中,年龄、N分期和风险评分被发现是预后的独立因素。在验证数据集中,在单变量和多变量分析中,年龄和风险评分始终被确定为预后的独立预测因素。此外,单变量和多变量Cox回归分析表明,胶原风险评分是RFS的独立预后因素(图S1D)。通过分析TCGA和5个GEO队列的预后结果,进行了一项荟萃分析,以确定胶原风险评分与LUAD患者OS和RFS的相关性和预后意义。总体HR证实,胶原风险评分是LUAD患者OS的风险因素(总体HR=2.05,95%CI=1.68-2.49,P<0.001)(图4B)。同样,胶原风险评分是影响两个GEO队列中RFS的一个风险因素(总体HR=3.10,95%CI=1.96-4.91,P<0.001)。

图4 胶原风险模型对LUAD的诊断价值


单变量和多变量Cox分析结果显示,胶原风险评分与LUAD患者的OS和RFS密切相关。然后,将胶原蛋白风险评分与年龄、性别、T分期、N分期、M分期和肿瘤分期等临床特征相结合,构建列线图,以预测患者的1年、3年和5年生存概率(图4C)。列线图的校准曲线显示,预测的生存率与1年、3年和5年的实际生存率密切相关(图4D-F)。


5. 与胶原风险模型相关的生物学机制

作者已经证明胶原风险模型是LUAD患者的一个重要预后因素,作者将进一步研究其对预后的影响机制。使用Pearson相关分析筛选出胶原蛋白特征相关基因(Pearson|R|>0.5,p<0.05)。结果表明,59个基因与胶原蛋白风险模型显著相关,其中31个基因呈正相关,28个基因负相关(图5A)。然后将这些胶原特征相关基因用于GO和KEGG途径的富集测试。GO-生物过程(BP)分析显示,这些基因主要富集在细胞外基质组织、骨骼和心血管系统发育、心血管系统发育中(图5B)。细胞组成(CC)的变化主要集中在胶原三聚体、细胞外区域和细胞外基质中(图5C)。分子功能(MF)的变化集中在蛋白质结合、受体和蛋白酶活性以及细胞外基质结构上(图5D)。KEGG信号通路分析显示,基因主要参与ECM-受体相互作用、癌症通路、PI3K-Akts和AGE-RAGE信号传导(图5E)。TCGA-LUAD患者的转录组数据用于通过GSEA分析确定胶原风险评分相关的信号转导途径。KEGG分析显示,CELL_CYCLE和p53_SIGNALING_PATH WAY在高危组中富集(图5F)。标志性分析表明,EPITHELIAL_MESSENCHYMAL_TRANSITION、UNFOLDED_PROTEIN_RESPONSE、G2M_CHECKPOINT、MITTIC_SPINDLE、GLYCOLYSIS、MTORC1_SSIGNALING、E2F_TARGETS、缺氧和血管生成主要在高危人群中富集(图5G)。

图5 胶原风险模型的生物学机制


6. 胶原蛋白特征和免疫特征之间的关系

在本研究中,使用CIBERSORT算法计算LUAD患者中22个浸润性免疫细胞的丰度,所有样本中CD4幼稚T细胞和γ-ΔT细胞的含量均为0。同时,来自CIBERSORT结果的P<0.05表明,样品的免疫浸润分析是可信的,消除不合格后留下333个LUAD样品(图6A、B)。如图6C所示,B细胞记忆、浆细胞、T细胞CD4记忆静息、T细胞CD4记忆激活、T细胞调节性(Tregs)、单核细胞、巨噬细胞(M0)、巨噬细胞(M1)、噬菌体(M2)、树突状细胞静息和肥大细胞静息在低风险组和高风险组之间存在显著差异(图6C)。此外,作者还使用估计算法来计算每个样本的免疫评分、基质评分、估计评分和肿瘤纯度。作者发现基质评分、评估评分和胶原风险评分之间呈正相关,Pearson系数分别为0.26和0.13。然而,肿瘤纯度和胶原风险评分呈负相关,Pearson系数为-0.14(图6D、F、H、J)。高危组的免疫评分和基质评分较高,而肿瘤纯度较低(图6E、G、I、K)。

图6 胶原蛋白风险评分与免疫信号的关系


TME的概念是癌症研究领域的新概念。ECM、与恶性肿瘤相关的成纤维细胞、血管上皮细胞和已浸润的免疫细胞组成了经典的TME。极化巨噬细胞,包括M1和M2亚型,是近年来被发现在肿瘤增殖、侵袭和转移中发挥重要作用的几种浸润性免疫细胞之一。巨噬细胞非常柔韧,在特定的TME中形成亚短链,TME主要分为M1和M2类型,具有特定的分子和功能特性。M1对于促进肿瘤生长、侵袭、转移和创造抑制性免疫环境至关重要,因为它可以杀死肿瘤细胞并阻止病原体渗透。M2对肿瘤细胞的存活、生长、干性、侵袭、血管生成和免疫抑制有直接影响。作者深入研究了拼贴特征与TAM浸润之间的相关性。高风险组和低风险组之间的巨噬细胞通透性水平在图6C中显示出明显差异。接下来,作者发现了TCGA队列中TAM浸润与胶原蛋白风险评分之间的联系。M0和M1巨噬细胞浸润与风险评分呈正相关,而M2巨噬细胞浸润则呈负相关(图6L,M)。M1的生物标志物包括IL1A、Il1b、IL6、NOS2、TLR2、TLR4、CD80和CD86。M2的生物标志物包括CSF1R、MRC1、PPARG、ARG1、CD163、CLEC10A、RETNLB、PDCD1LG2和CLEC7A。然后检查胶原风险评分与M1和M2生物标志物之间的联系。M1标记物——IL1A、IL6和NOS,以及M2标记物——RETNLB和PDCD1LG2,均与胶原风险评分呈正相关,TLR2与胶原风险得分呈负相关。因此,胶原特征可能对巨噬细胞浸润和分型具有预测价值。


癌相关成纤维细胞(CAFs)是肿瘤间质的主要组成部分。CAFs以多种方式作用于肿瘤细胞,如异常分泌ECM或重塑ECM、分泌细胞因子引起代谢重编程、促进血管生成等(25)。***近的研究发现CAFs对肿瘤细胞的作用是多种多样的。生物标志物(FAP、POSTN、PDGFRα/β、FSP-1、CD90、Palladin、OPN、AEBP1、TNC、CD10和GPR77)代表致癌CAFs。这些细胞可以通过代谢作用促进肿瘤的发展,从而促进血管生成和免疫抑制。然而,Meflin+CAF和CD146+CAF与患者更好的病理组织学特征和预后密切相关。因此,作者研究了这些生物标志物与胶原风险信号之间的关系。相关性分析结果显示,风险评分与促进癌症和抑制癌症的CAFs生物标志物呈正相关,表明高风险患者的CAF活性高于低风险患者,进一步证实了CAF在肿瘤进展中的重要性。然而,还需要进一步的基础研究来解释这种关系所涉及的机制。


7. 胶原蛋白特征与免疫治疗相关生物标志物和TMB之间的关系

近年来,肿瘤免疫治疗一直是癌症研究和治疗领域的热点,并取得了一些有希望和令人鼓舞的成果。几项针对NSCLC免疫治疗的临床研究的初步结果表明,免疫治疗可以为NSCLC患者带来更好的生存益处。随后,作者研究了35个免疫检查点的表达与胶原蛋白风险评分之间的相关性。结果表明,胶原风险评分与CD70、CD200、PDCD1LG2、SIGLEC15、TNFRSF8、TNFRSF9和TNFSF4呈强正相关,与TNFRSF14和TNFSF15呈强负相关(图7A-I)。Wilcoxon试验证实,上述9个免疫检查点在低风险组和高风险组之间存在显著差异(图7J)。

图7 胶原蛋白风险评分与免疫治疗相关生物标志物和TMB的关系


检查每个LUAD患者的突变情况。全基因组中前30个***显著改变的基因包括TP53、TTN、MUC16、CSMD3、RYR2、LRP1B、USH2A、ZFHX4、KRAS、FLG、SPTA1、XIRP2、NAV3、ZNF536、CSMD1、FAT3、ANK2、DAMTS12、COL11A1、PCDH15、MUC17、RYR3、PCLO、TNR、APOB、KEAP1、RR1L1、DNAH9、PTPRD、CDH10(图7K)。之后,作者计算了每个样本的TMB,发现高危评分组的TMB要高得多(图7L)。


8. 预后基因的实验数据验证

为了验证这些结果,作者检测了人类LUAD标本中五种胶原家族蛋白的转录水平。作者总共收集了30例正常组织和LUAD组织。结果显示,五种胶原家族蛋白在大多数肿瘤中的表达远高于正常组织(图8)。

图8 实时定量聚合酶链反应对LUAD中5个胶原家族基因表达的生物学验证


总结

总之,作者基于TCGA数据库确定了一个可靠的预后胶原基因特征。作者首次提出了基于胶原家族成员的预后模型,并详细描述了胶原特征与肿瘤微环境之间的关系,这可能为LUAD患者的免疫治疗提供预后信息。这些重要的新发现将使临床医生能够更独立地治疗LUAD患者。对这篇文章的思路感兴趣的老师,欢迎扫码咨询!



生信分析定制服务

请扫描下方二维码

或添加微信沟通:ShengxinBoss1
往期回顾:
***强攻略1:史上***全单细胞生信数据库汇总解读
***强攻略2:史上***全非编码RNA生信数据库汇总解读
***强攻略3:史上***全外泌体生信数据库汇总解读
***强攻略4:史上***全甲基化表观调控生信数据库汇总解读
***强攻略5:史上***全转录调控生信数据库汇总解读
***强攻略6:史上***全网络药理学生信数据库汇总解读

在看,SCI马上发表

文章内容如有侵权,请联系站长删除。

相关推荐

我们的理念是“用我们的努力,为您创造更新颖的分析,更快速的响应”,我们将继续辅助各位老师,希望各位老师通过自己一步一步的努力始终以发表SCI为目的,让每一位老师都能感受到我们带给您的服务。

  • 专注生信,所以专业
  • 免费咨询
  • 硕博团队1V1服务
  • 7x24客服

联系我们

电话:15322234761

微信:15322234761(电话同步)

邮箱:pubmedgene@163.com

总部:广州市海珠区昌岗达镖国际中心

关注我们

企业微信

生信风暴公众号

智汇基因  粤ICP备10202590号-2

我们的理念是;用我们的努力,为您创造更新颖的分析,更快速的响应;,我们将继续辅助各位老师,希望各位老师通过自己一步一步的努力始终已发表SCI为目的,让每一位老师都能感受到我们带给您的服务。

关注我们

生信分析

定制服务

   公众号

联系我们

电话:15322234761

微信:15322234761(电话同步)

邮箱:pubmedgene@163.com

总部:广州市海珠区昌岗达镖国际中心


© 2010-2021 智汇基因ICP备10202590号-2

添加微信好友,详细了解产品
使用企业微信
“扫一扫”加入群聊
复制成功
添加微信好友,详细了解产品
我知道了