生信学习,咨询,代做,请关注公众号:生信风暴。或添加客服微信:ShengxinBoss1

6+不稳定相关lncRNA生信预后模型,看到最后, 我震惊了……

生信精讲 管理员 298℃ 0评论
6+不稳定相关lncRNA生信预后模型,看到最后,  我震惊了……插图

今天给同学们分享一篇关于基因组不稳定相关的生信文章 “Identification of the Prognostic Significance of Somatic Mutation-Derived LncRNA Signatures of Genomic Instability in Lung Adenocarcinoma” ,这篇文章于今年3月份发表在 frontiers in cell and Developmental Biology 杂志上。影响因子为6.684。文章作者在这项研究中,从基因组和转录水平确定了一组与基因组不稳定性相关的lncRNA,并探讨了它们在LUAD患者中的预后意义,目的是提供一种对基因组不稳定性和癌症死亡风险的替代评估。作者的研究确定了LUAD预后预测的特征,包括七个与基因组不稳定性相关的lncRNA,这可能为LUAD患者的临床分层管理和治疗决策提供有用的指标。

1. 结合体细胞突变谱和转录组数据筛选lncRNA

如图1所示,作者首先确定队列中突变率最高25%的130名患者属于GUL组(体细胞突变平均数为57),队列中突变率最低25%的125名患者属于GSL组(体细胞突变平均数为539)。描述了GSL和GUL组LUAD患者的临床信息。发现161个lncRNA在两组之间存在显著差异表达,其中87个lncRNA上调,74个lncRNA在GUL组下调(图2A)。为了确定这161个lncRNA是否反映了患者的基因组不稳定性,作者对整个队列中161个lncRNA的表达水平应用了无监督的层次聚类分析。如图2B所示,所有457个样本被聚类成两个具有显著差异突变计数的聚类,其中具有较高突变数的聚类被称为GU样聚类,而具有较少突变数的聚类被称为GS样聚类(图2C)。此外,一种名为UBQLN4的基因,据报道它可以驱动基因组不稳定并在侵袭性肿瘤中过度表达,在GS样簇中也被上调(图2D)。这些结果表明161个lncRNA可以被鉴定为候选lncRNA。

6+不稳定相关lncRNA生信预后模型,看到最后,  我震惊了……插图1

图2.患者不稳定性相关IncRNA的筛选及富集分析

作者接下来使用编码基因的共表达分析和GO富集分析探索了lncRNA的潜在功能。图2E显示了反映两者之间关系的lncRNA-mRNA共表达网络。标记根据Pearson相关系数与每种lncRNA共表达的前三种mRNA的名称。lncRNA相关基因的GO功能富集分析表明,它们主要富集细胞成分(CC)中的染色体和核质,分子功能(MF)中的DNA结合,以及生物过程中的转录和化合物合成与代谢(图2F)。

2. lncRNA的预后特征的建立和可预测性评估

为了探索lncRNA的临床意义,作者将457名患者随机分为两组:训练组(N=229)和测试组(N=228)。然后,使用单变量Cox比例风险回归分析(图3A)筛选了与训练集中161个lncRNA患者的总体存活显著相关的11个lncRNA。进行LASSO回归和逐步多变量Cox比例风险回归分析以构建用于存活预测的风险模型。因此,保留预后意义的11个ginlncRNA中有7个被纳入风险模型(图3B-D)。根据GInLncSig评分中位数为1.025,训练集中得分高于中位数的患者被归类为高危人群,分数等于或低与中位数的人被归类为低风险组。作者发现低风险组LUAD患者的生存结果优于高风险组患者(图4A)。对于GInLncSig的1年生存预测,训练集中ROC曲线的AUC为0.772(图4B)。为了验证GInLncSig在生存预测中的表现,作者计算了测试集和整个TCGA集的GInLncSig得分并绘制了它们的ROC曲线。测试集中的GInLncSig评分中位数为1.021。低风险组患者的生存期比高风险组患者更长,测试组的AUC值为0.73(图4C,D)。在整个TCGA组中也观察到类似的结果,其中GInLncSig的ROC曲线的AUC为0.739(图4E,F)。这些结果表明GInLncSig具有良好的生存预测功效。

6+不稳定相关lncRNA生信预后模型,看到最后,  我震惊了……插图2

图3.构建LUAD患者的预后风险特征

6+不稳定相关lncRNA生信预后模型,看到最后,  我震惊了……插图3

图4.lncRNA特征对LUAD患者总生存期的预测性能

3. GInLncSig与体细胞突变模式有关

为了测试GInLncSig是否与体细胞突变模式相关,例如体细胞突变的计数和UBQLN4的表达水平,以及titin基因(TTN)的突变状态。作者首先对三个数据集进行了一组风险图,包括lncRNA表达的热图,患者突变的分布以及UBQLN4的表达量。如图5A所示,训练集中LINC01133,LINC01671,LINC01116,FAM83A-AS1和PLAC4的表达水平随着GInLncSig评分的增加而增加,而MIR223HG和AL590226.1的表达随着GInLncSig评分的增加而降低。值得注意的是,体细胞突变的计数和UBQLN4的表达量也随着GInLncSig评分的增加而增加。如图5B所示,高危组患者的体细胞突变计数显著高于低危组患者(图5B)。UBQLN4的表达量在高危组显著高于低危组(图5B)。这些结果在测试整个TCGA数据集中得到了进一步验证(图5C–F)。作者观察到整个TCGA群组中体细胞突变计数和UBQLN4的表达随着GInLncSig评分的增加而增加(图5E、5C。比较分析显示,在两种测试中,高危组和低危组的体细胞突变数量存在显著差异(图5D)和包括整个TCGA集(图5F)。此外,作者观察到高风险组中UBQLN4的表达水平略高于测试集中的低风险组(图5D),高风险组UBQLN4的表达水平显著高于在整个TCGA集中的低风险组(图5F)。

此外,作者在LUAD队列中观察到TTN突变率很高。先前的研究报道,TTN中的体细胞突变经常发生在许多癌症类型中,并反映了肿瘤突变负担的状态。因此,作者进一步评估了GInLncSig和TTN突变状态之间的关联。作者使用卡方检验比较了三个数据集中高风险组和低风险组之间的差异。结果显示,在三个数据集中,高风险组患者的TTN突变比例显著高于低风险组(图5G)。TTN被鉴定为与非小细胞肺癌中的抗性和胃癌的预后相关。作者进一步对使用GInLncSig确定了风险组和对TTN的突变状态进行了生存分析,TTN Mutaion/高风险,TTN Mutaion/低风险,TTN野生/高风险,TTN野生/低风险组。如图5H所示,四组之间存在显著差异。这些结果表明GInLncSig与TTN突变状态相关。综上所述,上述结果表明GInLncSig评分与体细胞突变模式有关。

6+不稳定相关lncRNA生信预后模型,看到最后,  我震惊了……插图4

图5.lncRNA特征与LUAD患者体细胞突变模式的关系

4. GInLncSig与预后lncRNA特征的外部验证

为了进一步验证GInLncSig的预后意义,作者研究了来自GPL570平台的另一个独立数据集GSE31210(N=226)中GInLncSig的预后。虽然作者重新注释了GPL570平台的探针,但由于GPL570和IlluminaHiSeq平台的检测深度不同,GSE31210数据集中仅覆盖了GInLncSig中7个lncRNA中的6个。因此,作者评估了根据上述公式仅基于六种lncRNA的表达计算GInLncSig评分的显著性。生存分析显示,低危组预后好于高危组(图6A)。作者还研究了两个风险组之间UBQLN4差异表达,结果显示高风险组UBQLN4的表达水平显著高于低风险组,这与结果一致(图6B)。与临床特征的相关性分析表明,GInLncSig评分与LUAD患者的性别和肿瘤分期相关(图6C,D)。男性患者的GInLncSig评分往往高于女性患者(图6C)。II期患者的GInLncSig评分显著高于I期患者(图6D)。总之,这些结果进一步验证了LUAD中GInLncSig的稳定性。

6+不稳定相关lncRNA生信预后模型,看到最后,  我震惊了……插图5

图6.外部验证和模型比较

5. 评估GInLncSig的独立预后意义和临床分析

为了探讨GInLncSig是否是临床病理特征的独立预后因素,作者对包括年龄,性别,肿瘤分期和GInLncSig在内的变量的四个数据集(训练,测试,TCGA和GSE31210数据集)进行了单变量和多变量Cox回归分析。单因素Cox回归分析结果显示,GInLncSig和肿瘤分期与4个数据集患者的总生存期显著相关(P<0.001),并且在4个数据集的多因素Cox回归分析中保留了预后意义(P<0.01)。其他变量,如年龄和性别,与患者的总生存率无显著相关性。经其他临床因素(包括年龄,性别和肿瘤分期)调整后,TCGA数据集中GInLncSig预后表现的临床分析显示,低风险组患者的生存结果优于高风险组所有临床亚组(图7)。总之,这些结果提示GInLncSig在LUAD患者中的预后意义与其他临床病理学变量无关。

6+不稳定相关lncRNA生信预后模型,看到最后,  我震惊了……插图6

图7.临床分析

6. LUAD患者生存预测诺谟图的构建与验证

为了提高模型的临床实用性,作者通过在R中整合GInLncSig和肿瘤分期,在训练集中建立了统计列线图模型(图8A)。Nomogram图的指数为0.757,ROC对1年,2年和3年生存预测的AUC分别为0.823、0.786和0.780(图8B)。类似地,测试集中的指数为0.693,1年,2年和3年AUC分别为0.776、0.719和0.702(图8C)。整个TCGA组的指数为0.720,1年,2年和3年的AUC分别为0.788、0.744和0.737(图8D)。图片显示三个数据集中实际生存率和预测之间的良好一致性。因此,这些发现表明列线图的预测性能得到改善。

6+不稳定相关lncRNA生信预后模型,看到最后,  我震惊了……插图7

图8.生存预测诺谟图的构建和评估

小结

作者的研究确定了包含7个基因组不稳定性相关lncRNA的风险预后特征。GInLncSig可以预测LUAD患者的总体生存率,并表明基因组不稳定。此外,还通过将GInLncSig与肿瘤分期相结合来构建列线图来实现改进的预测性能。这是第一项研究lncRNA特征作为预测LUAD患者生存的基因组不稳定性相关生物标志物的研究。作者的研究可能为LUAD患者的临床分层管理和治疗决策提供有用的指标,也是未来他们关系机制研究的基石。对肿瘤+不稳定性IncRNA分析思路感兴趣的老师,欢迎扫码咨询。

6+不稳定相关lncRNA生信预后模型,看到最后,  我震惊了……插图8
扫码或添加微信沟通:ShengxinBoss1
往期回顾:
最强攻略1:史上最全单细胞数据库汇总解读
最强攻略2:史上最全非编码RNA数据库汇总解读
最强攻略3:史上最全外泌体数据库汇总解读
最强攻略4:史上最全甲基化表观调控数据库汇总解读
最强攻略5:史上最全转录调控数据库汇总解读
最强攻略6:史上最全网络药理学数据库汇总解读

6+不稳定相关lncRNA生信预后模型,看到最后,  我震惊了……插图9

 

转载请注明:智汇基因 » 6+不稳定相关lncRNA生信预后模型,看到最后, 我震惊了……

喜欢 (1)
发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址