生信学习,咨询,代做,请关注公众号:生信风暴。或添加客服微信:ShengxinBoss1

缺好的idea的进来来看看,6+预测转移和预后的编码-非编码特征生信模型!

基因组分析 管理员 169℃ 0评论
缺好的idea的进来来看看,6+预测转移和预后的编码-非编码特征生信模型!插图

今天给同学们分享一篇关于预测癌症预后编码特征的生信的文章“Integrated Profiles Analysis Identified a Coding-Non-Coding Signature for Predicting Lymph Node Metastasis and Prognosis in Cervical Cancer”,这篇文章于今年3月份发表在 Front  Cell  Dev  Biol杂志上,影响因子IF=6.684。文章作者对宫颈癌患者的mRNA表达谱和LncRNA表达谱进行了综合分析,并采用机器学习方法识别了一种新的编码-非编码RNA特征,用于预测LNM状态和预后。

Integrated Profiles Analysis Identified a Coding-Non-Coding Signature for Predicting Lymph Node Metastasis and Prognosis in Cervical Cancer

综合表达谱分析确定了预测宫颈癌淋巴结转移和预后的编码-非编码特征

1.与淋巴结转移相关mRNAs和lncRNAs的鉴定

103例有淋巴结转移信息的宫颈癌患者按2:1的比例被分为训练组(n=129;89例无LNM患者和40例LNM患者)和测试集(n=64;44例LNM患者和20例非LNM患者)。为了确定与淋巴结转移相关的关键mRNAs和lncRNAs,作者首先比较了40例淋巴结转移患者(N+)和89例非淋巴结转移患者(N−) 。共有224个mRNAs和26个lncRNAs被鉴定为差异表达的mRNAs和lncRNAs(| log2(FC)|>1和FDR p值<0.05)(图1A)。其中28个mRNAs和2个lncRNAs上调,196个mRNAs和24个lncRNAs下调。

缺好的idea的进来来看看,6+预测转移和预后的编码-非编码特征生信模型!插图1

图1.淋巴结转移相关候选生物标志物的鉴定

2.预测淋巴结转移的编码-非编码模型的构建

为了构建用于预测淋巴结转移的整合编码非编码特征,使用RF-RFE方法对不同表达的224个mRNAs和26个lncRNAs进行了基于机器学习的特征选择,并进行了10倍交叉验证和5次重复采样(图2A)。最后,在考虑基因数量和性能之间的平衡时,选择了8个最佳特征,包括7个mRNAs(EPLG3、TMEM151A、EFCAB1、MAPT、ART3、BRDT和HRG)和1个lncRNAs(AC073320.1)来构建预测模型。然后,基于7个mRNA和1个lncRNA的表达水平,采用弹性网络logistic回归方法,构建了编码非编码特征模型(CNC8SIG)。在CNC8SIG中,包括EPLG3、TMEM151A、MAPT和HRG在内的四个基因在LNM患者中上调,而其他四个基因(AC073320.1、EFCAB1、ART3和BRDT)在LNM患者中呈下调趋势(图2B、C)。在测试CNC8SIG时,ROC分析显示CNC8SIG的AUC值为0.931(0.904–0.958),准确率为83.6%,敏感性为79.2%,特异性为86.9%,如图2D所示。

缺好的idea的进来来看看,6+预测转移和预后的编码-非编码特征生信模型!插图2

图2.发现队列中编码非编码RNA特征的构建

3.CNC8SIG在不同队列中预测性能的独立验证

为了检验CNC8SIG预测淋巴结转移的稳健性和可重复性,在另外两个患者队列中进一步测试了CNC8SIG。首先将CNC8SIG应用于64名试验队列患者。如图3A所示,ROC分析显示CNC8SIG的AUC值为0.713(0.574–0.851),准确率为68.8%,敏感性为45%,特异性为79.6%。CNC8SIG的进一步验证在完全独立的GEO GSE26511队列中进行。如图3B所示,CNC8SIG也显示了淋巴结转移的良好预测性能,AUC值为0.66(0.483–0.853)(图3B)。以上来自不同患者队列的结果证实了CNC8SIG预测淋巴结转移的稳健性和可重复性。

缺好的idea的进来来看看,6+预测转移和预后的编码-非编码特征生信模型!插图3

图3.不同患者队列的独立验证,编码非编码RNA信号预测淋巴结转移的ROC曲线

4.CNC8SIG与患者预后的关系

利用Kaplan-Meier曲线和log-rank检验,通过比较非LNM样患者组和CNC8SIG预测的LNM样患者组的生存时间,进一步探讨CNC8SIG与患者预后的关系。在训练队列中,如图4A所示,CNC8SIG预测的非LNM样患者组的预后明显好于预测的LNM样患者组(图4A)。在测试队列中,生存分析显示,与预测的LNM样患者组相比,CNC8SIG预测的非LNM样患者组的预后较好。在GSE4401中检测CNC8SIG时,CNC8SIG将300名患者分为高风险组和低风险组,两组患者的生存时间有显著差异。如图4C所示,与低风险组相比,高风险组的患者预后较差(log rank p=0.019)(图4C)。这些结果表明CNC8SIG与患者预后相关。

缺好的idea的进来来看看,6+预测转移和预后的编码-非编码特征生信模型!插图4

图4.编码非编码RNA信号与预后的关系及不同患者组间患者的Kaplan-Meier生存曲线

5.CNC8SIG的通路富集分析

首先用Pearson相关系数测定lncRna ac073320.1与其他mRNAs的表达水平,并确定了253个与AC073320.1相关的mRNAs(Pearson相关系数>0.3,p<0.05)。然后对CNC8SIG中与AC073320.1相关的253mRNAs和其他7个mRNAs进行功能富集分析。GO分析确定了七个主要涉及转录调控、生物体发育和分化的富集生物过程(图5A)。KEGG富集分析显示,CNC8SIG相关的mRNAs富集于已知的癌症相关的生物途径,如Wnt信号途径、Ras信号途径、Rap1信号途径和PI3K-Akt信号途径(图5B)。

缺好的idea的进来来看看,6+预测转移和预后的编码-非编码特征生信模型!插图5

图5.编码非编码RNA信号的通路富集分析

小结

 

在这项研究中,对有无LNM的宫颈癌患者的mRNA表达谱和lncRNA表达谱进行了综合分析,并确定了224个mRNA和26个lncRNA作为候选生物标记物。然后应用机器学习方法对这些候选生物标志物进行特征选择,确定了8个最佳生物标志物,包括7个mRNAs和1个lncRNAs。为了加速临床应用,使用弹性logistic回归方法来开发基于8个最佳生物标记物(命名为CNC8SIG)表达水平的预测特征。CNC8SIG在发现队列中鉴别LNM患者和无LNM患者方面显示出非常好的预测性能。CNC8SIG在确定其他独立患者队列的LNM状态方面也表现出较好的表现。此外,生存分析显示,不同风险患者组在不同的患者队列中有显著不同的生存结果。提示CNC8SIG不仅对淋巴结转移有很好的预测作用,而且与患者的预后有关。对该思路感兴趣的老师,欢迎扫码咨询

缺好的idea的进来来看看,6+预测转移和预后的编码-非编码特征生信模型!插图6
扫码或添加微信沟通:ShengxinBoss1
往期回顾:
最强攻略1:史上最全单细胞数据库汇总解读
最强攻略2:史上最全非编码RNA数据库汇总解读
最强攻略3:史上最全外泌体数据库汇总解读
最强攻略4:史上最全甲基化表观调控数据库汇总解读
最强攻略5:史上最全转录调控数据库汇总解读
最强攻略6:史上最全网络药理学数据库汇总解读

缺好的idea的进来来看看,6+预测转移和预后的编码-非编码特征生信模型!插图7

转载请注明:智汇基因 » 缺好的idea的进来来看看,6+预测转移和预后的编码-非编码特征生信模型!

喜欢 (1)
发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址