生信学习,咨询,代做,请关注公众号:生信风暴。或添加客服微信:ShengxinBoss1

6+TCGA生信分析思路:基于机器学习的神经胶质瘤等级分析揭示了共同富集

生信基础 管理员 293℃ 0评论

题目:Machine Learning-Based Analysis of Glioma Grades Reveals Co-Enrichment

杂志:Cancers (Basel)

日期:2022 年 2 月 17 日

Doi: 10.3390/cancers14041014

6+TCGA生信分析思路:基于机器学习的神经胶质瘤等级分析揭示了共同富集插图

 

神经胶质瘤在大脑和中枢神经系统中发育和生长。检查胶质瘤分级过程对于改善治疗挑战很有价值。存储胶质瘤转录组数据的最广泛的存储库之一是癌症基因组图谱 (TCGA)。然而,如此大的队列应谨慎处理并彻底评估,因为它们可能包含批次和其他影响。此外,癌症的生物学机制包含生物标志物之间的相互作用。因此,我们应用了一种可解释的机器学习方法来发现这种关系。这种类型的透明学习不仅提供了良好的可预测性,而且揭示了特征之间的共同预测机制。在这项研究中,我们纠正了 TCGA 神经胶质瘤数据中强烈且混杂的批次效应。我们进一步使用校正后的数据集,使用来自分子特征数据库的集合对单样本基因集富集分数进行全面的机器学习分析。此外,使用基于规则的分类器,我们展示了与胶质瘤等级相关的共富集网络。此外,我们使用外部神经胶质瘤队列验证了我们的结果。我们相信,利用来自 TCGA 的校正神经胶质瘤队列可以改善任何未来研究的应用和验证。最后,共富集和生存分析为胶质瘤进展提供了详细的解释,因此,它应该支持靶向治疗。使用基于规则的分类器,我们展示了与胶质瘤等级相关的共同富集网络。此外,我们使用外部神经胶质瘤队列验证了我们的结果。我们相信,利用来自 TCGA 的校正神经胶质瘤队列可以改善任何未来研究的应用和验证。最后,共富集和生存分析为胶质瘤进展提供了详细的解释,因此,它应该支持靶向治疗。使用基于规则的分类器,我们展示了与胶质瘤等级相关的共同富集网络。此外,我们使用外部神经胶质瘤队列验证了我们的结果。我们相信,利用来自 TCGA 的校正神经胶质瘤队列可以改善任何未来研究的应用和验证。最后,共富集和生存分析为胶质瘤进展提供了详细的解释,因此,它应该支持靶向治疗。

生物信息学的一个关键挑战是以公正、重复和准确的方式进行分析。本研究展示了如何从 TCGA 神经胶质瘤数据集中去除强烈的批次效应并执行全面的 ML 分析。在此,LGG 和 GBM 队列包括与结果类别混淆的强批次效应。在这种情况下,必须纠正批次效应,但必须小心谨慎,以保持数据中包含的生物信息。此外,这项工作描述了反映神经胶质瘤进展的稳健过程的共富集机制。值得注意的是,所提出的方法是通用的,可以用于任何有问题的数据。据我们所知,这是第一次使用基于规则的学习对胶质瘤等级进行联合富集分析。

转载请注明:智汇基因 » 6+TCGA生信分析思路:基于机器学习的神经胶质瘤等级分析揭示了共同富集

喜欢 (0)
发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址