生信学习,咨询,代做,请关注公众号:生信风暴。或添加客服微信:ShengxinBoss1

EWAS Data Hub:DNA甲基化芯片生信数据库

生信数据库 管理员 161℃ 0评论

导语

表观基因组广泛关联研究(Epigenome-wide Association Study,EWAS),基于全基因组范围寻找组间的表观遗传学标记的差别或特征,能够帮助我们了解表观遗传改变与相关形状变化和调控之间的关系。在过去的十年中,由于许多EWAS项目的结果,已经积累了大量的表观遗传数据,尤其是来自DNA甲基化阵列的表观遗传数据。但是,由于不同试验的研究平台,研究批次,包括样本的年龄性别等信息千差万别,直接使用这些数据肯定会导致大量的假阳性。为了解决这些问题,实现更好的甲基化数据整合分析,中国科学院北京基因组研究所国家基因组科学数据中心,开发了人类表观组关联分析数据库EWAS Data Hub。

EWAS Data Hub:DNA甲基化芯片生信数据库插图
EWAS数据构成

EWAS数据中心用于收集和标准化DNA甲基化阵列数据以及存档相关的元数据。当前版本的EWAS Data Hub集成了来自75344个样本的DNA甲基化阵列数据的全面收集,并采用有效的归一化方法来消除不同数据集之间的批量影响。EWAS Data Hub的数据主要来自GEO、TCGA、ArrayExpress和Encode数据库。因此,利用大量高质量的DNA甲基化数据和标准化的元数据,EWAS数据中心可提供不同背景下的参考DNA甲基化图谱,涉及81种组织/细胞类型(包含25个脑部和25种血细胞类型),6个祖先类别和67种疾病(包括39种癌症)。同时,EWAS Data Hub 还提供了高效的查询方式,可协助检索和发现基于甲基化的生物标记物,用于表型表征,临床治疗和保健。

EWAS Data Hub

https://bigd.big.ac.cn/ewas/datahub

EWAS Data Hub:DNA甲基化芯片生信数据库插图1

以下从4个方面进行介绍EWAS Data Hub的功能。

一、home-Search

这个数据库在首页提供了三种检索方式:探针(probes)、基因(genes)和样本(Samples)。

EWAS Data Hub:DNA甲基化芯片生信数据库插图2

以基因DNMT1为例,呈现结果如下:

Basic–基因基本信息和基因的探针数

EWAS Data Hub:DNA甲基化芯片生信数据库插图3

Tissue–不同组织或细胞的甲基化情况(可选择探针位置和种类)

EWAS Data Hub:DNA甲基化芯片生信数据库插图4

Sex–不同性别的甲基化差异

EWAS Data Hub:DNA甲基化芯片生信数据库插图5

Age–探针在各组织中与年龄的相关性

EWAS Data Hub:DNA甲基化芯片生信数据库插图6

Ancestry Category–探针在6大种族中的甲基化水平

EWAS Data Hub:DNA甲基化芯片生信数据库插图7

BMI– DNA甲基化随BMI(乳房,基因启动子)的变化

EWAS Data Hub:DNA甲基化芯片生信数据库插图8

Cancer–各肿瘤中的患者和健康样本的甲基化水平差异、生存分析曲线和甲基化和表达的关系散点图

EWAS Data Hub:DNA甲基化芯片生信数据库插图9

通过选择自己研究的肿瘤,就可以看到对照组和实验组之间的甲基化水平的差别,同时还有相对应的生存曲线。

Public EWAS–基因的甲基化研究文献和结论

EWAS Data Hub:DNA甲基化芯片生信数据库插图10

以上这些图片都可以高清、无损下载。

二、BROWSE

EWAS Data Hub:DNA甲基化芯片生信数据库插图11

三、EWAS Tooklit

EWAS Toolkit是一款全面且易于使用的DNA甲基化探针集分析工具,可提供不同类型的富集分析。对于450K / 850K平台生成的任何给定探针列表,EWAS工具包都能够:确定丰富和枯竭的基因组位置,识别丰富的Go&KEGG术语,识别EWAS Atlas中的相关特征,识别富集和耗尽的组蛋白修饰和染色质状态,提供组织特定信息,识别丰富的已知图案。

EWAS Tooklit 有两个功能模块,一个是富集和注释,需提交相应文件,富集分析非常耗时,大约需要15到20分钟。网站提供批量下载的结果,分别用于主题分析和其他分析。

EWAS Data Hub:DNA甲基化芯片生信数据库插图12

另一个是网络可视化,如下:

EWAS Data Hub:DNA甲基化芯片生信数据库插图13

网络可视化上包括:中心,中心可以是性状或基因;层数:目前仅支持一层或两层;每个节点的最大链接数:允许连接一个节点的链接数;相关系数公式:相关系数的计算方法;系数截止:与系数大于截止的关联将显示。

四、Downloads

Associations、Studies、Cohorts、Probe annotations、Trait to trait relationships都是可以下载的。

EWAS Data Hub:DNA甲基化芯片生信数据库插图14

这个网站能够有效减弱或去除数据间的批次效应,并且能够帮助大家进行有效数据分析,EWAS Data Hub DNA甲基化分析只是国家基因组学数据中心提供的一个数据库,里面还有更多的功能,感兴趣的话可以自行探索,好啦,关于EWAS Data Hub就介绍这么多了。

References:

EWAS Atlas: a curated knowledgebase of epigenome-wide association studies. Nucleic Acids Res. 2019;47(D1):D983–D988. doi:10.1093/nar/gky1027 [PMID=30364969]

推荐阅读

最强攻略:史上最全单细胞数据库汇总解读

最强攻略2: 史上最全非编码RNA数据库汇总解读

最强攻略3: 史上最全外泌体数据库汇总解读

转载请注明:智汇基因 » EWAS Data Hub:DNA甲基化芯片生信数据库

喜欢 (0)
发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址