生信学习,咨询,代做,请关注公众号:生信风暴。或添加客服微信:ShengxinBoss1

MethBank:单细胞甲基化生信数据库

单细胞数据库 管理员 264℃ 0评论

导语

生命与健康大数据中心(The BIG Data Center)由中国科学院北京基因组研究所于2016年成立。中国科学院北京基因组团队通过研究,建立海量生物组学大数据储存、整合与挖掘分析研究体系,发展组学大数据系统构建、挖掘与分析的新技术、新方法,建设组学大数据汇交、应用与共享平台。所建立的数据库目前具备5000个以上CPU计算核心及总容量超过8PB数据存储资源,已经开发形成了一系列的多组学数据库系统,初步形成了我国生命与健康数据交汇与共享的平台,具备可服务于全球的基因组数据共享网络。之前带大家认识了它们的其中一个数据库EWAS Data Hub:DNA甲基化芯片数据库,今天我们来看看他们的另一个数据库吧:MethBank 

MethBank是一个全面的甲基化数据库,它集成了各种物种的共有参考甲基化组(CRM),全基因组单碱基分辨率甲基化组(SRM),DNA和RNA甲基化工具(MeTools)以及表观基因组范围关联研究(EWAS),并提供了甲基化数据可视化的交互式浏览器。MethBank 3.0以高质量甲基化酶大规模整合为特色,涉及34个来自大量人类样品的共识参考甲基化组织,336个来自不同发育阶段/5个植物组织的单碱基分辨率甲基化组织,18个单碱基在人类和小鼠的多个阶段从配子和早期胚胎中分辨甲基化组织。

MethBank

  http://bigd.big.ac.cn/methbank

MethBank:单细胞甲基化生信数据库插图

以下,从5个方面介绍MethBank :

01 search

在首页,我们可以进行搜索甲基化单细胞的相关研究,输入基因、细胞名称、疾病都是可以的:

MethBank:单细胞甲基化生信数据库插图1

搜索框下方还有搜索例子:GSE56879、4-cell embryo、MII oocyte、 Hematopoetic Progenitor Cell、Carcinoma。我们点击GSE56879,看看会返回什么:

MethBank:单细胞甲基化生信数据库插图2

结果分为两部分,上面的Samples是样本筛选,我们那可以选择Organism(目前只有人和小鼠的),Cell Type也很多,类型在首页上有可视化的图标展示。同时细胞的发育阶段、性别也可以选择。

MethBank:单细胞甲基化生信数据库插图3

上图是下部分返回的结果:一次展示不同样品对应的系列、生物、细胞类型、发育阶段、Strain。查看样品加入的序号链接,会看到GEO数据库对其的介绍,(样品状态、类型、生物、来源、生长协议、提取分子等),点击#More Details,展示信息如下:

MethBank:单细胞甲基化生信数据库插图4

02 Browse Project

这部分会展示13个甲基化单细胞的相关研究,大部分都是2016-2019年发布的。

MethBank:单细胞甲基化生信数据库插图5

表里会给出对应的PMID、文章标题、发表年份、杂志刊名、数据集、样本数,不同的单元组还会用不同的颜色标注,还提供了t-SNE_Analysis。我们来看看Integrative single-cell analysis of transcriptome, DNA methylome and chromatin accessibility in mouse oocytes这篇文章对应的t-SNE_Analysis:

part1,对 Datasets: GSE114822的基本介绍:

MethBank:单细胞甲基化生信数据库插图6

Part 2 ,t-SNE可视化。

MethBank:单细胞甲基化生信数据库插图7

其中的着色,我们可以选择组织来源、发展阶段、基因型、治疗方式、年龄、性别、疾病等。点击颜色点,会展示相关的细胞信息。

03 Browse Sample

在这里我们也可以根据样本的组织类型、细胞类型、发育阶段、性别进行筛选。

MethBank:单细胞甲基化生信数据库插图8

04 Toolkit

MethBank:单细胞甲基化生信数据库插图9

Toolkit部分目前只有Lollipop Plotter,用来进行单细胞甲基化的Lollipop绘图。使用起来也非常简单,三步即可。

①输入文件:

甲基化文件必须是一个制表符分隔的文件,具有以下结构:

1.甲基化水平必须以百分比表示(从0到1)。

2.第一行必须指出CpG的位置(位置可以不排序)。

3.每行包含一个样品的甲基化水平。

4.第一列表示样品标识符。每个中间列包含CpG的甲基化水平。

5.请注意,要绘制的CpG和样品的最大数量均为100。

②设置甲基化阈值:

可以自定义阈值或使用我们的默认参数。默认参数表示大于90%DNA甲基化的

CpG位点被认为是甲基化的,而小于10%的CpGs位点被认为是未甲基化的有【甲基化(<):0.1 】和【取消甲基化(>):0.9】两种选择。

③绘图设置:

这部分可以自定义绘图参数或使用网站的默认参数。点类型参数根据站点的位置信息确定点是连续排列还是不连续排列,点大小决定绘制点的大小。

05 Download

MethBank:单细胞甲基化生信数据库插图10

高级用户通过Sample Accession下载Bed文件,其他细胞类型也可以批量下载。

MethBank能够系统地鉴定与年龄密切相关的甲基化位点、在不同年龄段具有恒定甲基化水平的位点、差异甲基化启动子、年龄特异性差异甲基化胞嘧啶/区域和甲基化CpG岛。而且,MethBank提供了在线估计人甲基化年龄的工具,并分别鉴定差异甲基化的启动子,功能十分强大。综合起来,MethBank对于解读表观遗传学研究的DNA甲基化调控机制有很大的帮助,大家不要错过ya 。

References:
Li R, Liang F, Li M, et al. MethBank 3.0: a database of DNA methylomes across a variety of species. Nucleic Acids Res. 2018;46(D1):D288-D295. doi:10.1093/nar/gkx1139

推荐阅读

最强攻略:史上最全单细胞数据库汇总解读

最强攻略2: 史上最全非编码RNA数据库汇总解读

最强攻略3: 史上最全外泌体数据库汇总解读

 

转载请注明:智汇基因 » MethBank:单细胞甲基化生信数据库

喜欢 (0)
发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址