生信学习,咨询,代做,请关注公众号:生信风暴。或添加客服微信:ShengxinBoss1

​iMETHYL:DNA甲基化、 SNP和RNA_seq的多组学联合生信数据库

生信数据库 管理员 188℃ 0评论

导语

全基因组关联分析(GWAS)可以阐明基因组变异与表型之间的关系,其中CpG二核苷酸的甲基化与常见疾病之间的关系,体现了表观遗传调控DNA甲基化的重要性,DNA甲基化数据库与其他组学数据一起将有助于研究人员深入研究疾病的表观遗传机制。

iMETHYL是DNA甲基化、 SNP和RNA_seq的多组学联合数据库。iMETHYL从近100名志愿者中提取3种类型的细胞,并分别进行WGS, WGBS, RNA_seq测序分析,将最终的数据存储到iMETHYL 数据库中。通过提供CD4 + T淋巴细胞,单核细胞和嗜中性粒细胞的全DNA甲基化(〜2400万个常染色体CpG位点),全基因组(〜900万个单核苷酸变体)和全转录组(> 14000个基因)数据。通过提供多组学数据和QTL信息,整合SNP, DNA甲基化和RNA表达谱的数据,进行两两之间的关联分析,iMETHYL将用作综合参考数据,还将帮助研究人员推断DNA甲基化,基因组变异和基因表达之间的调控机制。

iMETHYL

http://imethyl.iwate-megabank.org/index.html

​iMETHYL:DNA甲基化、 SNP和RNA_seq的多组学联合生信数据库插图

下面我们从3个方面进行介绍iMETHYL

01

SEARCH

主页上提供了三种搜索方式,分别是Gene Symbol、dbSNP rsID、Position chr。

​iMETHYL:DNA甲基化、 SNP和RNA_seq的多组学联合生信数据库插图1

以dbSNP rsID的rs671为例进行搜索,展现结果如下:

​iMETHYL:DNA甲基化、 SNP和RNA_seq的多组学联合生信数据库插图2

在多个位置找到“ rs671”, iMETHYL让我们选择选择要查看的位置,这里我们选第一个,chr12:112241765..112241766,点击show,检索的结果通过基因组浏览器展示如下:

​iMETHYL:DNA甲基化、 SNP和RNA_seq的多组学联合生信数据库插图3

顶部红黄蓝方块对应参考序列,我们可以在基因区域的细胞类型中找到差异甲基化的CpG位点。单击CpG轨道中的栏,可以在弹出窗口中查看每个CpG站点的甲基化水平分布。RNA_seq的数据,通过FPKM进行展示,在基因组浏览器中会给出每种细胞,检测到的转录本。

​iMETHYL:DNA甲基化、 SNP和RNA_seq的多组学联合生信数据库插图4

左侧可以看到DNA甲基化,转录组数据和SNV数据在基因组浏览器中的展示方式。IMM:3 cell-types用于显示每个细胞系甲基化,基因表达量和SNV的结果。

IMM:3种细胞类型信息内涵如下:

CpG_CD4T,CpG_Mono,CpG_Neu:每个CpG站点的信息。

CpG_CD4T_avg,CpG_Mono_avg,CpG_Neu_avg:每个CpG位点的平均甲基化水平。

CpG_CD4T_sd,CpG_Mono_sd,CpG_Neu_sd:每个CpG位点甲基化水平的SD(标准差)。

CpG_CD4T_RI,CpG_Mono_RI,CpG_Neu_RI:每个CpG位点甲基化水平的RI(参考间隔)。

FPKM_CD4T,FPKM_Mono,FPKM_Neu:每个转录本的FPKM(外显子每千碱基的片段/所映射的百万个片段)值。

SNV_CD4T,SNV_Mono,SNV_Neu:SNV(单核苷酸变体,次要等位基因计数> 1,检出率≥50%)。

图中左侧打钩的内容分别对应右侧的横条状:

​iMETHYL:DNA甲基化、 SNP和RNA_seq的多组学联合生信数据库插图5

点击FPKM-CD4T蓝色条状之后会展示数据的名称、位置chr12、长度、类型、每个基因的表达水平分布、ID、对数刻度-fpkm_sd、Seq_id、区域序列,具体如下:

​iMETHYL:DNA甲基化、 SNP和RNA_seq的多组学联合生信数据库插图6

单击SNV轨道中的栏,可以在弹出窗口中查看每个SNV的详细信息。

​iMETHYL:DNA甲基化、 SNP和RNA_seq的多组学联合生信数据库插图7

对于3种组学的数据,imethy还通过QTL分析两两之间的关联。

IMM All tracks是指:从20个人的WGBS获得的每个细胞群的每个CpG位点的平均甲基化水平。

IMM:QTL分析概念解释:

eQTL:eQTL分析的结果(仅显示FDR≤0.05的结果)。

eQTM:eQTM分析的结果(仅显示FDR≤0.05的结果)。

mQTL:mQTL分析的结果(仅显示FDR≤0.05的结果)。

​iMETHYL:DNA甲基化、 SNP和RNA_seq的多组学联合生信数据库插图8

基因型和基因表达谱之间的关联分析通过cis-eQTL来实现,DNA甲基化和基因表达谱之间的关联分析通过cis-eQTM来实现,DNA甲基化与基因型之间的关联分析通过cis-mQTL来实现。imethy针对每个数据集(单核细胞,CD4 + T细胞,中性粒细胞和PBMC)测试了基因型和基因表达(cis-eQTL),DNA甲基化和基因表达(cis-eQTM)和基因型和DNA甲基化(cis-mQTL)之间的关联。将顺式邻近度定义为距离±5kb,并将简单线性回归拟合在每个分析中。

2.

STATISTICS

在STATISTICS页面,提供了以下关于数据源基本信息。

每条染色体检测到的CpG位点数量:

​iMETHYL:DNA甲基化、 SNP和RNA_seq的多组学联合生信数据库插图9

从20名受试者中分离每个细胞群

​iMETHYL:DNA甲基化、 SNP和RNA_seq的多组学联合生信数据库插图10

 人口统计资料和QTL分析的统计数据:

​iMETHYL:DNA甲基化、 SNP和RNA_seq的多组学联合生信数据库插图11

3.

DOWNLOADS

我们可以从iMETHYL下载一些数据集:单核细胞、CD4T和中性粒细胞的DNA甲基化摘要数据、单核苷酸变异总结数据、基因表达摘要数据、8种血细胞类型中X染色体的性别特异性DNA甲基化摘要数据这些数据库……都可以下载。

​iMETHYL:DNA甲基化、 SNP和RNA_seq的多组学联合生信数据库插图12

iMETHYL供下载的数据集

总而言之,iMETHYL是一个以DNA甲基化为中心,提供全面的多组学数据库,里面的数据可以作为表观遗传研究等的基础或参考。有兴趣的可以记得收藏起来,以免迷路走失~

References:
1.Iwate Tohoku Medical Megabank Organization, iMETHYL Database; over 100 Japanese whole genome DNA methylation database from monocytes, CD4+ T cells, and neutrophils, (access date), http://imethyl.iwate-megabank.org/
2.T. Hachiya et al. “Genome-wide identification of inter-individually variable DNA methylation sites improves the efficacy of epigenetic association studies” NPJ Genom Med. 2017. 2:11

推荐阅读

最强攻略:史上最全单细胞数据库汇总解读

最强攻略2: 史上最全非编码RNA数据库汇总解读

最强攻略3: 史上最全外泌体数据库汇总解读

转载请注明:智汇基因 » ​iMETHYL:DNA甲基化、 SNP和RNA_seq的多组学联合生信数据库

喜欢 (0)
发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址