生信学习,咨询,代做,请关注公众号:生信风暴。或添加客服微信:ShengxinBoss1

HOCOMOCO:大规模ChIP-Seq分析下的人与小鼠转录因子生信数据库

生信数据库 管理员 250℃ 0评论

HOCOMOCO是专门研究人和小鼠的数据库,团队从超过5000个针对人类和小鼠转录因子的实验中获得的14000多套ChIP-Seq数据集,基于系统化的基序发现和交叉验证,展示了人类和小鼠转录因子结合模型。目前,HOCOMOCO 共收集了680个人和453个鼠转录因子的结合model,其中包含1302个单核苷酸和576个二核苷酸的位置权重矩阵。这种大规模的分析可以极大地扩展和改善针对人和小鼠转录因子的TFBS模型的非冗余集。

HOCOMOCO

https://hocomoco11.autosome.ru/

HOCOMOCO:大规模ChIP-Seq分析下的人与小鼠转录因子生信数据库插图

01

 TF信息查询

HOCOMOCO提供了三种形式让我们查找TF。

第一种:主页左上角快速搜索:

我们可以直接通过主页右上角的搜索框直接搜索转录因子的名称,搜索框后面选择人或小鼠的数据库。

HOCOMOCO:大规模ChIP-Seq分析下的人与小鼠转录因子生信数据库插图1

第二种,TF分类关系图:

在主页,可以看到右侧的关系图是TF分类关系图,其中每个蓝圈表示某个TF家族的总的TF数,较小的黄圈表示HOCOMOCO数据库中的TF数及比例。

HOCOMOCO:大规模ChIP-Seq分析下的人与小鼠转录因子生信数据库插图2

第三种,人/小鼠模块分类检索:

通过左角Human TFs或者Mouse TFs,它们都可以选择单核苷酸models core,单核苷酸models full或者二核苷酸models数据集。

HOCOMOCO:大规模ChIP-Seq分析下的人与小鼠转录因子生信数据库插图3

这里以Human TFs-models core为例,结果展示了转录因子对应的模型和碱基图标和长度、质量和TF家族以及EntrezGEne、UN iProt ID,这些都可以作为排序标准进行调节,同时可以支持搜索,方便我们找到所需要的的转录因子信息。同时可以利用GetSCV保存搜索到的列表。注意,如果需要更多相关model信息,可以通过Select Columns进行Consensus,Uniprot AC等展示。

HOCOMOCO:大规模ChIP-Seq分析下的人与小鼠转录因子生信数据库插图4

点击搜索结果的Model,展示具体的转录因子ID,model名称,model类型,motif logo,位置权重矩阵(PWM),比对到的序列等内容,PWM,PFM,比对结果可以下载。

HOCOMOCO:大规模ChIP-Seq分析下的人与小鼠转录因子生信数据库插图5

HOCOMOCO:大规模ChIP-Seq分析下的人与小鼠转录因子生信数据库插图6

02

HOCOMOCO TOOL

1.MoLoTool

 

MoLoTool可以查找感兴趣的检索基因结合的转录因子。

 

HOCOMOCO:大规模ChIP-Seq分析下的人与小鼠转录因子生信数据库插图7

如图所示,点击进入后,可以在左上角搜索添加感兴趣的motif;然后在下面输入或者上传需要检索的序列。下方显示MotifID,Sequence,logo等信息。

这个方法可能略显复杂,我们也可以通过检索栏直接检索查找感兴趣的基因结合的转录因子。由于HOCOMOCO提供HGNC ID和EntrezGene ID的检索,直接通过基因的以上两个ID进行检索即可。

2.MACRO-APE

MACRO-APE可进行motif比较与相似motif检索。

HOCOMOCO:大规模ChIP-Seq分析下的人与小鼠转录因子生信数据库插图8

需要输入两个motif的PCM,PWM 或PPM矩阵才能进行比较。

HOCOMOCO:大规模ChIP-Seq分析下的人与小鼠转录因子生信数据库插图9

结果中给出相似系数,相似系数越高,表示两motif越相似。MACRO-APE软件将表示为位置权重矩阵(PWM,也称为位置特定评分矩阵,PSSM)的转录因子结合模型(通常称为基序)与得分阈值进行有效比较。

HOCOMOCO:大规模ChIP-Seq分析下的人与小鼠转录因子生信数据库插图10

3.PERFECTOS-APE

这一模块可预测motif中SNVs与SNPs可能的调节作用。

HOCOMOCO:大规模ChIP-Seq分析下的人与小鼠转录因子生信数据库插图11

PERFECTOS-APE可以计算不同model的位置分数,在HOCOMOCO,JASPAR,HOMER等数据库中进行检索对应的models进行比较分析。结果包括SNP名称,相关motif名称,突变碱基对,突变碱基P值等。

HOCOMOCO:大规模ChIP-Seq分析下的人与小鼠转录因子生信数据库插图12

点击motif,可以看到Model info。

HOCOMOCO:大规模ChIP-Seq分析下的人与小鼠转录因子生信数据库插图13

03

Dowloads

HOCOMOCO留存了三个版本的数据资料,分为工具类、序列资料以及github脚本,,都可以下载。

HOCOMOCO:大规模ChIP-Seq分析下的人与小鼠转录因子生信数据库插图14

HOCOMOCO转录因子结合模型数据库已成为哺乳动物转录调控序列分析的主要资源库之一,无论是查询转录因子或结合的基因,MoLoTool对DNA序列中HOCOMOCO结合位点的可视化定位。HOCOMOCOTFBS的预测功能到调控序列变体的注释都可为为研究添砖加瓦。本期内容就到这里,感谢大家~

References

HOCOMOCO: towards a complete collection of transcription factor binding models for human and mouse via large-scale ChIP-Seq analysis

往期回顾:
最强攻略1:史上最全单细胞数据库汇总解读
最强攻略2:史上最全非编码RNA数据库汇总解读
最强攻略3:史上最全外泌体数据库汇总解读
最强攻略4:史上最全甲基化表观调控数据库汇总解读

转载请注明:智汇基因 » HOCOMOCO:大规模ChIP-Seq分析下的人与小鼠转录因子生信数据库

喜欢 (0)
发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址