注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

云之南

风声,雨声,读书声,声声入耳;家事,国事,天下事,事事关心

 
 
 

日志

 
 
关于我

专业背景:计算机科学 研究方向与兴趣: JavaEE-Web软件开发, 生物信息学, 数据挖掘与机器学习, 智能信息系统 目前工作: 基因组, 转录组, NGS高通量数据分析, 生物数据挖掘, 植物系统发育和比较进化基因组学

网易考拉推荐

GO分析的相关工具与生物常用数据库-2009  

2010-04-13 21:20:07|  分类: 生信分析软件 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
http://blog.sina.com.cn/s/blog_64b3477d0100hke6.html
http://blog.sina.com.cn/s/blog_64b3477d0100hke8.html
http://amethystwinter.blog.sohu.com/87437700.html
http://61.50.138.118/gofact/cgi/guestbook.cgi

GO委员会工具
AmiGO [http://amigo.geneontology.org/cgi-bin/amigo/go.cgi]
AmiGO 提供检索和浏览GO委员会提供的本体学(ontology)和注释(annotation)数据。用户可以通过检索蛋白获得相应的GO术语,可以检索GO 术语得到相应的细节和相关的蛋白注释,AmiGO还提供了BLAST搜索引擎,比对有GO术语注释的基因和基因产物的序列。

OBO-Edit [https://sourceforge.net/project/showfiles.php?group_id=36855&package_id=192411]
OBO- Edit是一个开源的、与平台无关的应用程序,用于显示和编辑OBO格式的本体文件.OBO-Edit是基于图的工具,强调本体的全部图结构,给生物学家提供了一个友好的接口。OBO-Edit是个很好的工具,关注于相对简单的门类的相互关系,有助于本体学的快速更新。



非GO委员会工具
用于搜索和浏览GO的工具:显示、浏览和搜索相应的本体和注释
??? *?? CGAP GO Browser [http://cgap.nci.nih.gov/Genes/GOBrowser]
提供浏览GO词汇,可以找人和小鼠基因对应的GO术语, 每隔几个月更新GO的数据。

??? * COBrA [http://www.xspan.org/cobra/]
一个基于Java的本体编辑器,区别于其它编辑器在于其提供了两个本体间概念上的连接,以及提供了精细的分析和验证功能。除了支持GO和OBO格式之外,COBrA还能导入和导出本体为语义web(Semantic Web)格式如RDF、RDFS、OWL。

??? * Comparative Toxicogenomics Database [http://ctd.mdibl.org/]
CTD是一个公用的数据库,加强了对环境中化学物质对人类健康的理解,整合了GO数据和GO浏览器。使得用户可以理解暴露在化学物质下相关靶标的生物功能、过程和细胞定位。

??? * DynGO [http://gauss.dbb.georgetown.edu/liblab/dyngo.html]
是一个客户端-服务器模式的应用程序,提供了许多高级的功能,除了标准的浏览功能外,DynGO允许用户批量地检索一系列基因和基因产物的GO注释,以及语义检索一系列基因和基因产物所共有的相似GO注释,结果根据GO的等级显示为树状结构,支持许多动态显示的选项如对树节点排序或改变树的方向。对于GO管理者和经常使用GO的用户,DynGO提供了快速和方便的访问GO注释数据。DynGO广泛地应用到有GO术语注释的任意数据集。

??? * EP GO Browser [http://ep.ebi.ac.uk/EP/GO/]
EP GO Browser是EBI的Expression Profiler中的一个组件(Expression Profiler是一个工具集,用于聚类、分析和可视化显示基因表达和其它基因组数据),通过它,你可以搜索GO术语和识别基因相关的节点,以及相应的子节点。

??? * Gene Class Expression [http://gdm.fmrp.usp.br/cgi-bin/gc/upload/upload.pl]
Gene Class Expression允许使用GO数据库对SAGE数据进行功能注释。这个工具对每一个SAGE标签在GO数据库里进行搜索,对选定的GO类别和选定的等级进行关联。这个系统对于映射SAGE数据到GO结构上提供了用户友好的数据导肮和可视化。还对SAGE标签在每一个GO类别里的百分比提供了图形可视化以及置信区间和假设检验。

??? * GeneInfoViz [http://genenet2.utmem.edu/geneinfoviz]
GeneInfoViz 是一个基于web的工具,提供批量检索基因功能信息、可视化GO结构和构建基因相关网络。用户需要提供一个基因列表(格式可为LocusLink ID、UniGeneID、gene symbol、accession number),结果返回功能基因组信息。基于对给定基因的GO注释,GeneInfoViz允许用户以GO的DAG结构显示这些基因,以及在选定的 DAG水平上构建基因相关网络。

??? * GeneOntology at RZPD [http://www.rzpd.de/cgi-bin/asearch/GO/go4rzpd.pl.cgi]
RZPD提供了GO标识符和相关联的UniGene ClusterIDs、Genes(Name/Symbol)、Clones的检索,目前GO注释关联了人和小鼠的基因/克隆。

??? * GenNav [http://mor.nlm.nih.gov/perl/gennav.pl]
检索GO术语和注释的基因产物,提供在GO DAG图中可视化显示GO术语。
?
??? * GOblet [http://goblet.molgen.mpg.de/]
GOblet服务器考虑了GO术语,执行序列(cDNA,蛋白)分析。如相似性搜索(BLAST),在使用已有的GO注释构建的不同物种的数据库的前提下,服务器展示了所有匹配的细节描述以及基于匹配到的GO术语构建GO概要树(summary tree)

??? * GoFish [http://llama.med.harvard.edu/Software.html]
GoFish是在线的java程序,也可以下载到本地运行。允许用户使用GO属性构建任意的布尔检索,对符合条件的基因产物进行排列,GoFish也对每一个基因产物估算其符合布尔查询的概率

??? * GONUTS [http://gowiki.tamu.edu/]
GONUTS是基于wiki的GO术语和少量物种基因关联的浏览器,wiki接口允许用户创建和分享每一个GO术语用法的注解。

??? * MGI GO Browser [http://www.informatics.jax.org/searches/GO_form.shtml]
通过MGI GO Browser可以搜索GO术语和显示所有小鼠基因注释到每一个术语或子术语。也可以浏览本体来观察术语之间的关系、术语定义、对于给定的术语和它的子术语所注释的小鼠基因数量。MGI GO Browser直接访问MGI数据库中的GO数据(每晚更新)。

??? * Ontology Lookup Service [http://www.ebi.ac.uk/ontology-lookup/]
OLS 整合了公开的可用生物医学本体到单一的数据库。所有修正的本体是每天更新的。一个当前加载的本体列表可以在线获得,这个数据库能够通过检索获得单一术语的信息或使用AJAX浏览完整的本体。自动补齐提供一个用户友好的搜索机制。一个基于AJAX的本体显示器可以有效地浏览完整的本体或其子集。一个可编程接口可以通用使用SOAP来检索网络服务。服务由一个WSDL描述器描述,此文件可在线获得。一个简单的java客户端使用SOAP来连接网络服务,可以从 SourceForge上下载到。所有的OLS源代码是公开的,使用Apache许可证发布。OLS提供了一个用户友好的单一入口指向公开可获得的本体(Open Biomedical Ontology格式)。

??? * PANDORA [http://www.pandora.cs.huji.ac.il/]
使用PANDORA可以搜索蛋白的任何非一致集(non-uniform sets)和检测共享独特生物属性的蛋白子集,以及这些集合的交集。PANDORA支持GO注释和额外的关键字(来自于UniProt Knowledgebase, InterPro, ENZYME,SCOP等等)。PANDORA被整合进ProtoNet system,从而允许测试上以万计的自动产生的蛋白家庭。PANDORA已经取代了由同一个团队开发的ProtoGO浏览器。

??? * QuickGO at EBI [http://www.ebi.ac.uk/ego/]
QuickGO是一个GO浏览器,由EBI开发,是InterPro的一个组件,可以搜索GO术语来观察它的相关节点和定义,还可以映射到SWISS-PROT关键词、酶分类,转运分类数据库或者InterPro入口。GO数据每日更新。

??? * TAIR Keyword Browser [http://www.arabidopsis.org/servlets/Search?action=new_search&type=keyword]
搜索和浏览GO、TAIR解剖(Anatomy)、TAIR发育阶段术语(developmental stage terms),允许显示术语的细节及其相关的术语。包括基因、文献、芯片实验和相应术语的或子术语的注释之间的关联。

??? * Tk-GO
这个工具是对BDGP的GO::AppHandle库基本功能的一个GUI包装。GO术语在一个explorer-like浏览器里展示,程序可以通过修改perl脚本来配置。Tk-GO使用的GO数据库(默认直接连接BDGP的数据库)是用户可以修改的。




注释工具:使用GO对基因和基因产物注释的工具

??? * g:Profiler [http://biit.cs.ut.ee/gprofiler]
g:Profiler 是一个公用的web服务器,用于挖掘高通量基因组数据。g:Profiler有一个简单、用户友好的网页接口,对于获取GO、通路或转录结合因子在单个基因水平上的富集等具有强大的可视化功能。除了标准的多重检验校正(multiple testing corrections)外,引进了一个对复杂结构(如GO)进行多重检验的真实效果估算的改良方法。解释基因列表通过一个高效的算法由同一接口支持。其它实用的数据分析通过模块支持。整合进g:Profiler的模块有:g:Convert转换不同数据库的ID,g:Orth找寻不同物种的直向同源基因 (orthologous genes),g:Sorter搜索绝大部分的公用基因表达数据找寻共表达的数据。g:Profiler支持31个不同的物种,数据定期从数据源(如 Ensembl数据库)更新。生物信息学社区希望g:Profiler能支持简单的文本输出。
?
??? * GeneTools [http://www.genetools.microarray.ntnu.no/common/intro.php]
GeneTools 收集了许多基于web的工具,从许多不同的资源里收集信息,提供可用的基因组分析,两个主要的工具连接到这一数据库是NMC注释数据库V2.0和eGOn V2.0。NMC注释数据库V2.0提供了来自于UniGene、EntrezGene、SwissProt和GO的信息。

??? * GOanna [http://agbase.msstate.edu/GOAnna.html]
使用相似性搜索来找寻蛋白的注释,输入可以是一系列的ID或是一系列FASTA格式的序列。如有需要GOanna会检索序列,并对用户指定的数据库进行BLAST搜索。结果包含BLAST搜索到的相似性高的序列的GO注释和序列比对的结果。

??? * GoAnnotator [http://xldb.fc.ul.pt/rebil/tools/goa/]
此工具对从文献里提取的蛋白GO术语注释进行验证。

??? * GOCat:Gene Ontology Categorizer? [http://eagl.unige.ch/GOCat/]
GOCat 是一个自动的文本分类器,此工具归类任意的输入文本(几个词,一篇摘要,一系列的PubMed识别符等等)到GO分类。这个系统目标在于通过文本挖掘方法方便对基因和基因产物进行功能注释。对于每一个的预测类别,提供一个置信打分和一段抽取于输入文本的简短文本。

??? * GoFigure [http://udgenome.ags.udel.edu/gofigure/]
对未知的检索序列通过BLAST来识别其同源的注释,以此来预测其GO注释。DNA或蛋白质序列都允许提交,多重的检索可以通过提交包含FASTA格式的文件来完成。检索到的结果通过email返回给用户,结果显示为图或者是tab分割的文件。结果可以通过tar打包文件下载

??? * GoPubMed [http://gopubmed.org/]
GoPubMed是一个网络服务器,允许用户结合GO探索PubMed搜索结果,GoPubMed提交用户的关键字到PubMed,检索摘要,检测摘要中的GO术语,显示与最初检索结果相关的GO子集,允许用户通过语义浏览和显示相应的文献和它们的GO注释。

??? * GOtcha [http://www.compbio.dundee.ac.uk/Software/GOtcha/gotcha.html]
GOtcha 提供了对于给定的检索序列相关GO术语的预测。每一个术语相对于引用搜索是分数独立(scored independently)和分数校准(scores calibrated)的,以便给出正确性的准确百分比可能性(to give an accurate percentage likelihood of correctness)。

??? * HT-GO-FAT:High Throughput Gene Ontology Functional Annotation Toolkit [http://liru.ars.usda.gov/ht-go-fat.htm]
HT- GO-FAT允许高通量映射未知或其它基因序列如ESTs、mRNA、蛋白数据到GO注释、EC numbers、KEGG通路。它使用序列相似性和结构域匹配。此工具使用自定义的校正数据库以及拥有诸如窗口局域网分布式BLAST(windows LAN distributed BLAST),能够通过窗口局域网分布高通量的BLAST搜索。HT-GO-FAT还拥有高通量的BLAST输出观察器,以及能对匹配度高或人工校正的数据导出为许多的文件格式。数据能导出为AmiGO相关的文件,通路图会高亮显示用户数据集中的酶/基因。
???
??? * InGOt (商业软件) [http://www.inpharmatica.co.uk/ingot/]
InGOt 是Inpharmatica的新模块系统中的一个模块。这个系统用于蛋白注释,是一个应用GO到所有蛋白的一个商业系统。它提供一个无与伦比的资源来阐释蛋白功能:它的图形用户界面让你轻松地从各个链接中跳转,从汇总数据到分层语境(hierachical context)和文献/证据(literature/evidence)。InGOt拥有比公开资源更为丰富的序列和最广泛的GO关联资源。InGOt 可以和其它模块整合,如Domain Professor用于蛋白结构域的细节注释和Blu-Chip用于即时和准确的探测蛋白赋值(protein assignments)。

??? * InterProScan [http://www.ebi.ac.uk/InterProScan/]
蛋白结构域和功能位点数据库对于蛋白功能的预测是一个关键的资源。十年来,许多标识识别(signature-recognition)方法逐步形成来解决不同序列分析问题。产生不同和独立的数据库。由于强调不同的分析方法,这些资源有着各自不同的优点和缺点,各自有着不同的最优应用。从而,为了得到最好的结果,搜索策略必须完美地结合所有的资源。InterProScan是一个基于Perl的程序,它能够结合不同的蛋白标识识别方法到一个资源上。

??? * JAFA:Joint Assembly of Functional Annotations [http://jafa.burnham.org/]
JAFA接收蛋白序列,提交它到数个功能预测程序,并将预测结果聚集到一个单一的、易读的、基于GO术语的文件,用户可以点击各个服务器、AmiGO和QuickGO。JAFA还提供包含所有结果的XML文件下载

??? * Manatee [http://manatee.sourceforge.net/]
Manatee 是基于web的基因评估和基因组注释工具,Manatee能够存储和显示原核和真核基因组注释。Manatee界面允许生物学家快速识别基因以及对其进行高质量的功能赋值(诸如GO分类,使用搜索数据,paralogous家族和由自动分析所产生的注释),Manatee能够下载和安装,运行于CGI网络服务器,比如Apache。

??? * PubSearch [http://pubsearch.org/]
PubSearch是基于web的文本管理工具,允许管理者搜索和注释基因到文献的关键字。它的后端有一个简单的mySQL数据库,PubSearch使用一系列Java伺服小程式和JSPs来完成检索、修改、增加基因、基因注释和文献信息。此工具可以从GMOD上下载到。




用于基因表达/芯片分析的工具

??? * Avadis - gene expression analysis with GO browser (商业软件) [http://avadis.strandgenomics.com/]
Avadis是基因表达数据的数据分析和可视化工具,内置一个显示GO等层的浏览器,许多基因有共同的本体途径(common ontology paths),对基因表达聚类可以通过GO语义进行聚类以识别功能标识(functional signatures)

??? * BiNGO [http://www.psb.ugent.be/cbd/papers/BiNGO/]
开源的java工具,在一个基因集合里确定那个GO类别是统计上过表达(over-represented)的。BinGO以Cytoscape的插件实现,Cytoscape是分子相互作用网络数据整合和可视化的软件平台。BinGO映射给定基因集的主要功能主题到GO等级上,并输出这一映射为 Cytoscape图。

??? * CLENCH:CLuster ENriCHment [http://www.personal.psu.edu/faculty/n/h/nhs109/Clench/]
CLENCH 允许拟南芥(A. Thaliana)研究者从TAIR上执行自动的GO注释检索并计算给定的基因集(相对于参考集)的GO术语富集。在计算富集之前,CLENCH允许把返回的注释映射到GO slim术语表(能够被用户编辑)和本地安装的GO上的任何粗糙水平,

??? * DAVID:Database for Annotation, Visualization and Integrated Discovery [http://david.abcc.ncifcrf.gov/]
基于web的工具,提供由高通量技术产生的基因组水平数据集(诸如表达谱和蛋白组平台)的注释和分析的整合解决方案。分析结果和图形显示保留动态链接到主要的数据库和外部数据仓库,从深度和广度上覆盖数据。DAVID为数据收集到生物意义的转变提供便利,加速了基因组水平数据的分析。

??? * EASE [http://david.niaid.nih.gov/david/ease.htm]
EASE对于一个给定的基因列表概述主要的生物学主题。给定的基因列表来自于表达谱或其它的基因组水平实验,EASE能够快速计算相对于数据集里所有基因每一个统计上可能的过表达GO术语。

??? * eGOn v2.0:explore Gene Ontology [http://www.genetools.no/]
基于web的工具,映射表达谱数据到GO结构上。多个的输入文件能够同时分析以比较两个或多个实验的注释基因的分布。
eGOn V2.0的核心特性:
.可视化:基因注释以GO DAG可视化显示或以表格的形式显示,GO DAG的尺寸能够由用户自由定义。
.过滤:GO注释能够基于evidence codes进行过滤。
.包含用户定义的GO注释:事先加入到NMC注释数据库中。
.统计分析:多个基因列表能够同时分析以比较GO等级上注释基因的分布,统计测验设计成允许用户在两个基因列表之内或之间计算GO注释的不同(dissimilarities)。
.连接注释数据库:连接到NMC注释数据库,基因和蛋白的信息直接由GO DAG或导出的数据提供。
.导出:GO DAG信息、统计结果、基因和蛋白信息能够导出为Excel、text、XML格式。

??? * ermineJ [http://bioinformatics.ubc.ca/ermineJ]
分析表达数据中的基因集(用户定义或通过GO术语定义)的工具。这个软件设计为给只有很少或没有信息学背景的生物学家使用。为想使用ermineJ脚本的用户提供一个命令行接口。实现了多个不同的对基因集的打分方法,不是简单地集中于依赖过分表达(over-representaion)方法上。

??? * FatiGO [http://www.fatigo.org/]
FatiGO对给定的基因集,以代表性的功能信息(低表达或过表达GO术语)对其赋值。通过多重检验纠正(multiple-testing correction)得到统计显著性。FatiGO被设计成在DNA芯片数据分析的上下文里进行功能注释,FatiGO链接到基因表达模式分析套件(Gene Expression Pattern Analysis Suite)里。FatiGO使用主要的基因组和蛋白组数据库(GeneBank, UniProt, Unigene, Ensembl,etc)的基因IDs。FatiGO适用于任何类型的大规模实验进行功能注释。

??? * FIVA:Functional Information Viewer and Analyzer [http://bioinformatics.biol.rug.nl/standalone/fiva/]
FIVA协助原核生物社区的研究者进行转录组分析时快速识别相关生物过程。此软件分析大量基因的功能谱并对影响的生物过程产生一个综合的概述

??? * FuncAssociate [http://llama.med.harvard.edu/cgi/func/funcassociate]
FuncAssociate 是一个基于web的工具,接受一个基因列表作为输入,并返回输入列表中过表达或低表达(over- or under-represented)的GO属性。经过多重假设检验后只有那些统计上具有显著性的过表达或低表达的属性才会被报道。目前有10个物种被支持。除了输入基因列表外,用户还可以指定a)这一列表是否被认为是排序还是乱序的。b)FuncAssociate所认为的总基因(the universe of genes)。c)单独报道过表达或低表达的属性