** Avadis - gene expression analysis with GO browser (商业软件) [http://avadis.strandgenomics.com/]
Avadis是基因表达数据的数据分析和可视化工具,内置一个显示GO等层的浏览器,许多基因有共同的本体途径(common ontology paths),对基因表达聚类可以通过GO语义进行聚类以识别功能标识(functional signatures)
** BiNGO [http://www.psb.ugent.be/cbd/papers/BiNGO/]
开源的java工具,在一个基因集合里确定那个GO类别是统计上过表达(over-represented)的。BinGO以Cytoscape的插件实现,Cytoscape是分子相互作用网络数据整合和可视化的软件平台。BinGO映射给定基因集的主要功能主题到GO等级上,并输出这一映射为Cytoscape图。
** CLENCH:CLuster ENriCHment [http://www.personal.psu.edu/faculty/n/h/nhs109/Clench/]
CLENCH允许拟南芥(A. Thaliana)研究者从TAIR上执行自动的GO注释检索并计算给定的基因集(相对于参考集)的GO术语富集。在计算富集之前,CLENCH允许把返回的注释映射到GO slim术语表(能够被用户编辑)和本地安装的GO上的任何粗糙水平,
** DAVID:Database for Annotation, Visualization and Integrated Discovery [http://david.abcc.ncifcrf.gov/]
基于web的工具,提供由高通量技术产生的基因组水平数据集(诸如表达谱和蛋白组平台)的注释和分析的整合解决方案。分析结果和图形显示保留动态链接到主要的数据库和外部数据仓库,从深度和广度上覆盖数据。DAVID为数据收集到生物意义的转变提供便利,加速了基因组水平数据的分析。
** EASE [http://david.niaid.nih.gov/david/ease.htm]
EASE对于一个给定的基因列表概述主要的生物学主题。给定的基因列表来自于表达谱或其它的基因组水平实验,EASE能够快速计算相对于数据集里所有基因每一个统计上可能的过表达GO术语。
** eGOn v2.0:explore Gene Ontology [http://www.genetools.no/]
基于web的工具,映射表达谱数据到GO结构上。多个的输入文件能够同时分析以比较两个或多个实验的注释基因的分布。
eGOn V2.0的核心特性:
.可视化:基因注释以GO DAG可视化显示或以表格的形式显示,GO DAG的尺寸能够由用户自由定义。
.过滤:GO注释能够基于evidence codes进行过滤。
.包含用户定义的GO注释:事先加入到NMC注释数据库中。
.统计分析:多个基因列表能够同时分析以比较GO等级上注释基因的分布,统计测验设计成允许用户在两个基因列表之内或之间计算GO注释的不同(dissimilarities)。
.连接注释数据库:连接到NMC注释数据库,基因和蛋白的信息直接由GO DAG或导出的数据提供。
.导出:GO DAG信息、统计结果、基因和蛋白信息能够导出为Excel、text、XML格式。
** ermineJ [http://bioinformatics.ubc.ca/ermineJ]
分析表达数据中的基因集(用户定义或通过GO术语定义)的工具。这个软件设计为给只有很少或没有信息学背景的生物学家使用。为想使用ermineJ脚本的用户提供一个命令行接口。实现了多个不同的对基因集的打分方法,不是简单地集中于依赖过分表达(over-representaion)方法上。
** FatiGO [http://www.fatigo.org/]
FatiGO对给定的基因集,以代表性的功能信息(低表达或过表达GO术语)对其赋值。通过多重检验纠正(multiple-testing correction)得到统计显著性。FatiGO被设计成在DNA芯片数据分析的上下文里进行功能注释,FatiGO链接到基因表达模式分析套件(Gene Expression Pattern Analysis Suite)里。FatiGO使用主要的基因组和蛋白组数据库(GeneBank, UniProt, Unigene, Ensembl,etc)的基因IDs。FatiGO适用于任何类型的大规模实验进行功能注释。
** FIVA:Functional Information Viewer and Analyzer [http://bioinformatics.biol.rug.nl/standalone/fiva/]
FIVA协助原核生物社区的研究者进行转录组分析时快速识别相关生物过程。此软件分析大量基因的功能谱并对影响的生物过程产生一个综合的概述
** FuncAssociate [http://llama.med.harvard.edu/cgi/func/funcassociate]
FuncAssociate是一个基于web的工具,接受一个基因列表作为输入,并返回输入列表中过表达或低表达(over- or under-represented)的GO属性。经过多重假设检验后只有那些统计上具有显著性的过表达或低表达的属性才会被报道。目前有10个物种被支持。除了输入基因列表外,用户还可以指定a)这一列表是否被认为是排序还是乱序的。b)FuncAssociate所认为的总基因(the universe of genes)。c)单独报道过表达或低表达的属性,还是两者都报道。d)p-value cutoff值。
新版的FuncAssociate(还处于测试阶段)支持更广泛的基因命名方案,并使用更为频繁更新的GO相关文件(GO associations),然而原来版本的一些特性诸如按LOD排序或查看基因属性表格的选项还没有实现。
** FuncExpression [http://www.barleybase.org/funcexpression.php]
FuncExpression是一个基于web的资源,对大规模的基因组数据进行功能解析。FuncExpression能对植物、动物和真菌的基因列表(从基因组和蛋白组实验中产生)进行功能比较。多个的基因列表能够被分类、比较和可视化显示。FuncExpression支持双通道整合(two way-integration)植物功能信息和基因表达数据,这使得后续的交叉验证(cross-validation)成为可能,交叉验证使用BarleyBase相关实验获得的植物芯片数据。
** FunCluster:FunCluster, Functinal Profiling of Microarray Expression Data [http://corneliu.henegar.info/FunCluster.htm]
FunCluster是一个基因组数据分析工具,设计成对cDNA芯片实验产生的基因表达数据进行功能分析。除了自动对基因表达数据进行功能注释外,FunCluster通过特定设计的共棸类对涉及到的生物注释和基因表达数据进行功能分析,能够检测出共调控的生物过程(注释基因组主题所展示)。FuncCluster的功能分析依赖于GO和KEGG注释,并且只支持三个物种:人(Homo sapiens)、小鼠(Mus musculu)和酿酒酵母(Saccharomyces cerevisiae)。
** FunNet:Functional Analysis of Transcriptional Networks [http://www.funnet.info/]
FunNet设计为一个分析基因共表达网络(由芯片表达数据所构建)的整合工具,此工具的分析模块的实现涉及到两个抽像层:转录(如基因表达谱)和功能(如转录分析所显现的生物学主题)。依赖于GO和KEGG注释的功能分析技术,应用于从基因芯片表达数据中抽提一系列相关生物学主题。多重情况表达(multiple-instance representations)用来关联注释转录本和相关的生物学主题。一个原创(original)的非线性动态模型被用来量化相关基因组主题(genomic themes)上下文的接近度,这一量化基于在基因共表达网络(如在注释主题中捕获转录本的相似的表达谱)中基因组主题的增殖模型(patterns of propagation)。最后,一个非监督的多重情况光谱聚类过程(an unsupervised multiple-instance spectral clustering procedure)被用来探索共表达网络的模块结构,这是通过聚集共表达网络所显示出来的显著性相互关系的生物主题来实现的。提供了共表达网络的功能、转录表达、相关的转录和基因组主题的上下文详细信息。
FunNet提供了基于web的工具以及作为一个标准的R包。标准R实现能够运行在任何能运行R环境的操作系统(windows, Mac OS, 各种Linxu和Unix)上,能够从FunNet网站或者从CRAN的镜像站上下载到。两种实现的FunNet都是使用GPL2.0发布的。
** G-SESAME [http://bioinformatics.clemson.edu/G-SESAME/]
G-SESAME包含了一系列工具,分别是:
1.衡量GO术语语义相似性的工具。
2.衡量基因功能相似性的工具。
3.基于GO术语注释信息聚类基因的工具。
** GARBAN [http://www.garban.org/garban/home.php]
GARBAN是对cDNA芯片和蛋白质组技术产生的数据进行分析和快速功能注释的工具,GARBAN实现为生物信息学工具,以快速比较、分类和图形展示各种数据集(genes/ESTs或proteins),目的在于为病理和药学研究中识别分子标记(molecular markers)提供便利。GARBAN链接到主要的基因组和蛋白质组数据库(Ensembl, GeneBank, UniProt Knowledgebase, InterPro,etc.)并遵循GO委员会的标准进行语义分类。代码是共享的: e-mail garban@ceit.es
** GENECODIS [http://genecodis.dacya.ucm.es/]
GENECODIS是一个基于web的对基因列表进行功能分析的工具,它整合了不同的信息资源来搜索最频繁的共存在基因集的注释,并通过统计显著性排列它们。注释分析来自于不同的数据库如GO,KEGG或SwissProt。
** GeneMerge [http://www.oeb.harvard.edu/hartl/lab/publications/GeneMerge/GeneMerge.html]
GeneMerge对于一个给定的基因集返回功能基因组信息,并提供此基因集里过表达的特定功能或分类的统计秩值(statistical rank scores)。展示了所有的GO类别和功能基因组数据。
** GFINDer: Genome Function INtegrated Discoverer [http://www.medinfopoli.polimi.it/GFINDer/]
GFINDer是一个多重数据库系统(multi-database system)提供了大规模的用户分类的序列标识列表和基因组生物学信息以及列表中不同基因类别的特征生物学功能谱。GFINDer自动从不同的资源检索更新功能分类的注释信息,识别用户分类的基因列表中每个分类的富集类别。并计算每一个类别的统计显著性。而且,GFINDer能够根据挖掘的功能类别对基因进行功能分类并且对这些分类进行统计分析,使得能够更好地解释芯片实验结果。
** GOALIE: Generalized Ontological Algorithmic Logical Invariants Extractor [http://bioinformatics.nyu.edu/Projects/GOALIE/]
GOALIE是用来构建时间序列依赖富集的工具,需要ODBC连接到GO数据库。
** GOArray [http://ycmi.med.yale.edu/gomine]
GOArray是一个Perl程序,输入一系列基因注释为“感兴趣(of interest)”(GOI)或者不感兴趣,并确定相关的GO术语对于GOI是否过表达。一个置换检验(permutation test)是可选的,用来评估结果的可靠性。输出包括了多个可视化图和补充信息以及进一步的参考,还有对所使用的统计方法的概述。
** GOdist [http://basalganglia.huji.ac.il/links.htm]
GOdist是一个Matlab程序,用于分析Affymetrix芯片表达数据,实现了Kolmogorov-Smirnov(KS)连续统计方法。还引入一个两侧超几何分布(two-tailed hypergeometric distribution)使用Fisher exact检验实现了离散方法。GOdist能够检测出芯片基因相关的GO术语相对于不同总体的差别,总体可是是全局芯片总体、分析的GO术语的直接父节点或全局父节点。
** GOHyperGAll [http://faculty.ucr.edu/~tgirke/Documents/R_BioCond/R_BioCondManual.html#go]
检验样本总体基因得到过表达的GO术语,R/BioC函数GOHyperGAll对所有的GO节点进行超几何分布检验计算并返回相应的P值,后续的过滤函数使用默认的或自定义的GO Slim类别执行GO Slim分析,使用此工具必须有基本的R和BioConductor知识。
** GoMiner and MatchMiner [http://discover.nci.nih.gov/gominer/htgm.jsp]
High-Throughput GoMiner是一个工业级别的整合GO工具,用于解析多芯片实验。GOMiner是基于Java的程序包,对感兴趣的基因(如芯片实验里上调或下调基因)在GO的上下文里进行生物学解析。GoMiner提供定量和统计的输出文件和两个有用的可视化文件:(i)树状结构类似于AmiGO浏览器里所显示的(ii)一个压缩的,动态交互的DAG。GoMiner所展示的基因链接到主要的公开生物信息学资源。一个陪伴工具(companion)MatchMiner用于做前处理,为GoMiner或其它的GO工具的输入获取基因名称,提供了一个自动化脚本以便于安装本地化的数据库。
** GOstat [http://gostat.wehi.edu.au/]
GOstat是一个易于使用的web工具,用于确定基因列表中过表达或低表达的GO类别的统计显著性。数据每月更新。
** GoSurfer [http://biosun1.harvard.edu/complab/gosurfer/]
GoSurfer在分析基因集(来自于基因组范围的计算、芯片分析或其它相应的高端方法)时使用GO信息,GoSurfer包含了严格的统计检验,交互的图形和自动更新注释信息(基因标识符(UniGene,LocusLink)或Affymetrix探针集)。
** GO Term Finder [http://search.cpan.org/dist/GO-TermFinder/]
GO Term Finder对给定基因列表的基因产物的GO术语或其父节点作显著性的分析。Saccharomyces Genome Database 实现了一个基于web的GO Term Finder用于为出芽酵母基因产物搜索注释。一个通用的GO Term Finder由Standford Microarray Database创建,可以从CPAN下载到。这个代码被普林斯顿基因组研究组(Princeton genomics group)用于创建基于web的通用GO Term Finder,通过该web工具提供了分析GO站点上所公开的有GO注释的任何种属(包括人)的基因。
** GOTM:Gene Ontology Tree Machine [http://bioinfo.vanderbilt.edu/gotm/]
GOTM是一个基于web的工具,基于GO等级结构分析和显示感兴趣的基因集。这个工具提供了用户友好的数据导航和可视化。产生可扩展的树用于浏览GO等级结构,以HTML的形式生成固定的树用于对不同注释水平进行归档并生成柱状图,GOTM提供统计分析以显示GO类别和相对富集的基因数目以及暗示(suggest)了进一步研究的生物领域。富集的GO类别能够以子树或DAGs的形式展示。基因的子集能够检索GO术语或进行关键字搜索。每一个基因的细节信息能够直接从GeneKeyDB里检索到。
** GOToolBox [http://gin.univ-mrs.fr/GOToolBox/]
GOToolBox是一系列基于web的程序,允许从一个基因集(相对于被检索的参考基因集)识别统计上过表达或低表达的术语、基因集里对功能相关的基因进行聚类和检索基因集里共享的注释。GO注释能够限制在GO slim等级上或者是给定的GO术语水平上,而且术语可以使用evidence codes进行过滤。GO和基因关联文件每月更新。
** L2L [http://depts.washington.edu/l2l/]
L2L是一个简单但功能强大的工具,用于发现芯片数据中隐藏的生物学显著性,通过易于使用的web界面,L2L挖掘GO术语显著富集的上调或下调的基因,L2L还将基因列表与数据库中上以千计的芯片实验作比较,以识别共有的基因调控模式。此工具可以下载到一个命令行的版本,可以自定义运行或者批量分析。
** Machaon Clustering and Validation Environment [https://www.cs.tcd.ie/Nadia.Bolshakova/Machaon.html]
Machaon Clustering and Validation Environment是一个聚类验证的工具,将样本或基因按相似的基因表达模式进行分类并评估聚类的质量。在基因表达数据分析中GO术语用于衡量基因间的相似性(生物学距离)以支持生物医学知识发现(biomedical knowledge discovery)。
** MAPPFinder [http://www.genmapp.org/MAPPFinder.html]
MAPPFinder是GenMAPP的辅助程序。这个程序允许用户检索任何存在的,相对于GO基因相关和GenMAPP芯片通路谱(MAPPs, microarray pathway profiles)的表达谱数据标准。分析产生的结果能够通过选择感兴趣的术语或MAPPs直接以GO等级或在GenMAPP中展示出来。
** Onto-Compare [http://vortex.cs.wayne.edu/projects.htm#Onto-Compare]
Onto-Compare是一个基于web的工具,可以基于GO对商业芯片进行比较。Onto-Compare允许用户对每一个芯片做功能偏好性评估并确定对于某个特定生物学现象(由GO术语描述)最好的芯片。
** Onto-Design [http://vortex.cs.wayne.edu/projects.htm#Onto-Design]
Onto-Design允许用户设计定制芯片,通过选择一系列UniGene cluster IDs,这些IDs代表了一个给定的生物过程子集(使用GO术语描述)。
** Onto-Express [http://vortex.cs.wayne.edu/projects.htm#Onto-Express]
Onto-Express搜索公共数据库并返回一系列表格,包换相关表达谱、基因细胞发生定位(cytogenetic gene locations)、生物医学和分子功能、生物过程、细胞组分和翻译的蛋白的细胞功能。
** Onto-Miner [http://vortex.cs.wayne.edu/projects.htm#Onto-Miner]
Onto-Miner允许用户通过clone ID, UniGene gene symbol, LocusLink ID, accession number等搜索不同的公开生物信息学数据库,允许使用基因列表进行批量检索。第三方开发者可以把这个站点作为资源,提供对于任意的基因列表的详细基因信息。
?? * Onto-Translate [http://vortex.cs.wayne.edu/projects.htm#Onto-Translate]
Onto-Translate是基于web的工具,允许用户对下列ID进行快速转换:accessions IDs, Unigene cluster IDs 和Affymetrix probe IDs。Onto-Translate使用不同的数据库并降低任意基因列表的冗余,帮助识别相同的信息。
** OntoGate [http://functionalgenomics.de/ontogate/]
OntoGate提供使用GO术语和与GO术语相关的外部数据库进入GenomeMatrix(GM)的入口,以找寻GM中不同物种的基因,这些基因能到映射到GO术语上。OntoGate包含了对相应注释基因的氨基酸序列进行BLAST搜索。
** Ontologizer [http://www.charite.de/ch/medgen/ontologizer/]
Ontologizer能够对一组或多组基因或基因产物产生相应 的GO注释,并根据每一个聚类的使用频率进行排列,以HTML或XML格式显示。如果提供了总体的数据集,程序会对每一个GO术语执行过表达的统计分析。产生“Dot"(GraphViz)文件对过表达的GO术语提供图形化概述。提供了每一个基因的详细列表。
** Ontology Traverser [http://franklin.imgen.bcm.tmc.edu/rho/services/index.jsp?page=OntologyTraverser]
Ontology Traverser是芯片基因列表富集工具,此工具为一些cDNA芯片和相对于芯片类型所使用的所有探针/克隆集列表提供了简单的上传格式,接收AffyIDs和NIAIDs。支持许多报告格式:flat html,flat tsv, xml和展示GO结构的动态可点击HTML。对每一个GO节点报告不同的统计/结果:列表fq, 芯片fq, fold change,? Fisher's exact test P值和基因的映射到的节点或子节点的标识。
** Probe Explorer [http://probeexplorer.cicancer.org/]
Probe Explorer是一个开放使用的基于web的生物信息学程序,显示芯片寡核苷酸探针和在基因组上下文中的转录本的关联,此软件很灵活,可以简单地作为基因组和转录组的浏览器。提供了15种后生动物(metazoa)和两种酵母提供基因组实体(genomic entities)(位点, 外显子, 转录本)的序列和对等物包括矢量图输出。序列比对工具用来建立Affymetrix芯片探针序列和转录组(人,小鼠,大鼠和酵母)之间的关联。提供使用任何的DNA或蛋白序列进行关键字搜索、用户搜索和在基因组上进行比对。
** ProfCom: ProfCom, Profiling of Complex Functionality [http://webclu.bio.wzw.tum.de/profcom/]
ProfCom是基于web的工具,用于对实验相关的基因列表进行功能解释。使得ProfCom成为独特工具的一个特征是除了GO术语外还可以使用复杂函数(complex function)进行富集分析。复杂函数由可用的GO术语的布尔组合构建。ProfCom对复杂函数作推断能够更加特异地比较单个的术语并更为准确地描述基因的功能。
** SeqExpress [http://www.seqexpress.com/]
SeqExpress是一个综合的分析和可视化软件包,用于基因表达实验。组合了特定开发的技术和通用的统计学方法,GO被用来对聚类的功能富集进行打分。这些结果能够在内嵌的浏览工具或通过通过网页进行浏览。SeqExpress还支持许多数据转换,投影(projection),可视化显示,文件输入/输出,搜索,与R整合,和聚类等选项。
** SerbGO [http://estbioinfo.stat.ub.es/apli/serbgo/]
SerbGO是基于web的工具,帮助研究者确定那一个基因芯片分析工具、GO语义分析工具适合他们的项目。SerbGO是一个双向(bidirectional)程序。用户能通过检索表单索要感兴趣的工具的特性,用户还能比较每一个工具所实现的特性。
** SOURCE [http://source.stanford.edu/]
SOURCE编辑来自多个公开访问的数据库(包括UniGene, dbEST, UniProt Knowledgebase, GeneMap99, RHdb, GeneCards和LocusLink)的信息,SOURCE使用的GO术语与LocusLink相关。
** Spotfire Gene Ontology Advantage Application (商业软件) [http://www.spotfire.com/services/advantage.asp]
Spotfire Gene Ontology Advantage Application整合GO注释和基因表达分析。研究者在DecisionSite里可视化地选择一个子集的基因,软件展示了基因的GO等级分布。类似地,在GO等级里选择任何的过程、功能或细胞定位可以在DecisionSite里可视化地显示其相应的基因。
** STEM: Short Time-series Expression Miner [http://www.cs.cmu.edu/~jernst/stem/]
STEM是一个Java程序,用于聚类、比较和可视化短时间序列的基因表达数据(少于或等于8个时间点)。STEM允许研究者识别显著性的时间表达谱和与这些表达谱相关的基因,并比较不同条件下这些基因的行为。STEM完整地整合了GO数据库,并支持对具有相同的时间表达谱的基因集做GO类别富集分析。STEM还支持对特定GO类别的基因行为进行简易的识别和可视化,识别在这些基因中那些时间表达谱被富集。
** T-Profiler [http://www.t-profiler.org/]
T-Profiler使用t检验对预定义的基因集的平均活性改变进行打分。基因集分别基于GO类别、ChIP-chip实验、上游与相应的转录因子结合模体匹配、在相同染色体上的定位进行定义。一个大折刀(jack-knife)过程使得计算比其它软件要更为稳健。T-Profiler使得对芯片数据进行解析以直观和严格统计成为可能,而不需要结合实验或者选择参数。
** THEA:Tools for High-throughput Experiments Analysis [http://thea.unice.fr/index-en.html]
THEA是一个整合的信息处理系统,用于分析后基因组数据。可以自动化进行数据(由通过选择的生物学信息包括GO进行分类)注释。用户可以对这些注释手动搜索和浏览,或根据统计标准(数据挖掘)产生有意义的概述。
评论