注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

云之南

风声,雨声,读书声,声声入耳;家事,国事,天下事,事事关心

 
 
 

日志

 
 
关于我

专业背景:计算机科学 研究方向与兴趣: JavaEE-Web软件开发, 生物信息学, 数据挖掘与机器学习, 智能信息系统 目前工作: 基因组, 转录组, NGS高通量数据分析, 生物数据挖掘, 植物系统发育和比较进化基因组学

网易考拉推荐

老鼠基因表达数据库  

2009-12-08 14:07:09|  分类: 生信数据库 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

老鼠基因表达数据库

摘要 
老鼠基因表达数据库是实验室老鼠的基因表达信息资源。结合不同类型的表达数据,GXD的目标是提供日益增加的在不同的老鼠种及变种中的基因表达信息,从而使得我们有能力去洞察疾病发生的分子变化。GXD与老鼠基因组数据库MGD紧密相连。广大的网络序列数据库和其他的物种数据库的发展和使用,扩展GXD用于基因表达信息的分析的效用. GXD 可从以下网址打开 http://www.informatics.jax.org/ 或者http://www.informatics.jax.org/menus/expression_menu.shtml .

介绍 
在生物医学领域实验室老鼠已经成为一种关键的模式动物,因为它更加接近于人而且更利于进行遗传和分子水平分析。来自于很多的老鼠变异或损伤的组织,和从全部成长发育到成年阶段的组织,更易进行表达分析。过去常常用于发现基因产物的不同方法,在敏感性和空间决定里变化并且表现清楚和补充的表达信息。GXD已经作为能结合表示数据的很多不同的类型的一个没有固定限度的系统而被设计,例如RNA原位杂交,RT-PCRcDNA源和阵列数据(1-5) 因此,随着数据积累,GXD 能提供越来越那种基因产生哪些副本和蛋白质的完整信息;在哪里,什么时候和在什么数量方面这些种基因产物被表达;并且表示在不同的老鼠品种和变种方面发生怎样的变化。与我们的爱丁堡同事合作使得来于分析报告的表达模式,用标准化并且使用结合多级结构形式描述用不同空间分辨率研究的老鼠解剖结构,使原先的表示数据的图像数字化与各自的表达记录有关系。 GXD被和MGD结合起来使基因型,表达和显性信息的组合分析成为可能,并且有广泛的与其他资源的联系,例如序列数据库,OMIM,来自其他种类的联机医学文件分析检索系统和数据库。

GXD在被Sybase相关的数据库管理体制里实现。从19987月起一直可提供在线,一日一更新。对数据的进入被主要通过网上的质问形式提供。对通过直接SQL进入感兴趣的用户可设置一个SQL 账户以接触MGI的用户支持(如下)GXD和互联网质问接口已经比以前被更详细描述。这里,我们从用户视角来说明GXD的新近提高,可以通过不同质问形式来查询一个问题。

基因表达数据库索引

使用GXD索引,一个人从具体的分析类型或者参数的任何结合中,能迅速鉴定包含内生发展的基因,老鼠生长的特定日期的具体基因信息。其他的查询领域通过书目信息(作者,杂志,年),和各自的文摘中的词(划线) 提供。我们继续保持GXD索引的最新。从1993到目前的全部有关的杂志文章和从1990到目前来自核心发展杂志的文章均被索引。自2000928日起,索引包括17 401个条目(包括5635参考文献和3837种基因表达信息)

基因表达数据查询形式

基因表达数据查问形式提供进入来自RNA 原位杂交,RT-PCRRNase 保护实验等数据的途径。使用复合式搜寻,一个人能问越来越复杂的表达问题,例如:'在哪些解剖结构和/或在部位有一特定的基因还是一套被指定的基因?基因识别/不在一给定组织内发现什么和/或在一个特殊发展的时期使用一套指定的表达分析?由于解剖学字典的等级结构,空间查询能包含解剖的基础或者上层建筑。更进一步讲,基因的表达与染色体位置的关系,通过对特别是与相关靶向基因的查询进行联系也是可能的。染色体的位置的查询能力已经十分精确。现在在指定的位点之间或者在来自一个遗传学位点的一段指定的距离内去寻找位于特别的染色体的基因是可能的。最有意义的基因表达数据库查询形式是我们也可以查找那些在一个生物学功能中的基因产物扮演着一个特殊的“分子学功能”的小分子物质;或者是属于被定义的细胞组件。作为一基因存在论计划的成员,我们参加了为这3个种类和在我们的数据库里把有关的条件分配给基因中的建造共享控制词汇。增加的这些搜索参数使重要新的查询能够象“在老鼠生长发育11.5-15天的时间内是什么转录因子进行了表达?”还是“什么涉及已经被在分支里发现apoptosis基因?”并且提高储存在GXD里的表达数据的效用。

老鼠解剖学字典浏览器

老鼠解剖学字典浏览器作为驾驭大量字典阶层不同发展舞台的一种新工具,在更多层次上可以找到具体的解剖结构并且查与那些结构相关的表示结果(1)。因此,当如上所述的基因表达数据查询形式使强有力的组合实的查询(包括解剖的结构)成为可能时,解剖学浏览器让用户从发育解剖学的观点上更直接的看基因表达数据。应当指出Theiler23-26 阶段是最近刚被增加但仍然欠发展的一部分。迄今,只是限制这些老鼠发育阶段的表达数据已被提交。  


cDNA克隆查询形式

这个查询形式是为调查从cDNA源数据得到的表达信息而设计的。它允许可以问象“哪个组织还是细胞中有被孤立的cDNAs”或者“根据cDNA源信息定位于染色体的一个特别位值的基因”,在特定组织中表达。现在cDNA克隆查询形式以基因表达数据查询形式为基因学分类和染色体的定位提供相同的查询能力。为使这些为cDNA源数据的新查询参数分析有意义,我们改进了往我们的数据库里分配cDNA克隆体和推定的ESTs的手段。在每日更新的基础上,GXD MGD建立和提供DDBJ / EMBL / Genbank 的连接在MGI中的基因的数据入口。在与SWISS-PROT的一次进行中的合作里,我们将更进一步的保持连接在得到的有参考性的核苷酸序列,并可交叉使用那些基因和蛋白质的连接入口。基于我们的助理基因/核苷酸序列链,并与NCBI UniGene计划合作,将可得到在cDNA 克隆/ESTs和关键基因之间的推定的连接。通过传递性,这些连接可以提供各自的cDNAs的染色体位置、分子功能、生物学过程(推定)和合适细胞组件的信息。

电子数据提交:基因表达笔记本
GXD管理者继续注释来自这些文献的表达数据。不过,从文献中抽出数据,将它们称为标准化的形式是一个时间的问题。更进一步,标准出版物只通常包括作者那些得出的数据一小部分。因此,GXD为分析这些表达数据的团体提供的一种已经概念化的电子框架。为了使电子提交变得容易,我们已经开始发展这个GEN。它被用作储存表达结果、图像、分子探针、样品、实验条件等等的一个实验室笔记本。在微软公司ExcelTM 实现,易于使用,并且在Macintosh PC 平台上就可以定制。 GEN以前已经被更详细描述。在去年,我们已经基于许多试验实验室的反馈将它优化,并且发展它成为现在能被更多地人使用的一件工具。对想获得GEN的使用者可以从这里得到 gen@informatics.jax.org.我们欢迎反馈和数据提交。数据提交将收到可以被在出版物里引用的增加的数目GEN主要是为在一个基因通过基因的基础上传统的研究表达的实验室而设计的。我们也正在与一种高研究量的老鼠表达数据的研究组合作。那些实验室通常从我们能大批量的下载数据的数据库里来维持他们自己的实验室。

未来方向 

GXD将继续通过实验室和出版商获得来自出版物和实验工作的表达数据,得的表示数据并且与合作通过电子提交获得更多的数据。数据库将被扩大包括阵列表示实验室老鼠的数据。显而易见, GXD 能通过整合这些数据和表示数据的其他类型来给这些数据增加相当多的价值,并且,通过联用MGD,以及老鼠突变和异形的遗传学和显性数据。为了提供一种丰富并且不断改进的基因表达信息分析的框架,我们将继续在词汇和连接方面与外来资源和其它人协作。最终,GXD将加上3 D图集/图表表示的老鼠生长的基因表达数据库,我们爱丁堡同事的工作进展,使得解剖学的3 D图表存储和分析以及表达数据的及时分析成为可能。

使用支持

GXD通过在线的服务支持用户。用户服务电话(+1 207 288 6445), 传真 (+1 207 288 6132) or 电子邮件 (mgi-help@informatics.jax.org ).


GXD使用举例

如果引用数据库,请引用这篇文章。为参考具体的GXD 数据,我们建议下列形式:这些数据被从 GXD中重新找到,老鼠基因组信息学,杰克逊实验室,酒吧海港,缅因,美国,万维网(http://www.informatics.jax.org)[键入你重新引用的数据的日期(年、月)]

辅助资料

可以通过NAR Online招到辅助资料



 

 






基因组在线分析数据库:世界范围内基因组计划的监视器

摘要基因组在线分析数据库是用来访问查询世界范围内的完成和进行中的基因组计划有关信息的一种综合资源信息库。数据库目前提供关于350项基因组计划的信息,其中48种已经被完全测定序列并进行了分析。基因组在线分析数据库1997年被建立,从20004月起它已经被批准到统一的基因组学。数据库可以通过URL免费得到: http://igweb.integratedgenomics.com/GOLD/

介绍

1995年是生物学方面标志一个新时代的的一年。在那年,一个可自主生活的生物体,Haemophilus influenzae的完整DNA序列测序完成,虽然18年前一个噬菌体(X174噬菌体)的完整基因序列就已经被完全测定。从1995年起,超过30种基因组被完全测序并且被公布,包括3 种真核生物,6 archaeal 26种细菌。这些测序工作中的每一个都建立在全世界范围的研究所和大学大量分析和研究基础上进行。在许多情况下,测序结果是通过因特网的数据库免费提供给公众,例如WIT (http://wit.integratedgenomics.com/IGwit/) (4), KEGG (http://www.genome.ad.jp/kegg/kegg2.html ) (5), GeneQuiz (http://www.sander.ebi.ac.uk/gqsrv/submit/ ) (6) and MIPS (http://www.mips.biochem.mpg.de/) (7).

  数据库的范围

研究人员经常面临不很容易获得足够信息的问题,或者不易知道在他们领域的新发展和现有数据。无可争辩的,基因组学作为当今生物学发展最迅速领域之一,在过去的五年中实际的测序工作也在呈指数增加。对应这个发展的是日益增多用来探究和分析这些数据的数据库的数量。测序费用的下降和测序技术的改进已经使得全世界有可能作大量的测序工作测序工作的发展迫切需要建造和保持一个资源库,为每一项基因组计划进行信息监控并且展示提供有关的信息。

历史和发展

基因组在线分析数据库在1997年开始商业运作,它可以搜集并提供目前所有已经公布的基因组计划的信息。起初,基因组在线分析数据库主要提供六种完全测序的基因组信息和一些正在进行的基因组计划的相关信息。现在,基因组在线分析数据库提供服务于350种基因组计划的197个基因组测序中心的信息和74个基金提供中介的信息,其中的48种的基因组已经被完成测序,其相关分析也被公布。基因组在线分析数据库也对进行中的176种原核和126种真核生物基因组计划进行报道,另外,这个数据库还提供超过3200种的超文本链接。

数据库入口

通过综合的基因组学网站的服务器,基因组在线分析数据库的入口很容易得到: http://igweb.integratedgenomics.com/GOLD/.用户直接进入数据库的工作平台,这里包括完全测序并发布的基因组和正在进行中的原核与真核的基因计划。他们也能使用搜寻形式来询问关于一项基因组计划具体的特征或者相关信息。对于基因组在线分析数据库的批评指正,建议和反馈都是非常受欢迎的。

数据库格式

基因组在线分析数据库目前被按照一套ASCII码文件制作。每一个被报道的基因组信息被归纳进具体的领域并被记录各种各样的数据:生物体名字(生物体),一个生物体()的进化地位,一个生物体的一般信息(信息),基因组的大小、被预言的(尺寸)的数量。另外,对象基因序列那样的实际数据有超链接途径,可以看到关于ORFs和功能的目录,已经完成或者正在完成生物体测序的机构和为测序计划提供资金的中介机构(为提供资基因组在线分析数据库)。这里还有提供给为特别基因进行在线分析的其他数据库(基因数据库)的友情连接。最后,进行中的测序计划进展状况和完成的基因组测序的相关参考也被报道提供。

数据库搜索引擎

20003月起,已经考虑呈现一个相关的模型到如上所述标引的领域。一台基于文本的关系数据库的引擎被使用Perl脚本语言创造。这种引擎能解决任何在基因组在线分析数据库里的句子查询语言(SQL)的陈述和展示的索引。在这代引擎之前,一项计划是去从以前的基因组在线分析数据库中函选出尽可能多的数据,然后,手工完成分析处理。这个过程消除数据的重复并且规范贮存、展示表格及内容的形式。目前的基因组在线分析数据库接口,以计算机图形接口建造,允许一个用户输入质问并且得到结果。一旦输入被得到,计算机图形接口建造一个结构化查询语句并且送它到搜索引擎。计算机图形接口然后从搜索引擎中用超文本

  评论这张
 
阅读(519)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2016