注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

云之南

风声,雨声,读书声,声声入耳;家事,国事,天下事,事事关心

 
 
 

日志

 
 
关于我

专业背景:计算机科学 研究方向与兴趣: JavaEE-Web软件开发, 生物信息学, 数据挖掘与机器学习, 智能信息系统 目前工作: 基因组, 转录组, NGS高通量数据分析, 生物数据挖掘, 植物系统发育和比较进化基因组学

网易考拉推荐

4-1生物信息学常用软件及其使用  

2010-12-21 11:22:10|  分类: 生物信息学 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
4-1生物信息学常用软件及其使用

 

一、生物信息学软件简介

(一)分类

?单机分析软件,如:winplas

?在线分析软件, 如:webcutter

?生物学数据库,如:NCBI, DDBJ, EBI

(二)意义

1.分析和处理实验数据和公共数据,加快研究进度,缩短科研时间。

2.提示、指导、替代实验操作,利用对实验数据的分析所得的结论设计下一阶段的实验。

3.用计算机管理实验数据。

(三)常用功能(核酸类)

DNA 序列片断拼接----Contig Express

DNA序列测定图谱分析

分析mRNA开放读框

限制性酶切位点分析

DNA 模拟电泳

PCR 引物设计

RNA二级结构分析

常用功能(蛋白质类)

蛋白质一级结构分析(氨基酸分析)

蛋白质二级结构分析(结构域分析)

蛋白质三级结构分析(空间结构分析)

常用功能(共同类)

DNA、蛋白质序列同源分析

进化树构建

常用功能(其它类)

质粒绘图类

图象处理软件

二、DNA 序列片断拼接(电子基因克隆)

?获得感兴趣的EST,在dbEST数据库中找出EST的最有途径是寻找同源序列,标准:长度≥100bp,同源性50%以上、85%以下。

?然后将检出序列组装为重叠群(contig),以此重叠群为被检序列,重复进行BLAST检索与序列组装,延伸重叠样系列,重复以上过程,直到没有更多的重叠EST检出或者说重叠群序列不能继续延伸,有时可获得全长的基因编码序列。

?再与GeneBank核酸数据库进行相似性检测,假如有精确匹配基因,将EST序列数据据EST六种阅读框翻译成蛋白质,接着与蛋白质序列数据库进行比较分析。

Vector NTI 5.2 中的contig Express

Contig Express软件:

Sequencer软件:

ftp://genecodes.com/pub/SequencherPC.zip

举例说明使用 image

三、DNA序列测定图谱分析

Chromas软件: http://www.technelysium.com.au/chromas230.exe 

image image

四、限制性核酸内切酶位点的分析

(一)定义:

限制性核酸内切酶(restriction endonuclease)

识别DNA的特异序列,并在识别位点或其周围切割双链DNA的一类内切酶。即一类能识别双链DNA分子中特异核苷酸序列的DNA水解酶。

是细菌内存在的保护性酶。分为I、II、III三类。

其中的II类限制性核酸内切酶是重组DNA技术中的重要工具酶。

II类酶识别序列特点为回文结构,大多为 4~6 bp 回文结构(palindrome sequence),

如EcoRI 识别序列:

n5’GAATTC 3’ 5’GGATCC 3’
3’CTTAAG 5’ 3’CCTAGG 5’

image

限制性核酸内切酶命名

?Smith和Nathame命名原则(1973)
属名 + 种名 + 株名 + 流水

例如: 流感噬血杆菌d株
(Haemophilus influengae d)
Hind Ⅰ
Hind Ⅱ

Hind Ⅲ

Hind Ⅳ

image

常用的限制性核酸内切酶酶切序列

限制酶 识别序列及切口 限制酶 识别序列及切口
Alu Ⅰ AG/CT Hind Ⅲ A/AGCTT
TC/GA TTCGA/A
BamHⅠ G/GATCC SalⅠ G/TCGAC
CCGAG/G CAGCT/G
BglⅠ A/GATCT SmaⅠ CCC/GGG
TCTAG/A GGG/CCC
EcoRⅠ G/AATTC
CTTAA/G

image
image image

(二)分析步骤:

利用Vector NTI软件:

http://register.informaxinc.com/solutions/

vectornti/molecular_viewer.html

该软件输入文件格式广泛,除了molecule documents (.gb) 是该公司本身文件格式外,还能识别各种数据库应用格式软件:EMBL,GenBank,FASTA,Sequence files. 可以查找特定序列,ORF(可以设置相关参数),描述载体、限制酶位点、一些功能序列和附注。整个界面由文本、图形和序列三部分构成,而且点击任意的序列、RE、基因,图形和序列均会自动标记到相应位置,非常直观方便。 载体可以圆形表示也可以线形表示。 还可进行核酸到蛋白的翻译等功能。

利用webcutter 2.0在线免费软件分析:

http://www.firstmarket.com/cutter/cut2.html

或:

http://www.ccsi.com/firstmarket/cutter

image

DNAStar、DNAClub、DNATool 等其他商业软件均能分析。
以DNAClub为例说明。

image image

五、PCR 引物设计(包括杂交探针设计)

(一)引物设计的原则

1.引物要跟模板紧密结合;

2.引物与引物之间不能有稳定的二聚体或发夹结构存在;

3.引物不能在别的非目的位点引起高效DNA聚合反应(即错配)。

(二)引物设计需要考虑的因素

?引物长度(primer length),

?产物长度(product length),

?序列Tm值 (melting temperature),

?ΔG值(internal stability),

?引物二聚体及发夹结构(duplex formation and hairpin),

?错误引发位点(false priming site),

?引物及产物GC含量(composition),有时还要对引物进行修饰,如增加限制酶切点,引进突变等。

(三)引物设计要点

?一般引物的长度为16-23bp,常用的长度为18-21bp,过长或过短都不合适。

?引物3’端的碱基一般不用A,因为A在错误引发位点的引发效率相对比较高,而其它三种碱基的错误引发效率相对小一些。

?引物的GC含量一般为45-55%,过高或过低都不利于引发反应。上下游引物的GC含量不能相差太大。

?引物所对应模板序列的Tm值最好在72℃左右,当然由于模板序列本身的组成决定其Tm值可能偏低或偏高,可根据具体情况灵活运用。

?ΔG值反映了引物与模板结合的强弱程度,也是一个重要的引物评价指标。

?一般情况下,在Oligo 5.0软件的ΔG值窗口中,引物的ΔG值最好呈正弦曲线形状,即5’端和中间部分ΔG值较高,而3’端ΔG值相对较低,且不要超过9(ΔG值为负值,这里取绝对值),如此则有利于正确引发反应而可防止错误引发。

?其原理,引物与模板应具有较高的结合能量,这样有利于引物与模板序列的整合,因此5’端与中间段的ΔG值应较高,而3’端ΔG值影响DNA聚合酶对模板DNA的解链,过高则不利于这一步骤。

?可能的错误引发位点决定于引物序列组成与模板序列组成的相似性,相似性高则错误引发率高,错误引发的引发率一般不要高过100,最好没有错误引发位点,如此可以保证不出非目的产物的假带。

?引物二聚体及发夹结构的能量一般不要超过4.5,否则容易产生引物二聚体带,且会降低引物浓度从而导致PCR正常反应不能进行。

?对引物的修饰一般是增加酶切位点,应参考载体的限制酶识别序列确定,常常对上下游引物修饰的序列选用不同限制酶的识别序列,以有利于以后的工作。

(四)、引物设计软件的使用

?推荐使用自动搜索软件(商业软件): Primer Premier 5.0

?推荐使用引物评价软件(商业软件) : Oligo 6

其网址: http://www.oligo.net

image

 image

?设计引物的免费在线软件Primer3,其网址:

http://www-genome.wi.mit.edu/cgi-bin/primer/primer3.cgi

或http://frodo.wi.mit.edu/cgi-bin/primer3/primer3_www.cgi

我的评价:

是非常优秀的设计引物的软件!

是真正的“免费的午餐”!


image image

Winplas (商业软件)

pDRAW32软件(商业软件),其网址:

http://hjem.get2net.dk/acaclone,可以看到演示版和有关信息

Vector NTI (商业软件)

image

image

Plasmid processor

其免费下载的网址

http://www.hytti.uku.fi/%7Eoikari/plasmid.html

?DMUP beta

其免费下载的网址

http://biosoft.im.ac.cn/down/dmup.zip

Plasmid processor质粒作图软件是压缩软件,需要先将其解压到一个目录下(不需安装即可直接应

用),然后才能应用。(压缩文件是网络传输的最常用文件,目的是为了传输

方便);

1)在资源管理器中双击Plasmid.exe 文件(553kb),进入作图的界面;

2)点file-->new,在出来的对话框中填上Plasmid name和length,比如分别填

pBR322和4322(bp)(注意不能填4.322kb,否则软件不认识)。点击OK,进入

下一个界面,上面是一个圆,标着pBR322和4322bp。

3)点-->date-->restriction site加酶切位点,填酶的名称及定位;

4)点Date-->multiple-->Genes,填基因名称(如E6),位点在500至890处,

还是在此对话框中,选择右下角的style选所加基因的格式是箭头还是长的圆

弧等格式(根据喜好),选厚薄度(thichness),然后点击此对话框右上部分

的Add Gene,,在点击done,于是基因就加上了。基因和酶切位点可反复加多次。

5)但本软件缺陷之处上多克隆位点不能直接加,只能通过点-->date-->
restriction site加酶切位点,在此对话框中加多克隆酶切位点(如加HinIII,
EcoRI,BstI时,点-->date-->restriction site加酶切位点,出现对话框后,
HinIII,location比如填1,-->Add site; EcorI填3,-->Add site; Bst填5-->
Add site;然后点击OK.在圆上将位点1~5处用鼠标往旁边分别一拖,就可看见这三个位点了。

七、进化树分析软件

MEGA3.0:免费分子进化遗传分析软件

http://www.megasoftware.net

Vector NTI:商业软件

Vector NTI Suit 同源比较—主窗口

image

image

随着人类基因组计划的开展,争夺有限基因资源的竞争日益激烈,利用网上软件分析未知序列,迅速得到尽可能多的信息显得尤为重要。仅仅在几年前,网上只零散地分布着一些功能简单的小程序用于新基因的鉴别,现在这些软件有了长足的发展。

目前,在国际上,一些优秀的软件根据功能归类被集中在一个网页上,极大地方便了使用。 http://bioinformatics.weizamann.ac.il/gdp/gdp.html

在国内,很多生物信息学软件来源信息(包括不少免费下载的软件)都可以生物软件网上获得。

http://www.bio-soft.net

http://biosoft.im.ac.cn

 
  评论这张
 
阅读(5078)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2016