查看详情
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

云之南

风声,雨声,读书声,声声入耳;家事,国事,天下事,事事关心

 
 
 
 
 
 
博友列表加载中...
 
 
 
 
 
 
 
模块内容加载中...
 
 
 
 
 
 
 
模块内容加载中...
 
 
 
 
 

日志分类

 
 
日志分类列表加载中...
 
 
 
 
 

天气

 
 
模块内容加载中...
 
 
 
 
 

日历

 
 
模块内容加载中...
 
 
 
 
 
 
 

云南省 昆明市

 发消息  写留言

 
专业背景:计算机科学 研究方向与兴趣: JavaEE-Web软件开发, 生物信息学, 数据挖掘与机器学习, 智能信息系统 目前工作: 基因组, 转录组, NGS高通量数据分析, 生物数据挖掘, 植物系统发育和比较进化基因组学
 
博客等级加载中...
今日访问加载中...
总访问量加载中...
最后登录加载中...
 
 
 
 
 
 
 
 

[置顶] 已发表的文章

2013-6-15 22:10:38 阅读5758 评论8 152013/06 June15

已发表的小文章,欢迎大家引用,批评,指正!

2017:

Xueqin Wang, Xiaying Ye, Lei Zhao, Dezhu Li§, Zhenhua Guo§ , Huifu Zhuang (2017), Genome-wide RAD sequencing data provide unprecedented resolution of the phylogeny of temperate bamboos (Poaceae: Bambusoideae), Scientific Reports

https://www.nature.com/articles/s41598-017-11367-x

2016:

Development of a universal and simplified ddRAD library preparation approach for SNP discovery and genotyping in angiosperm plants. (plant methods, IF 3.449)

Guo-Qian Yang, Yun-Mei Chen, Jin-Peng Wang, Cen Guo, Lei Zhao, Xiao-Yan Wang, Ying Guo, Li Li, De-Zhu Li§ and Zhen-Hua Guo§

作者  | 2013-6-15 22:10:38 | 阅读(5758) |评论(8) | 阅读全文>>

[置顶] 【转】计算生物学/生物信息学的未来是什么?

2012-8-8 22:33:02 阅读6237 评论14 82012/08 Aug8

1 基因的结构和功能确定。给定一条序列,如果能够找到与其相似度高的同源序列,那么它的结构和功能就差不多可以确定了。这个过程涉及到多序列比对和相似性搜 索。如果没法找到与之相似度高的序列,则需要考虑复杂一点的搜索技术,如基于profile的搜索和比对,或者寻找与之部分结构如结构域/motif相似 的序列,这类似于结构预测中的threading过程。如果这两步都搞不定,那么只能通过从头预测该序列的结构了,不过在实际应用中很不准。

2 序列信息的挖掘,如序列中aa组成,motif的发现等等

3 进化分析。这也是一个很大的领域,包括很多方向,如计算分子进化。从序列出发,去拟合最好的进化模型和参数,这就是计算分子进化。此外,基因组进化分析能够得到一些进化的规律,但是要系统的理解生物的进化还需要依赖于系统的思路。

4 组学的工作,如转录组,代谢组,蛋白组学等等。这类工作涉及的是网络分析。基于大规模的实验数据,通过网络分析可以从系统的水平上得到对于某个生物学过程更好的理解。这是生物学发展的趋势。

5 基因型到表型的mapping。如现在很热的GWAS研究,基于序列的抗原表位预测,或者基于分子marker的疾病预测模型等等

生物信息学的大部分还是要结合实验生物,这是这个学科注定的结局。

本文引用地址:http://blog.sciencenet.cn/blog-54276-497902.html

作者  | 2012-8-8 22:33:02 | 阅读(6237) |评论(14) | 阅读全文>>

2017年1月17日,国际著名学术期刊《美国国家科学院院刊》杂志在线发表了中国科学院动物研究所魏辅文研究组的一篇研究论文,研究人员应用比较基因组学方法揭示了大熊猫和小熊猫趋同演化的遗传学机制。胡义波和吴琦副研究员、博士生马帅和马天笑为论文的共同第一作者,魏辅文研究员为通讯作者。

趋同演化是演化生物学研究的热点问题,是指两个或多个系统发育关系较远的物种,演化出相同或相似的表型性状以适应相似的环境选择压力。尽管自然界中存在很多趋同演化的现象,但关于趋同演化的遗传学机制研究却很少。传统的趋同演化机制研究主要采用候选基因的方法,而随着基因组学的发展,在基因组水平能更加全面深入地揭示趋同演化的遗传学机制。

熊猫和小熊猫属于食肉目不同的科:大熊猫属于熊科、而小熊猫属于鼬超科中的小熊猫科,二者分歧已有4000多万年。尽管其系统发育关系较远,它们却演化出相同的食竹食性,低营养、高纤维的竹子占其食物组成的90%以上;更为有趣的是,这两种熊猫的前掌还演化出一个特殊的结构——伪拇指,以帮助抓握竹子,是适应性演化和趋同演化的经典案例

作者  | 2017-4-7 8:33:36 | 阅读(2571) |评论(0) | 阅读全文>>

Perl去掉数组中重复的元素 及判断元素是否在数组中

2016-10-28 13:17:28 阅读802 评论0 282016/10 Oct28

1.去重复

#!/usr/bin/perl

use strict;

my %hash;

my @array = (1..10,5,20,2,3,4,5,5);

#grep 保存符合条件的元素

@array = grep { ++$hash{$_} < 2 } @array;

print join(" ",@array);

print "\n";

2 判断元素是否在数组中

数组中没有类似hash的简单exists函数

A:

print "EXIST\n" if $value~~@array;

B:

print "EXIST\n" if grep {$value == $_ } @array;

C:使用类似c语言的风格,遍历这个数组,查找变量是否匹配。

foreach ( @arr)

{

if( $vv eq $_ )

{

print "$vv\n"

}

}

D:使用map,查找数组中是否含有该变量

map { if($vv eq $_) { print "$vv\n"} } @arr;

E:使用grep,查找数组中是否含有该变量

print( grep /^$vv$/, @arr );

作者  | 2016-10-28 13:17:28 | 阅读(802) |评论(0) | 阅读全文>>

基因组组装结果质量评估

2016-10-13 15:01:47 阅读1605 评论0 132016/10 Oct13

动植物基因组de novo工作,其组装指标的好坏直接影响着整个基因组的质量。而评估基因组组装结果,contigN50和scaffoldN50是第一指标,即contig/ scaffoldN50:将contig/scaffold长度从长到短进行排序并累加,当累加和达到contig/scaffold总长度的50%的时候,最后参与加和的那一条contig/scaffold长度即为contig/ scaffoldN50的长度。一般来说,contig/scaffoldN50越长,表示组装结果越好。

但是,N50指标高就意味着组装结果就一定可靠吗?

不一定!将一些不相关的reads或者contig错误的连接为scaffold,一样可以达到很高的scaffoldN50。

目前高水平文章发表,组装指标固然是一方面,但真正决定文章发表档次的,是生物学故事是否足够完美,有亮点。我们知道,后续分析依赖的基础便是组装得到的基因组,因此,不可靠的组装结果,对基因组后续分析会造成很大的困扰,甚至会得出错误的生物学结论。

那么,如何才能检验一个基因组组装结果的可靠性呢?

1、 序列一致性评估:

基因组是通过reads组装得到,这一步,是将reads比到基因组上,验证reads对基因组的覆盖情况,用于评估组装的完整性以及测序的均匀性。较高的mapping rate(90%以上)以及coverage(95%以上)认为组装结果和reads有比较好的一致性。

2、 序列完整性评估:

作者  | 2016-10-13 15:01:47 | 阅读(1605) |评论(0) | 阅读全文>>

查看所有日志>>

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2018

登录  
 加关注