这不是一篇教程或者帮助文档,只是对他人文章和观点的一点收集。目的在于尽可能多地了解生物信息学领域的并行计算有哪些被选方案以及各自的使用范围和优劣。
1 首先是PLOS上一篇论文:
A Quick Guide for Developing Effective Bioinformatics Programming Skills
Joel T. Dudley, Atul J. Butte 链接地址为:http://www.ploscompbiol.org/article/info%3Adoi%2F10.1371%2Fjournal.pcbi.1000589
2 来自lifeformulae博客上的一个系列文章,叫做“Effective Bioinformatics Programming”,截止目前发布了5篇:
我本人也最为关注这个系列的文章,几乎算是比较全面地涉及了生物信息学编程所可能涉及的领域和话题,从WEB开发,REST/SOAP协议等,到GPU,CUDA,在面面俱到的同时作者也有阐述自己的一些观点,表明当前哪些是主流哪些还不明朗等。
本日志的题目也许不够妥当,但仍然不会抹杀所转载内容的含金量;希望从事或者有志于生物信息编程的朋友能从中学习到很多知识。
并行计算,常规分时间和空间两个层次上的并行,时间上是指流水线技术,空间上则主要是将计算任务分解为可在多个计算单元上并行执行的子任务。
空间上的并行包括两类并行机:单指令流多数据流(SIMD)和多指令流多数据流(MIMD),区别于我们常用的串行机SISD;
MIMD类的机器又可分为以下常见的五类:
并行机的四种访存模型:
常用的或者比较成熟的并行计算方案可能涉及:
评论