Rosetta是华盛顿大学David baker实验室开放的一个结构生物学软件包,它可以用来对生物大分子进行3D建模,结构设计。兄弟觉得它的特长在于设计,比如对蛋白质进行改性。很多人 问我这个软件预测结构准不准,其实,不准才是Rosetta的最大优势,各位试想,自然界的蛋白质哪一个是结构固定不变的,我们常看到的X-ray衍射得 到的结构只是蛋白质的一个常用构像。rosetta的结构优化大多采用了带有随机过程的算法,比如遗传算法,模拟退火等,所以rosetta每次预测的结 果都是不同的。在实际应用中,比如我们想让一个蛋白质(ligand)和另一个蛋白质(receptor)之间帮的更紧,我们可以用rosetta对这两 个蛋白质做10000次对接(docking)预测,然后对得到的结构进行排序(结合能),取前100名进行实验确认,那我们就比只做一个预测的成功率高 很多。有人会说,你这不是瞎扯吗,做100个得多少钱啊,时代不同啦,现在的筛选技术,比如噬菌体展示,酵母表面展示,高通量基因合成让这些问题都不在是 问题,不但不是问题,而且他们之间还很互补,看看baker实验室发那么多nature,science,我想我们应该有所启发。说了这么多,都是个人见 解,入正体:

1)rosetta下载

rosetta对科研用户是免费的,注册后,你可以在这下载:https://www.rosettacommons.org/

2)需要安装的软件

我的台式安装fedora操作系统,以root用户打开一个shell

yum install scons //rosetta用它打的包

yum install gcc,boost,boost-devel, boost-static,zlib,zlib-devel

3)编译

rosetta的很多应用属于高通量计算,所以我想在本机上编译测试成功后上传到服务器群上运行,服务器群使用的centos系统,为了让编译后的程序能在centos上运行而不需要重新编译,我在本机上把rosetta编译成了静态程序

首先解压下载的软件,然后cd到main/source,运行 scons mode=release extras=static bin -j4

时间有点长,耐心等待。

4)运行

rosetta 有些应用是可以编译成MPI的,但是我刚才说了,它是带有随机过程的程序,更适合高通量运算,理想情况下一个core可以运行一个实例,比如我使用的服务 器群上有1200个core,我想一个蛋白质结构从头预测,我想预测50000个结构,那我就用1000个core,每个core上预测50个结构。值得 一说的是有些朋友可能租用的云计算,需要自己搭建cluster,一些job管理软件比如condor好像对云平台不太兼容,schedule的时候有点 问题,以兄弟使用过的阿里云为经验,我觉得还不如自己用python写个管理ssh命令更方便。

Current rating: 2.8
  • Share

Comments

There are currently no comments

New Comment

* Please fill all required form field, thanks!

ICP证: 苏ICP备15038038号-1