科学精神分享 http://blog.sciencenet.cn/u/lyzhao

博文

如何配置MS4.x的Cluster并行计算

已有 7659 次阅读 2008-7-30 19:59 |个人分类:计算化学软件配置教程

以2节点配置为例。
1,安装Centos 3.8 或 RHEL4.0 或其他linux
其中nfs rexec, rlogin, rsh 必装,若不清楚的话选择Everything

2, 二节点上都建立 msi 用户如 msi  (名字自己定), 注意两个节点上的msi用户对应的密码,GID要相同,否则无法节点间并行,并一般会提示 permission denied.  两个用户的shell 最好都用 csh

3, 在两个节点上建立文件:/etc/hosts 和 /etc/hosts.equiv 如果已经有这两个文件则修改即可。如下
/etc/hosts:
127.0.0.1 node1 localhost.localdomain localhost (该行对有些软件的并行会出问题,所以可以注释掉或删除)
192.168.0.1   node1   (IP自定义即可)
192.168.0.2   node2
/etc/hosts.equiv:
localhost (该行对有些软件的并行会出问题,所以可以注释掉或删除)
node1
node2

4,node1上建立nfs服务,并发布共享目录:
   (1)编辑或建立文件 /etc/exports 内容如下:
     /home/msi  *(rw, no_root_squash, sync)
   (2)发布共享目录
     运行: exportfs -rv
   (3)编辑或建立文件 /home/msi/.rhosts 内容如下:
    node1
    node2

5, node2节点上修改 /etc/fstab 在最后加入:
  node1:/home/msi /home/msi nfs defaults 0 0
注:以上系统文件操作都在root用户下进行

6,node1上安装ms4.2, 注:使用msi用户安装,不要用root安装,否则启动ms网关时会提示无法启动进程。 (我们通过nfs同时共享了软件,所以,node2上可不装ms4.2) 到安装盘linux的文件目录下运行: ./install --type cluster
(我的node1就是主节点。软件直接安装在msi用户主目录下
一路下去,在选择 hpmpi是否使用ssh时,选择否,让它默认使用rsh,否则后面配置ssh比较麻烦,对一般用户来说用不着的。同时自动让ms启动网关服务,最后安装程序还有提示如何将ms服务加到系统服务中,使得机子重启后ms可以自动启动. 这个请自行配置。

7,编辑 /home/msi/你的安装目录/share/data/machine.LINUX,输入:
(删除或注释掉原来的 localhost 行。)
node1:2
node2:2   (进行计算机节点设置和每个节点的CPU数设置。“2"指CPU线程数。即单科CPU 4 核的话就设置为4,而不是1)

8,检查node1 和 node2 中的, nfs, rexec, rlogin, rsh 服务是否开启。若未开启则手动使用service命令开启这些服务。如果不知道怎么手动开启。可用下面的方法:
root下运行 setup-》选择 system service --> 看看这四项是否打上星号。没有的话用空格键选上。 -->OK--> 重启机子。(此时重启对于node2也完成了下面第9步挂载nfs目录的操作,所以可以跳过9)

9,在node2 中, root用户下,mount nfs 服务目录:
#mount node1:/home/msi

10, 你现在应该可以往node1 上提交任务,进行cluster并行计算了。若windows下的MS建立网关时识别两个节点的CPU进程总数不对的话,检查一下文件 /home/msi/安装目录/Gateway/root_default/dsd/conf/gw-info.sbd 文件里有一个地方设置CPU总数的,看看是不是不对。

11, 有可能需要启动 lic_server 方法如下:
编辑或修改: node1 上 /home/msi/.cshrc 文件加入下面两行:
source /home/msi/软件安装目录/Licensepack/etc/lp_cshrc
lp_server -s
保存即可

12,对于大于2个节点以上的,其他node3,node4,。。。节点同node2配置即可。

注:如果你现在还分不清楚root和一般用户,则建议先学习linux系统。


https://wap.sciencenet.cn/blog-63348-33755.html


下一篇:NWChem MPI 运行配置(以hpmpi 为例)
收藏 IP: .*| 热度|

0

评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-19 06:17

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部