贾建峰
在我的机群中增加一台节点机的详细过程
2024-4-20 23:00
阅读:605

1. mu01scp .ssh/id_rsa.pub cu35:

                             scp .ssh/id_rsa cu35:

   cu35cd .ssh mv ../id_rsa.pub authorized_keys ; chmod 600 authorized_keys

2. 配置IB网卡,安装Lustre,见科学网记录(可以先正常装一次IB的驱动,所有的文件都在mu01:/opt/centos83下);

3. hostnamectl set-hostname cu35

   systemctl restart hostnamed

4. timedatectl set-timezone "Asia/Shanghai"

  vi /etc/chrony.conf    

pool一行改为:server 192.168.1.103 iburst

 

chronyc -a makestep

 

5. yum install ypbind yp-tools

   scp cu01:/etc/yp.conf /etc/yp.conf

scp cu01:/etc/nsswitch.conf  /etc/nsswitch.conf

 

6. mu01上,有安装 torque的脚本 修改 nodes文件

  执行./install-torque.sh

7. mu01qmgr

   create node cu35

s n cu35 np=48

s n cu35 properties=newcu48

或修改/var/spool/torque/server_priv/nodes

转载本文请联系原作者获取授权,同时请注明本文来自贾建峰科学网博客。

链接地址:https://wap.sciencenet.cn/blog-3367558-1430567.html?mobile=1

收藏

分享到:

下一篇
当前推荐数:1
推荐人:
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?