forked from yindun/ansible-devops
更新 scripts/README.md
This commit is contained in:
parent
7447bb73ed
commit
0e24a36853
|
|
@ -168,10 +168,16 @@ tail -f /opt/gpu-manager.log
|
|||
```
|
||||
**特别提醒**:
|
||||
```bash
|
||||
超威机型-B200:
|
||||
GPU:B200系列:
|
||||
(1)安装fabricmanager 时,需要nvlsm;否则faricmanager无法启动。
|
||||
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/nvlsm_2025.03.1-1_amd64.deb
|
||||
dpkg -i nvlsm_2025.03.1-1_amd64.deb
|
||||
(2)/etc/default/grub文件下添加GRUB_CMDLINE_LINUX="quiet splash nokaslr"参数,否则CUDA初始化失败。
|
||||
(3)/etc/default/grub文件下添加GRUB_CMDLINE_LINUX_DEFAULT="intel_iommu=off" #关闭iommu
|
||||
超威机型:
|
||||
(1)/etc/default/grub文件下添加GRUB_CMDLINE_LINUX="quiet splash nokaslr"参数,否则CUDA初始化失败。
|
||||
(2)/etc/default/grub文件下添加GRUB_CMDLINE_LINUX_DEFAULT="intel_iommu=off" #关闭iommu
|
||||
(3)超威机型 选择再生龙还原时;再生龙镜像 有版本要求:
|
||||
|
||||
再生龙镜像还原:
|
||||
(1)华擎B200:再生龙镜像:NFS:10.102.35.99/nfs/clone.iso 备份路径:/nfs/2025-05-26-09-B200-960g-img #华擎机型对再生龙引导镜像版本无要求。
|
||||
(2)超威B200: 再生龙镜像:10.102.35.99/nfs/clone.iso 备份路径: /nfs/chaowei-B200-1.7T-img #注意超威机型对再生龙引导镜像对版本有要求,最新版本无法引导。
|
||||
```
|
||||
|
|
|
|||
Loading…
Reference in New Issue