From 7447bb73edb25ea42fa940b2b37c64fabbc4f694 Mon Sep 17 00:00:00 2001 From: joy Date: Mon, 14 Jul 2025 16:27:45 +0800 Subject: [PATCH] =?UTF-8?q?=E6=9B=B4=E6=96=B0=20scripts/README.md?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- scripts/README.md | 12 +++++++++++- 1 file changed, 11 insertions(+), 1 deletion(-) diff --git a/scripts/README.md b/scripts/README.md index 5c0397e..85c5f88 100644 --- a/scripts/README.md +++ b/scripts/README.md @@ -30,6 +30,8 @@ ```bash 新系统推荐使用一键自动安装脚本,可快速、全面地完成 GPU 相关应用的部署,具体使用方法详见文章末尾说明。​若系统之前已存在相关安装内容,或需要对各组件进行独立、定制化部署,建议使用单独部署脚本安装。 ``` + + ### 二、使用说明 #### (1)系统初始化 @@ -164,4 +166,12 @@ tail -f /opt/gpu-manager.log #--include=exporter 指定该参数,脚本将安装/卸载exporter组件中的相关服务[dcgm-exporter,node-exporter,nvidia-dcgm],默认不安装/卸载。 ``` - +**特别提醒**: + ```bash + 超威机型-B200: + (1)安装fabricmanager 时,需要nvlsm;否则faricmanager无法启动。 + wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/nvlsm_2025.03.1-1_amd64.deb + dpkg -i nvlsm_2025.03.1-1_amd64.deb + (2)/etc/default/grub文件下添加GRUB_CMDLINE_LINUX="quiet splash nokaslr"参数,否则CUDA初始化失败。 + (3)/etc/default/grub文件下添加GRUB_CMDLINE_LINUX_DEFAULT="intel_iommu=off" #关闭iommu + ```