上篇说了一下如何在虚拟机上面配置GPU直通,配置完直通后需要在虚拟机上面安装对应的驱动程序才能使用GPU进行一些分析任务。系统安装部分省略。
环境介绍
操作系统:Ubuntu20.04 资源配置:16C/32G GPU:NVIDIA Tesla V100 PCIe 16GB
平台:vSphere7.0.3 直通方式。
NVIDIA Driver:515.86.01
CUDA Toolkit: 11.7
NVIDIA Drivers download
https://www.nvidia.com/Download/driverResults.aspx/194650/en-us/

根据实际配置*载下**对应的版本。我这里使用的是515.86.01

CUDA Toolkit 11.7 Downloads
https://developer.nvidia.com/cuda-11-7-0-download-archive?target_os=Linux&target_arch=x86_64&Distribution=Ubuntu&target_version=20.04&target_type=runfile_local
根据系统版本选择对应的toolkit

可以直接*载下**也可以在系统里面使用wget*载下**。

上传服务器
cuda_11.7.0_515.43.04_linux.run NVIDIA-Linux-x86_64-515.86.01.run
系统参数调整及软件安装
- 修改软件更新源
替换软件包的源
# cp /etc/apt/sources.list /etc/apt/sources.list.bak
#sudo sed -i 's/archive.ubuntu.com/mirrors.aliyun.com/g' /etc/apt/sources.list
#apt-get update更新源
- 安装基础工具
#apt install gcc g++ make
- 屏蔽开源驱动
屏蔽nouveau开源版本的GPU驱动
sudo vim /etc/modprobe.d/blacklist-nouveau.conf
将下面内容添加进去:
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off
创建/etc/modprobe.d/nouveau-kms.conf文件,将options nouveau mdeset=0添加进去:
# echo options nouveau modeset=0 | sudo tee -a /etc/modprobe.d/nouveau-kms.conf
# update-initramfs -u
update-initramfs: Generating /boot/initrd.img-5.4.0-81-generic
I: The initramfs will attempt to resume from /dev/dm-1
I: (/dev/mapper/ubuntu--vg-swap)
I: Set the RESUME variable to override this.
重启服务器
重启后查看开源驱动是否会加载
sudo lsmod | grep nouveau,没有返回表示禁用成功
Nvidia Driver安装
查看PCI设备lspci |grep -i nvidia

执行安装sh或./run文件

回车ok

安装32位库文件

完成安装

测试安装是否成功
#nvidia-smi命令,可以查看到GPU设备表示驱动安装成功。

CUDA toolkit安装
./run文件执行安装

accept接收

不安装cuda里面的驱动,点击install

安装完成配置环境变量

vim ~/.bashrc
将下面命令追加到文件最后面:
export CUDA_HOME=/usr/local/cuda
export PATH="/usr/local/cuda-11.7/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-11.7/lib64:$LD_LIBRARY_PATH"
查看cuda版本

至此drive和cuda安装完毕。