一、安装驱动
未安装驱动的机器确定显卡版本
#安装检查命令
yum install pciutils
#查看显卡型号
lspci | grep -i nvidia
04:00.0 VGA compatible controller: NVIDIA Corporation Device 1b06 (rev a1)
04:00.1 Audio device: NVIDIA Corporation Device 10ef (rev a1)
05:00.0 VGA compatible controller: NVIDIA Corporation Device 1b06 (rev a1)
05:00.1 Audio device: NVIDIA Corporation Device 10ef (rev a1)
显卡型号查询:PCI devices (ucw.cz)
在上面的网址输入1b06,可以看到显卡型号是
GeForce GTX 1080 Ti
1、官网下载显卡驱动
NVIDIA驱动下载:https://www.nvidia.cn/Download/index.aspx?lang=cn
2、安装Nvidia驱动程序的准备
临时禁用:
modprobe -r nouveau
永久禁用:
禁用nouveau驱动:
##新建脚本:
# /bin/bash
set -ex
mkdir -p /etc/modprobe.d/
echo "blacklist nouveau" >> /etc/modprobe.d/blacklist-nouveau.conf
echo "options nouveau modeset=0" >> /etc/modprobe.d/blacklist-nouveau.conf
sudo mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
sudo dracut -v /boot/initramfs-$(uname -r).img $(uname -r)
echo "id:3:action:process" >> /etc/inittab
reboot
lsmod |grep novu
lspci | grep nouveau
## 如果有输出,需要禁⽌,运⾏stop脚本
bash stop_nouveau.sh
3、安装显卡驱动
sudo sh NVIDIA-Linux-x86_64-418.226.00.run -no-x-check -no-nouveau-check -no-opengl-files
# -no-x-check #安装驱动时关闭X服务
# -no-nouveau-check #安装驱动时禁用nouveau
# -no-opengl-files #只安装驱动文件,不安装OpenGL文件
4、检查验证
[root@localhost opt]# nvidia-smi
Wed Jul 7 11:11:33 2021
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 410.129 Driver Version: 410.129 CUDA Version: 10.0 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 Tesla T4 Off | 00000000:41:00.0 Off | 0 |
| N/A 94C P0 36W / 70W | 0MiB / 15079MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| No running processes found |
+-----------------------------------------------------------------------------+
二、安装cuda
1、官网下载cuda版本
官网链接:https://developer.nvidia.com/cuda-toolkit-archive
2、按照官网步骤安装
wget https://developer.download.nvidia.com/compute/cuda/11.2.0/local_installers/cuda_11.2.0_460.27.04_linux.run
sudo sh cuda_11.2.0_460.27.04_linux.run
3、运行第二行指令并经过一小会的卡顿后,选择accept
4、选择只安装cuda
如果系统可以运行nvidia-smi,说明已经安装好了cuda的驱动,此时一定要在下个界面通过按回车取消Driver的安装,否则会出现[ERROR]: Install of driver component failed.的情况,光标移动到第一行x处,按控制取消勾选即可。
5、之后选择install便可完成cuda的安装
随后,我们开始根据他提示的cuda安装目录进行环境变量的配置:
#打开命令行输入以下命令进行~/.bashrc文件的修改:
vim ~/.bashrc
#如果使用的是zsh,则修改~/.zshrc
#在文件的末尾加入下面三行:
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64 #修改为上图提示地址
export PATH=$PATH:/usr/local/cuda/bin #修改为上图实际提示地址
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda #修改为上图实际提示地址
#随后命令行输入以下命令保存并退出:
:wq!
#再执行
source ~/.bashrc
6、验证版本
[root@gpu-node ~]# nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2021 NVIDIA Corporation
Built on Sun_Feb_14_21:12:58_PST_2021
Cuda compilation tools, release 11.2, V11.2.152
Build cuda_11.2.r11.2/compiler.29618528_0
三、NVIDIA驱动免重启升级
1、先停掉显卡启动在nvidia上的服务
2、使用nvidia自带的命令卸载旧的驱动
nvidia-uninstall -s
-s 静默
3、查看是否清理干净
lsmod |grep nvidia
4、因为我本来就是新版本驱动了,所以我没执行卸载命令,正常上图这里是没有东西的,如果有需要删除上面的相关模块
使用rmmod命令删除
rmmod nvidia nvidia_uvm nvidia_modeset nvidia_drm
modprobe -r nouveau
5、安装新版驱动
#静默安装即可完成升级
sh NVIDIA-Linux-x86_64-418.116.00.run -s
注意事项:
1、如果有升级内核的需要,请在安装显卡驱动前,因为安装了新内核之后,新内核不会自动加载显卡驱动。
2、如果要安装高版本的显卡驱动,需要先卸载现有版本的显卡驱动。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
- 最新
- 最热
只看作者