Centos7 安装 T4显卡驱动

一、安装驱动

未安装驱动的机器确定显卡版本

#安装检查命令
yum install pciutils

#查看显卡型号
lspci | grep -i nvidia

04:00.0 VGA compatible controller: NVIDIA Corporation Device 1b06 (rev a1)

04:00.1 Audio device: NVIDIA Corporation Device 10ef (rev a1)

05:00.0 VGA compatible controller: NVIDIA Corporation Device 1b06 (rev a1)

05:00.1 Audio device: NVIDIA Corporation Device 10ef (rev a1)

显卡型号查询:PCI devices (ucw.cz)

在上面的网址输入1b06,可以看到显卡型号是

GeForce GTX 1080 Ti

显卡型号

1、官网下载显卡驱动

NVIDIA驱动下载:https://www.nvidia.cn/Download/index.aspx?lang=cn

驱动列表

2、安装Nvidia驱动程序的准备

临时禁用:

modprobe -r nouveau

永久禁用:

禁用nouveau驱动:
##新建脚本:
# /bin/bash
set -ex

mkdir -p /etc/modprobe.d/
echo "blacklist nouveau" >> /etc/modprobe.d/blacklist-nouveau.conf
echo "options nouveau modeset=0" >> /etc/modprobe.d/blacklist-nouveau.conf
sudo mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
sudo dracut -v /boot/initramfs-$(uname -r).img $(uname -r)
echo "id:3:action:process" >> /etc/inittab
reboot

lsmod |grep novu
lspci | grep nouveau
## 如果有输出,需要禁⽌,运⾏stop脚本
bash stop_nouveau.sh

3、安装显卡驱动

sudo sh NVIDIA-Linux-x86_64-418.226.00.run -no-x-check -no-nouveau-check -no-opengl-files
# -no-x-check               #安装驱动时关闭X服务
# -no-nouveau-check   #安装驱动时禁用nouveau
# -no-opengl-files         #只安装驱动文件,不安装OpenGL文件

4、检查验证

[root@localhost opt]# nvidia-smi
Wed Jul  7 11:11:33 2021
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 410.129      Driver Version: 410.129      CUDA Version: 10.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  Tesla T4            Off  | 00000000:41:00.0 Off |                    0 |
| N/A   94C    P0    36W /  70W |      0MiB / 15079MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+
 
+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+

二、安装cuda

1、官网下载cuda版本

官网链接:https://developer.nvidia.com/cuda-toolkit-archive

cuda安装

2、按照官网步骤安装

wget https://developer.download.nvidia.com/compute/cuda/11.2.0/local_installers/cuda_11.2.0_460.27.04_linux.run
sudo sh cuda_11.2.0_460.27.04_linux.run

3、运行第二行指令并经过一小会的卡顿后,选择accept

安装选择accept

4、选择只安装cuda

如果系统可以运行nvidia-smi,说明已经安装好了cuda的驱动,此时一定要在下个界面通过按回车取消Driver的安装,否则会出现[ERROR]: Install of driver component failed.的情况,光标移动到第一行x处,按控制取消勾选即可。

只安装cuda

5、之后选择install便可完成cuda的安装

cuda位置

随后,我们开始根据他提示的cuda安装目录进行环境变量的配置:

#打开命令行输入以下命令进行~/.bashrc文件的修改:
vim ~/.bashrc

#如果使用的是zsh,则修改~/.zshrc
#在文件的末尾加入下面三行:
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64   #修改为上图提示地址
export PATH=$PATH:/usr/local/cuda/bin                         #修改为上图实际提示地址
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda   #修改为上图实际提示地址

#随后命令行输入以下命令保存并退出:
:wq!

#再执行
source ~/.bashrc

6、验证版本

[root@gpu-node ~]# nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2021 NVIDIA Corporation
Built on Sun_Feb_14_21:12:58_PST_2021
Cuda compilation tools, release 11.2, V11.2.152
Build cuda_11.2.r11.2/compiler.29618528_0

三、NVIDIA驱动免重启升级

1、先停掉显卡启动在nvidia上的服务

停服务

2、使用nvidia自带的命令卸载旧的驱动

nvidia-uninstall -s
-s 静默

3、查看是否清理干净

lsmod |grep nvidia

查看是否卸载干净

4、因为我本来就是新版本驱动了,所以我没执行卸载命令,正常上图这里是没有东西的,如果有需要删除上面的相关模块

使用rmmod命令删除

rmmod nvidia nvidia_uvm nvidia_modeset nvidia_drm
modprobe -r nouveau

5、安装新版驱动

#静默安装即可完成升级
sh NVIDIA-Linux-x86_64-418.116.00.run -s

注意事项:

1、如果有升级内核的需要,请在安装显卡驱动前,因为安装了新内核之后,新内核不会自动加载显卡驱动。

2、如果要安装高版本的显卡驱动,需要先卸载现有版本的显卡驱动。

© 版权声明
THE END
喜欢就支持一下吧
点赞10 分享
评论 共1条
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片