Centos7 安装 T4显卡驱动

一、安装驱动

1、官网下载显卡驱动

NVIDIA驱动下载:https://www.nvidia.cn/Download/index.aspx?lang=cn

驱动列表

2、安装Nvidia驱动程序的准备

禁用nouveau驱动:
1)打开禁用配置文件,命令行输入以下命令:
sudo vim /etc/modprobe.d/blacklist.conf

#在最后一行添加以下文本:
blacklist nouveau

#保存并退出:
:qw!

#修改完成之后,更新一下文件配置,命令行输入以下命令:
sudo update-initramfs -u

2)或者执行一下命令也是一样
# 修改配置
echo -e "blacklist nouveau\noptions nouveau modeset=0" > /etc/modprobe.d/blacklist.conf

#执行完毕需要进行电脑重启,重启电脑之后,命令行输入以下命令:
lsmod | grep nouveau
如果没有输出,则代表nouveau禁用成功。

3、安装显卡驱动

sudo sh NVIDIA-Linux-x86_64-418.226.00.run -no-x-check -no-nouveau-check -no-opengl-files
# -no-x-check               #安装驱动时关闭X服务
# -no-nouveau-check   #安装驱动时禁用nouveau
# -no-opengl-files         #只安装驱动文件,不安装OpenGL文件

4、检查验证

[root@localhost opt]# nvidia-smi
Wed Jul  7 11:11:33 2021
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 410.129      Driver Version: 410.129      CUDA Version: 10.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  Tesla T4            Off  | 00000000:41:00.0 Off |                    0 |
| N/A   94C    P0    36W /  70W |      0MiB / 15079MiB |      0%      Default |
+-------------------------------+----------------------+----------------------+
 
+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+

二、安装cuda

1、官网下载cuda版本

官网链接:https://developer.nvidia.com/cuda-toolkit-archive

cuda安装

2、按照官网步骤安装

wget https://developer.download.nvidia.com/compute/cuda/11.2.0/local_installers/cuda_11.2.0_460.27.04_linux.run
sudo sh cuda_11.2.0_460.27.04_linux.run

3、运行第二行指令并经过一小会的卡顿后,选择accept

安装选择accept

4、选择只安装cuda

如果系统可以运行nvidia-smi,说明已经安装好了cuda的驱动,此时一定要在下个界面通过按回车取消Driver的安装,否则会出现[ERROR]: Install of driver component failed.的情况,光标移动到第一行x处,按控制取消勾选即可。

只安装cuda

5、之后选择install便可完成cuda的安装

cuda位置

随后,我们开始根据他提示的cuda安装目录进行环境变量的配置:

#打开命令行输入以下命令进行~/.bashrc文件的修改:
vim ~/.bashrc

#如果使用的是zsh,则修改~/.zshrc
#在文件的末尾加入下面三行:
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64   #修改为上图提示地址
export PATH=$PATH:/usr/local/cuda/bin                         #修改为上图实际提示地址
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda   #修改为上图实际提示地址

#随后命令行输入以下命令保存并退出:
:wq!

#再执行
source ~/.bashrc

6、验证版本

[root@gpu-node ~]# nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2021 NVIDIA Corporation
Built on Sun_Feb_14_21:12:58_PST_2021
Cuda compilation tools, release 11.2, V11.2.152
Build cuda_11.2.r11.2/compiler.29618528_0

三、NVIDIA驱动免重启升级

1、先停掉显卡启动在nvidia上的服务

停服务

2、使用nvidia自带的命令卸载旧的驱动

nvidia-uninstall -s
-s 静默

3、查看是否清理干净

lsmod |grep nvidia

查看是否卸载干净

4、因为我本来就是新版本驱动了,所以我没执行卸载命令,正常上图这里是没有东西的,如果有需要删除上面的相关模块

使用rmmod命令删除

rmmod nvidia nvidia_uvm nvidia_modeset nvidia_drm
modprobe -r nouveau

5、安装新版驱动

#静默安装即可完成升级
sh NVIDIA-Linux-x86_64-418.116.00.run -s

注意事项:

1、如果有升级内核的需要,请在安装显卡驱动前,因为安装了新内核之后,新内核不会自动加载显卡驱动。

2、如果要安装高版本的显卡驱动,需要先卸载现有版本的显卡驱动。

© 版权声明
THE END
喜欢就支持一下吧
点赞9 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片