一、检查显卡型号
1、命令:lspci | grep -i nvidia
2、描述:通过该命令可以查看系统中的NVIDIA显卡型号,输出可能显示为NVIDIA GeForce GTX 1080。
二、获取管理员权限
1、命令:sudo -s
2、描述:需要以管理员权限执行后续操作,输入密码后即可获得管理员权限。
三、禁用nouveau驱动
1、命令:
cat << EOF | sudo tee --append /etc/modprobe.d/blacklist.conf blacklist vga16fb blacklist nouveau blacklist rivafb blacklist nvidiafb blacklist rivatv EOF
2、描述:将nouveau驱动添加到黑名单文件中,以防止系统加载nouveau驱动。
四、更新grub配置
1、命令:sudo update-grub
2、描述:更新grub引导程序的配置,使更改生效。
五、下载驱动程序
1、方法一:使用官方链接下载驱动程序
wget https://us.download.nvidia.com/tesla/550.54.15/NVIDIA-Linux-x86_64-550.54.15.run
2、方法二:使用AWS S3下载最新驱动程序
aws s3 cp --recursive s3://ec2-linux-nvidia-drivers/latest/ .
3、描述:根据实际需求选择下载方式和版本。
六、设置权限并运行安装脚本
1、命令:
chmod +x NVIDIA-Linux-x86_64-*.run sudo /bin/sh ./NVIDIA-Linux-x86_64-*.run
2、描述:为下载的驱动程序文件添加执行权限并运行安装脚本。
七、确认驱动程序安装
1、命令:nvidia-smi -q | head
2、描述:使用该命令确认驱动程序是否正常安装,并列出已安装的NVIDIA驱动程序版本和有关GPU的详细信息。
八、重启服务器
1、命令:sudo reboot
2、描述:完成驱动程序安装后,重启服务器以应用更改。
九、验证驱动是否成功安装
1、命令:nvidia-smi
2、描述:如果返回类似下图中的GPU信息,则说明驱动安装成功。
十、注意事项
1、CUDA与PyTorch对应关系:在安装CUDA之前,请确保CUDA与PyTorch版本的对应关系正确。
2、临时目录空间不足:如果提示临时文件存储空间不足,可以创建新的临时目录并将其挂载到/tmp下。
3、自动安装选项:在购买云服务器时,可以选择自动安装GPU驱动,以节省手动安装的时间。
通过以上步骤,您可以在服务器上成功安装NVIDIA显卡驱动,并进行必要的配置和验证。
原创文章,作者:未希,如若转载,请注明出处:https://www.kdun.com/ask/1270907.html
本网站发布或转载的文章及图片均来自网络,其原创性以及文中表达的观点和判断不代表本网站。如有问题,请联系客服处理。
发表回复