实验室服务器老毛病,两台服务器都出问题:
一台开机没有图形界面,开机后黑屏,左上角一个光标闪烁,一直停留在这个界面。
另外一台开机后能进到登陆界面,输入密码以后直接黑屏不显示;
以上两个问题在查阅相关博客发现应该是图形界面顺坏,但尝试博客提供的各种方法无果,遂一直没有得到解决。
偶然间看到了一篇博客,于是索性尝试,没想到成功解决了这两台服务器的问题,在此写个博客,以便后续遇到同类问题查阅,如有侵权请联系我删除。
在系统启动以后,按Ctrl+Alt+F1或F2或F3,进入tty界面。
Ctrl + Alt + F1 或者 Ctrl + Alt + F2 或者 Ctrl + Alt + F3
然后输入用户名和密码进入Ubuntu系统。
输入命令 sudo apt-get dist-upgrade
sudo apt-get dist-upgrade
漫长等待下载安装各种包(每个电脑而异,两台服务器分别是700MB,1GB)。
中途如果安装失败,出现 apt-get update -- fix-missing 等状态就输入该命令。
apt-get update --fix-missing
结束以后重新输入上一条命令 sudo apt-get dist-upgrade
修复好以后(大概15分钟)重启 reboot 一下就ok了
如果不出什么意外的话,以上就完成了图形界面的修复,就可以正常使用图形界面了
但是!!!!!
但是!!!!!
但是!!!!!
如果你的服务器是用跑代码,使用gpu的话,使用nvidia-smi命令你会发现找不到显卡了,这个时候不要慌,查阅网上资料是说,刚刚的操作是把系统内核给更新了,所以之前的显卡驱动版本和现在内核版本不匹配,所以需要重新匹配一下,当然不用担心,并不需要重新装cuda和cudnn。具体方案如下:贴一下链接 https://blog.csdn.net/xiaojinger_123/article/details/121161446
用nvidia-smi
查看一下,发现如下报错:
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
查看已安装内核
dpkg --get-selections |grep linux-image
(base)~$ dpkg --get-selections |grep linux-imagelinux-image-5.13.0-44-generic installlinux-image-5.15.0-69-generic installlinux-image-5.4.0-26-generic installlinux-image-generic-hwe-20.04 install
查看正在使用的内核
uname -a
第二步,使用nvcc -V
检查驱动和cuda。
nvcc: NVIDIA (R) Cuda compiler driverCopyright (c) 2005-2022 NVIDIA CorporationBuilt on Tue_Mar__8_18:18:20_PST_2022Cuda compilation tools, release 11.6, V11.6.124Build cuda_11.6.r11.6/compiler.31057947_0
发现驱动是存在的,于是检查驱动版本信息。
ls /usr/src | grep nvidia
然后输入以下命令
sudo apt-get install dkmssudo dkms install -m nvidia -v 450.57 //这里替换为上个命令查询的版本号
等待安装以后,再次输入nvidia-smi,就可以查询显卡信息了。
大功告成!!!
来源地址:https://blog.csdn.net/weixin_45290623/article/details/129805003