Plötslig krasch med svart skärm som visar / dev / sda1:
On februari 15, 2021 by adminIbland, utan någon uppenbar anledning, blir min skärm plötsligt ”svart” och visar bara en textrad :
/dev/sda1: clean 1068388/64102400 files, 29744985/256399616 blocks
som om systemet skulle startas om. Men inget händer efter det och jag måste trycka på återställningsknappen.
Detta har hänt tre gånger nu. En gång direkt efter en ny start på morgonen och aldrig med någon stor uppgift (bara öppna en webbläsare – inte reproducerbar). Det hände aldrig under extrem belastning (träning av neurala nät), så jag är ganska säker på att detta inte är ett värmeproblem, som i det här inlägget .
Jag hittade följande misstänkta rader i /var/log/kern.log
-filen
... [ 0.024000] tsc: Fast TSC calibration failed ... ... [ 0.796335] dpc 0000:00:01.1:pcie010: DPC error containment capabilities: Int Msg #0, RPExt+ PoisonedTLP+ SwTrigger+ RP PIO Log 6, DL_ActiveErr+
där den sista raden visas tre gånger i en rad, men jag vet inte vad det betyder.
Jag kör:
- OS: Ubuntu 18.04
- Kärna: 4.15.0 -39-generisk (x86_64)
- Desktop: GNOME Shell 3.28.3
- Display Driver: NVIDIA 396.45
- Kompilator: Clang 3.3 + LLVM 3.3 + CUDA 9.2
- Filsystem: ext4
På en ganska ny stationär dator med specifikationer:
- Processor: AMD Ryzen Threadripper 1900X 8- Core @ 3.80GHz (16 Cores)
- Moderkort: ASRock X399 Professional Gaming
- Minne: 64512MB
- Disk: 1050GB Crucial_CT1050MX + 4001GB Elements SE 25FF
- Grafik: 2x SLI NVIDIA GeForce GTX 1080 Ti 11264MB
Vad kan vara orsaken till denna p roblem?
smartctl
Som svar på kommentarer är utdata från
sudo smartctl --all /dev/sda
=== START OF INFORMATION SECTION === Device Model: Crucial_CT1050MX300SSD1 Serial Number: 173818DBA7DB LU WWN Device Id: 5 00a075 118dba7db Firmware Version: M0CR060 User C apacity: 1.050.214.588.416 bytes [1,05 TB] Sector Size: 512 bytes logical/physical Rotation Rate: Solid State Device Form Factor: 2.5 inches Device is: Not in smartctl database [for details use: -P showall] ATA Version is: ACS-3 T13/2161-D revision 5 SATA Version is: SATA 3.2, 6.0 Gb/s (current: 6.0 Gb/s) Local Time is: Sat Nov 17 14:39:52 2018 CET SMART support is: Available - device has SMART capability. SMART support is: Enabled === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED General SMART Values: Offline data collection status: (0x00) Offline data collection activity was never started. Auto Offline Data Collection: Disabled. Self-test execution status: ( 0) The previous self-test routine completed without error or no self-test has ever been run. Total time to complete Offline data collection: ( 2783) seconds. Offline data collection capabilities: (0x7b) SMART execute Offline immediate. Auto Offline data collection on/off support. Suspend Offline collection upon new command. Offline surface scan supported. Self-test supported. Conveyance Self-test supported. Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data before entering power-saving mode. Supports SMART auto save timer. Error logging capability: (0x01) Error logging supported. General Purpose Logging supported. Short self-test routine recommended polling time: ( 2) minutes. Extended self-test routine recommended polling time: ( 13) minutes. Conveyance self-test routine recommended polling time: ( 3) minutes. SCT capabilities: (0x0035) SCT Status supported. SCT Feature Control supported. SCT Data Table supported. SMART Attributes Data Structure revision number: 16 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x002f 100 100 000 Pre-fail Always - 0 5 Reallocated_Sector_Ct 0x0032 100 100 010 Old_age Always - 0 9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 454 12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 333 171 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0 172 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0 173 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 1 174 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 1 183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0 184 End-to-End_Error 0x0032 100 100 000 Old_age Always - 0 187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0 194 Temperature_Celsius 0x0022 074 059 000 Old_age Always - 26 (Min/Max 16/41) 196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 0 197 Current_Pending_Sector 0x0032 100 100 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0030 100 100 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x0032 100 100 000 Old_age Always - 0 202 Unknown_SSD_Attribute 0x0030 100 100 001 Old_age Offline - 0 206 Unknown_SSD_Attribute 0x000e 100 100 000 Old_age Always - 0 246 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 945594898 247 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 29549867 248 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 8744251 180 Unused_Rsvd_Blk_Cnt_Tot 0x0033 000 000 000 Pre-fail Always - 4424 210 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0 SMART Error Log Version: 1 No Errors Logged SMART Self-test log structure revision number 1 No self-tests have been logged. [To run self-tests, use: smartctl -t] SMART Selective self-test log data structure revision number 1 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 Not_testing 2 0 0 Not_testing 3 0 0 Not_testing 4 0 0 Not_testing 5 0 0 Not_testing Selective self-test flags (0x0): After scanning selected spans, do NOT read-scan remainder of disk. If Selective self-test is pending on power-up, resume after 0 minute delay.
Uppdatering (utloggning istället för svart skärm)
Just nu, istället för en svart skärm blev jag precis utloggad från mitt konto utan någon uppenbar anledning. Det verkar som om dessa frågor är relaterade. Runt tiden för denna händelse framhäver Vim dessa rader i kern.log
:
Nov 19 09:44:52 Gauss kernel: [ 0.793729] dpc 0000:00:01.1:pcie010: DPC error containment capabilities: Int Msg #0, RPExt+ PoisonedTLP+ SwTrigger+ RP PIO Log 6, DL_ActiveErr+ Nov 19 09:44:52 Gauss kernel: [ 0.793735] dpc 0000:00:03.1:pcie010: DPC error containment capabilities: Int Msg #0, RPExt+ PoisonedTLP+ SwTrigger+ RP PIO Log 6, DL_ActiveErr+ Nov 19 09:44:52 Gauss kernel: [ 0.793744] dpc 0000:40:03.1:pcie010: DPC error containment capabilities: Int Msg #0, RPExt+ PoisonedTLP+ SwTrigger+ RP PIO Log 6, DL_ActiveErr+ ... Nov 19 09:44:52 Gauss kernel: [ 0.890282] RAS: Correctable Errors collector initialized. ... Nov 19 09:44:52 Gauss kernel: [ 1.026963] nvidia: module verification failed: signature and/or required key missing - tainting kernel ... Nov 19 09:44:52 Gauss kernel: [ 2.927217] scsi 10:0:0:1: Failed to get diagnostic page 0x1 Nov 19 09:44:52 Gauss kernel: [ 2.927219] scsi 10:0:0:1: Failed to bind enclosure -19 ... Nov 19 09:44:52 Gauss kernel: [ 5.227132] EXT4-fs (sda1): re-mounted. Opts: errors=remount-ro ... Nov 19 09:44:52 Gauss kernel: [ 5.602354] thermal thermal_zone0: failed to read out thermal zone (-61)
Kommentarer
Svar
Det ser ut som att din X11- eller Wayland GUI-server kraschar och släpper tillbaka dig till en textlägeskonsol. Den ena raden med text kommer troligen från en filsystemkontroll som hände när du startade systemet innan du byter till GUI-läge. Eftersom Ubuntu 18.04 startar GUI på den första virtuella konsolen, kommer den virtuella konsolen inte att svara om GUI-servern kraschar och inte startas om.
(Andra Linux-distributioner använde traditionellt den sjunde virtuella konsolen för GUI, vilket fick systemet att automatiskt återgå till standard 1: a virtuella konsolen med en funktionell inloggningsprompt på en X11-serverkrasch. Ubuntu flyttade uppenbarligen GUI-server till den första virtuella konsolen för att göra en mer sömlös övergång mellan startstänk och GUI-inloggning, men om GUI-servern kraschar måste du nu vara medveten om de virtuella konsolerna för att få tillgång till en inloggning i textläge prompt.)
Raderna i din /var/log/kern.log
loggas alla inom några sekunder efter att Linux-kärnan startats (enligt sekunden sedan startvärdet i hakparenteser i början av varje rad), så de är förmodligen inte direkt relaterade.
Försök att trycka på Control + Alt + F2 . Om kärnan fortfarande lever, bör du nu se en inloggningsprompt för textläge på den svarta skärmen. Du kan sedan logga in och försöka sudo systemctl restart gdm
för att starta om GUI, eller samla in loggar och annan felsökningsinformation i textläge. Observera att omstart av gdm
kan returnera dig automatiskt till GUI, men inloggningssessionen på den andra virtuella konsolen kommer fortfarande att vara inloggad: du kan antagligen växla mellan dem med Control- Alt-F1 och Control-Alt-F2 .
Eftersom kärnloggen inte visar något kan det vara så att kärnan är bra och bara skrivbordet kraschar . I så fall kan andra loggfiler vara mer användbara:
-
/var/log/gdm.log
-
/var/log/Xorg.0.log
om det existerar (hmm, vad motsvarar Wayland?)
Ansvarsfriskrivning: Jag har inte själv testat Ubuntu 18.04; detta svar är bara baserat på vad jag har läst om det.
Kommentarer
- Det finns ingen
gdm.log
, mengrep -E "EE|WW" Xorg.0.log
ger ett par rader, inklusive en ” Det gick inte att öppna DRM-enhet ”. Kan detta vara relaterat till mina GPU: er?Här är pastebin: paste.ubuntu.com/p/zJ9Gqhfq9B - Observera att
Xorg.0.log
ersätts varje gång X11-servern startar, så om du ’ redan har startat om GUI eller startat om systemet efter kraschen, titta i slutet avXorg.0.log.old
istället. - Ok, här är hela
Xorg.0.log.old
-filen: paste.ubuntu .com / p / 925mb7xMtz Tack för din hjälp! Det stårxf86CloseConsole: KDSETMODE failed
, liksomVT_GETMODE
ochVT_ACTIVATE
. Och i förväg nämnde det min GPU. - Hmm, det ser ut som en lyckad X11-serveravstängning utan några betydande fel. Om loggen kommer från en krasch är orsaken troligen att skärmhanteringsprocessen kraschar och orsakar att X11-sessionen slutar som en bieffekt. Finns det någon loggfil som matchar
/var/log/*dm.log
på ditt system? Eller om Ubuntu 18.04 har standardiserats påjournald
-baserad loggning, se till att/var/log/journal
-katalogen finns och då ska du kunna användasudo journalctl -xb -1
för att visa loggarna från föregående start hela vägen till avstängningen. - Jag borde ha skrivit ner de exakta tiderna när det hände. Idag fick jag bara den oväntade utloggningen. Det finns ingen
*dm.log
, menjounal
-tingen fungerade. Jag klistrade in loggarna runt den kritiska tidpunkten här: paste.ubuntu.com/p/37XmRYRpVK
Svar
Det här kan vara lite av ett långt skott, men jag har haft exakt samma symptom som du beskrev idag på min maskin (kraschar och sedan senare logout istället för svart skärm).
Jag är också på Ubuntu 18.04 och använder en Nvidia GPU.
Med alla som nämner att de antar att detta kan vara ett problem med Nvidida-drivrutinerna I beslutade att ge svaret i den här tråden ett skott, även om det bara delvis gällde vårt nummer:
-
Ta bort dina nvidia-drivrutiner med
sudo apt-get purge nvidia*
-
Starta om
-
Installera Nvidida-drivrutinerna igen
Hittills har jag inte haft några svarta skärmar eller plötsliga utloggningar längre
Kommentarer
- Ok, jag ’ Jag försöker detta!
- G ive oss en uppdatering om det löste problemet åt dig :).
- Snabbanmärkning: Eftersom jag använder
zsh
var jag tvungen att sättanvidia*
i citat, se github.com/robbyrussell/oh-my-zsh/issues/6748 .
Svar
En annan lösning här. Jag hade redan samma problem och jag kunde inte hitta någon av de föreslagna lösningarna som var användbara för mitt fall. Jag använde VMware-arbetsstationen och mötte samma problem när Ubuntu startar. Den främsta orsaken till kraschen i mitt fall berodde inte på grafikkortdrivrutinen eller sådana saker. Det fanns inte tillräckligt med ledigt utrymme kvar i det installerade Ubuntu. Därför följde jag följande steg för att lösa problemet.
1) ändra .vmx-konfigurationsfilen genom att lägga till följande rad i den:
bios.bootDelay = ”50000”
* Detta leder till längre start fördröjning, därför kan du använda Skift + Enter för att öppna Grub-menyn.
* Om du har problem med att öppna .vmx-filen i Windows, ändra först filtillägget till .txt och lägg sedan till den ovan nämnda raden i den och spara filen och ändra sedan filtillägget tillbaka till .vmx
2) Kör VMware och kör Ubuntu
3) Efter att ha klickat på skärmen, håll ned Skift-tangenten och tryck sedan på Enter för att komma till grubmenyn.
4) välj Avancerade alternativ för Ubuntu.
5) välj root och tryck sedan på Enter.
6) nu har du root-åtkomst för att radera alla filer för att skapa ledigt utrymme i Ubuntu.
Observera att vissa användare föreslog att använda Alt + Shift + F2 eller F3 för att få tillgång till terminalen. Detta fungerade inte för mig eftersom jag inte hade ett lösenord för rotanvändaren. Men med hjälp av följande steg hjälpte jag mig att lösa problemet.
Lycka till, Hamed
Svar
I mitt fall berodde det på gdm3 körs inte. Så jag startade om den med följande kommandon:
sudo service gdm3 status (to ckeck status) sudo service gdm3 start
Det spelar ingen roll om du använder lightgdm, gdm eller gdm. För att ta reda på vilken du använder prova sudo service --status-all | grep gdm
Svar
Här är det en annan lösning som jag inte har sett någon annanstans trodde jag att det kan vara till hjälp att dela den.
Jag använder Ubuntu 20.04 LTS, amd64 distro, och jag hade samma hängande vid start efter att ha visat ” / dev / sda1: clean … ” fel.I mitt fall var den sekundära orsaken till problemet att -disken var full .
Så, om du har detta symptom, gör en snabb df
eller df -h
för att se hur mycket utrymme du har kvar på partitionen / partitionerna. Med kommandona du
eller du -h
kan du finslipa kataloger som innehåller stora mängder data. Lösningen kan vara så enkel som att radera onödiga filer.
I mitt fall visade det sig dock att katalogen / var / log var ungefär 100 GB (?!) Som orsakades av något problem i systemet som resulterade skriftligen till / var / log / syslog-filen hela tiden och så småningom fylla i enheten. Så det var den främsta orsaken till problemet. Vid denna tidpunkt är jag inte säker på vilken resurs som är den skyldige, men att kontrollera filen / var / log / syslog kan ge några tips i ditt fall. Om detta också är fallet för dig rekommenderar jag att du undersöker hur du tar bort filen / var / log / syslog ordentligt och försöker sedan lösa den främsta orsaken till problemet.
Eftersom mitt system inte har något viktiga saker på det, därför var jag inte intresserad av att hålla loggfiler, jag installerade logrotate-paketet och ställde in en daglig rotation och konfigurerade systemet för att radera den roterade filen. Jag hittade också en stor journalfil, så jag skapade en cronjob som root för att ta bort journalfiler som är äldre än 1 dag. Detta kan du göra genom att crontab -e
som root och lägga till den här raden i slutet av filen:
0 * * * * journalctl –vacum-time = 1d
Jag gjorde också en apt-get update
och apt-get upgrade
cykel för gott mått.
Jag rekommenderar lite ytterligare läsning:
https://ma.ttias.be/clear-systemd-journal/
https://github.com/andyholmes/gnome-shell-extension-gsconnect/issues/588 https://askubuntu.com/questions/515146/very-large-log-files-what-should-i-do https://kifarunix.com/how-to-configure-log-rotation-with-logrotate-on-ubuntu-18-04-lts/
Ha roligt felsökning och lycka till,
8bitrocks
Svar
Jag hade ett problem på min dator som är relaterat till denna /dev/sd*: clean
utgåva. Jag ville inte öppna en ny fråga eftersom det redan finns så många och också för att mitt problem verkar vara löst nu. Så jag bestämde mig för att skriva ett svar på ett relaterat ämne (där jag faktiskt kan skriva ett svar och inte behöver 10 ryktepoäng eller något liknande).
Innan jag börjar, några specifikationer:
- Ubuntu 18.04.4
- Jag startar dubbelt med Windows
- Min dator har ett AMD Radeon RX 5500 XT-grafikkort
För fler specifikationer tänker jag inte på just nu — låt mig bara veta.
Mitt första möte med detta problem såg ut så här: Jag valde Ubuntu i dual-boot-menyn . Den här menyn har en lila bakgrund. När jag klickade på Enter försvann menyn (som den borde) men den lila bakgrunden stannade i minst 15 minuter. Jag bestämde mig för att starta om. Efter lite googling lyckades jag gå in i återställningsläget där jag redigerade i /etc/default/grub
raden
GRUB_CMDLINE_LINUX_DEFAULT="quiet splash"
till
GRUB_CMDLINE_LINUX_DEFAULT="quiet splash nomodeset"
Jag startade om bara för att se skärmen blinka följande meddelande
/dev/sdb1: Superblock last mount time is in the future. (by less than a day, probably due to the hardware clock being incorrectly set) /dev/sdb1: Superblock last write time is in the future. (by less than a day, probably due to the hardware clock being incorrectly set) /dev/sdb1: clean, 30163/6594560 files, 5137309/26366943 blocks
varje ~ 10 sekunder i ca ~ 0,5 sekunder. Här visste jag redan att det här problemet är relaterat till installerade grafiska drivrutiner. Jag startade om i återställningsläge igen för att avinstallera drivrutinerna för AMD-grafikkortet
$ amdgpu-pro-uninstall
Efter detta startade Ubuntu normalt, förutom att endast 1 bildskärm var känd med en upplösning på 1024×768 som jag inte kunde ändra (jag har 2 bildskärmar med 1920×1080). Efter ytterligare googling ändrade jag filen etc/fstab
från
# /etc/fstab: static file system information. # # Use "blkid" to print the universally unique identifier for a # device; this may be used with UUID= as a more robust way to name devices # that works even if disks are added and removed. See fstab(5). # # <file system> <mount point> <type> <options> <dump> <pass> # / was on /dev/sdb1 during installation UUID=b440d779-f2d8-4e85-a425-86c264cf1086 / ext4 errors=remount-ro 0 1 # /boot/efi was on /dev/nvme0n1p2 during installation UUID=4E80-9146 /boot/efi vfat umask=0077 0 1 # /home was on /dev/sdb3 during installation UUID=3b2456a3-8d84-41f8-81b1-094c3014126f /home ext4 defaults 0 2 # swap was on /dev/sdb2 during installation UUID=5d727b45-f3f0-40ad-8f6b-41528f8fb611 none swap sw 0 0
till
# /etc/fstab: static file system information. # # Use "blkid" to print the universally unique identifier for a # device; this may be used with UUID= as a more robust way to name devices # that works even if disks are added and removed. See fstab(5). # # <file system> <mount point> <type> <options> <dump> <pass> # / was on /dev/sdb1 during installation UUID=b440d779-f2d8-4e85-a425-86c264cf1086 / ext4 errors=remount-ro 0 0 # /boot/efi was on /dev/nvme0n1p2 during installation UUID=4E80-9146 /boot/efi vfat umask=0077 0 1 # /home was on /dev/sdb3 during installation UUID=3b2456a3-8d84-41f8-81b1-094c3014126f /home ext4 defaults 0 2 # swap was on /dev/sdb2 during installation UUID=5d727b45-f3f0-40ad-8f6b-41528f8fb611 none swap sw 0 0
(Jag ändrade det sista numret 1
till en 0
i den första icke-kommentarraden) . Jag installerade om AMD gpu-drivrutinen, startade om och problemet var borta. Jag skriver detta på mina två bildskärmar med upplösning 1920×1080. Jag tog också bort nomodeset
i /etc/default/grub
.
Så om någon har samma problem, kanske den här personen hittar mitt svar och kanske mitt tillvägagångssätt kommer att lösa problemet.
smartmontools
och kontrollera SMART-data på dina enheter.smartctl --all /dev/sda
.