Äkillinen kaatuminen mustalla näytöllä / dev / sda1:
On helmikuu 15, 2021 by adminJoskus ilman näkyvää syytä näyttöni muuttuu yhtäkkiä ”mustaksi” ja näyttää vain yhden tekstirivin :
/dev/sda1: clean 1068388/64102400 files, 29744985/256399616 blocks
ikään kuin järjestelmä käynnistettäisiin uudelleen. Mutta mitään ei tapahdu sen jälkeen, ja minun on painettava nollauspainiketta.
Tätä on tapahtunut nyt kolme kertaa. Kerran heti uuden aamun alkamisen jälkeen, eikä koskaan suurten tehtävien kanssa (vain avaamalla selain – ei toistettavissa). Se ei koskaan tapahtunut äärimmäisellä kuormituksella (hermoverkkojen harjoittaminen), joten olen melko varma, että tämä ei ole lämpökysymys, kuten tässä viestissä .
Löysin seuraavat epäilyttävät rivit /var/log/kern.log
-tiedostosta
... [ 0.024000] tsc: Fast TSC calibration failed ... ... [ 0.796335] dpc 0000:00:01.1:pcie010: DPC error containment capabilities: Int Msg #0, RPExt+ PoisonedTLP+ SwTrigger+ RP PIO Log 6, DL_ActiveErr+
missä viimeinen rivi näkyy kolme kertaa rivillä, mutta en tiedä mitä se tarkoittaa.
Olen käynnissä:
- käyttöjärjestelmä: Ubuntu 18.04
- ydin: 4.15.0 -39-generic (x86_64)
- Työpöytä: GNOME Shell 3.28.3
- Näyttöohjain: NVIDIA 396.45
- Kääntäjä: Clang 3.3 + LLVM 3.3 + CUDA 9.2
- Tiedostojärjestelmä: ext4
Aivan uudella pöytäkoneella, jolla on tekniset tiedot:
- Prosessori: AMD Ryzen Threadripper 1900X 8- Ydin @ 3,80 GHz (16 ydintä)
- Emolevy: ASRock X399 Professional Gaming
- Muisti: 64512 Mt
- Levy: 1050 Gt Crucial_CT1050MX + 4001 Gt Elements SE 25FF
- Grafiikka: 2x SLI NVIDIA GeForce GTX 1080 Ti 11264MB
Mistä tämä voi johtua roblem?
smartctl
Vastauksena kommentteihin
sudo smartctl --all /dev/sda
-lähtö on
=== START OF INFORMATION SECTION === Device Model: Crucial_CT1050MX300SSD1 Serial Number: 173818DBA7DB LU WWN Device Id: 5 00a075 118dba7db Firmware Version: M0CR060 User C apacity: 1.050.214.588.416 bytes [1,05 TB] Sector Size: 512 bytes logical/physical Rotation Rate: Solid State Device Form Factor: 2.5 inches Device is: Not in smartctl database [for details use: -P showall] ATA Version is: ACS-3 T13/2161-D revision 5 SATA Version is: SATA 3.2, 6.0 Gb/s (current: 6.0 Gb/s) Local Time is: Sat Nov 17 14:39:52 2018 CET SMART support is: Available - device has SMART capability. SMART support is: Enabled === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED General SMART Values: Offline data collection status: (0x00) Offline data collection activity was never started. Auto Offline Data Collection: Disabled. Self-test execution status: ( 0) The previous self-test routine completed without error or no self-test has ever been run. Total time to complete Offline data collection: ( 2783) seconds. Offline data collection capabilities: (0x7b) SMART execute Offline immediate. Auto Offline data collection on/off support. Suspend Offline collection upon new command. Offline surface scan supported. Self-test supported. Conveyance Self-test supported. Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data before entering power-saving mode. Supports SMART auto save timer. Error logging capability: (0x01) Error logging supported. General Purpose Logging supported. Short self-test routine recommended polling time: ( 2) minutes. Extended self-test routine recommended polling time: ( 13) minutes. Conveyance self-test routine recommended polling time: ( 3) minutes. SCT capabilities: (0x0035) SCT Status supported. SCT Feature Control supported. SCT Data Table supported. SMART Attributes Data Structure revision number: 16 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x002f 100 100 000 Pre-fail Always - 0 5 Reallocated_Sector_Ct 0x0032 100 100 010 Old_age Always - 0 9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 454 12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 333 171 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0 172 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0 173 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 1 174 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 1 183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0 184 End-to-End_Error 0x0032 100 100 000 Old_age Always - 0 187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0 194 Temperature_Celsius 0x0022 074 059 000 Old_age Always - 26 (Min/Max 16/41) 196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Always - 0 197 Current_Pending_Sector 0x0032 100 100 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0030 100 100 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x0032 100 100 000 Old_age Always - 0 202 Unknown_SSD_Attribute 0x0030 100 100 001 Old_age Offline - 0 206 Unknown_SSD_Attribute 0x000e 100 100 000 Old_age Always - 0 246 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 945594898 247 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 29549867 248 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 8744251 180 Unused_Rsvd_Blk_Cnt_Tot 0x0033 000 000 000 Pre-fail Always - 4424 210 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0 SMART Error Log Version: 1 No Errors Logged SMART Self-test log structure revision number 1 No self-tests have been logged. [To run self-tests, use: smartctl -t] SMART Selective self-test log data structure revision number 1 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 Not_testing 2 0 0 Not_testing 3 0 0 Not_testing 4 0 0 Not_testing 5 0 0 Not_testing Selective self-test flags (0x0): After scanning selected spans, do NOT read-scan remainder of disk. If Selective self-test is pending on power-up, resume after 0 minute delay.
Päivitä (kirjaudu ulos mustan ruudun sijaan)
Juuri nyt, mustan ruudun sijaan kirjauduin juuri ulos tilistäni ilman näkyvää syytä. Näyttää siltä, että nuo asiat liittyvät toisiinsa. Noin tapahtuman ajankohtana Vim korostaa näitä rivejä kern.log
:
Nov 19 09:44:52 Gauss kernel: [ 0.793729] dpc 0000:00:01.1:pcie010: DPC error containment capabilities: Int Msg #0, RPExt+ PoisonedTLP+ SwTrigger+ RP PIO Log 6, DL_ActiveErr+ Nov 19 09:44:52 Gauss kernel: [ 0.793735] dpc 0000:00:03.1:pcie010: DPC error containment capabilities: Int Msg #0, RPExt+ PoisonedTLP+ SwTrigger+ RP PIO Log 6, DL_ActiveErr+ Nov 19 09:44:52 Gauss kernel: [ 0.793744] dpc 0000:40:03.1:pcie010: DPC error containment capabilities: Int Msg #0, RPExt+ PoisonedTLP+ SwTrigger+ RP PIO Log 6, DL_ActiveErr+ ... Nov 19 09:44:52 Gauss kernel: [ 0.890282] RAS: Correctable Errors collector initialized. ... Nov 19 09:44:52 Gauss kernel: [ 1.026963] nvidia: module verification failed: signature and/or required key missing - tainting kernel ... Nov 19 09:44:52 Gauss kernel: [ 2.927217] scsi 10:0:0:1: Failed to get diagnostic page 0x1 Nov 19 09:44:52 Gauss kernel: [ 2.927219] scsi 10:0:0:1: Failed to bind enclosure -19 ... Nov 19 09:44:52 Gauss kernel: [ 5.227132] EXT4-fs (sda1): re-mounted. Opts: errors=remount-ro ... Nov 19 09:44:52 Gauss kernel: [ 5.602354] thermal thermal_zone0: failed to read out thermal zone (-61)
kommenteissa
Vastaa
Näyttää siltä, että X11- tai Wayland-käyttöliittymäpalvelimesi kaatuu ja vie sinut takaisin tekstitilakonsoliin. Yksi tekstirivi on luultavasti tiedostojärjestelmän tarkistuksesta, joka tapahtui järjestelmän käynnistämisen yhteydessä, ennen siirtymistä GUI-tilaan. Kun Ubuntu 18.04 käynnistää graafisen käyttöliittymän ensimmäisessä virtuaalikonsolissa, kyseinen virtuaalikonsoli ei reagoi, jos GUI-palvelin kaatuu eikä sitä käynnistetä uudelleen.
(Muut Linux-jakelut käyttivät perinteisesti graafisen käyttöliittymän seitsemättä virtuaalikonsolia, jolloin järjestelmä palasi automaattisesti oletusarvoiseen 1. virtuaalikonsoliin, jossa oli toimiva kirjautumiskehote X11-palvelimen kaatumisessa. Ubuntu ilmeisesti siirsi GUI-palvelin ensimmäiseen virtuaalikonsoliin saumattomamman siirtymisen käynnistys Splashin ja GUI-kirjautumisen välillä, mutta jos GUI-palvelin kaatuu, sinun on nyt oltava tietoinen virtuaalikonsoleista, jotta pääset käsiksi tekstitilaan kirjautumiseen kehote.)
/var/log/kern.log
-viivan rivit kirjataan kaikki muutaman sekunnin kuluessa Linux-ytimen käynnistyksestä (sekunnissa käynnistyksen jälkeen -arvon mukaan jokaisen rivin alussa olevat hakasulkeet), joten ne eivät todennäköisesti liity suoraan.
Yritä painaa Control + Alt + F2 . Jos ydin on edelleen elossa, sinun pitäisi nyt nähdä tekstitilan kirjautumiskehote mustalla näytöllä. Voit sitten kirjautua sisään ja yrittää käynnistää graafisen käyttöliittymän uudestaan sudo systemctl restart gdm
tai kerätä lokeja ja muita vianmääritystietoja tekstitilassa. Huomaa, että uudelleenkäynnistys gdm
saattaa palauttaa sinut automaattisesti käyttöliittymään, mutta toisen virtuaalikonsolin kirjautumisistunto pysyy silti kirjautuneena: voit todennäköisesti vaihtaa niiden välillä Control- Alt-F1 ja Control-Alt-F2 .
Koska ytimen loki ei näytä mitään, ydin voi olla kunnossa ja vain työpöytä kaatuu . Tällöin muista lokitiedostoista voi olla hyötyä:
-
/var/log/gdm.log
-
/var/log/Xorg.0.log
jos se on olemassa (hmm, mikä vastaa Waylandia?)
Vastuuvapauslauseke: En ole kokeillut itse Ubuntu 18.04: tä; tämä vastaus perustuu vain siihen, mitä olen lukenut siitä.
Kommentit
-
gdm.log
ei ole, muttagrep -E "EE|WW" Xorg.0.log
antaa pari riviä, mukaan lukien ” DRM-laitteen avaaminen epäonnistui ”. Voiko tämä liittyä GPU: hini?Tässä on havainto: paste.ubuntu.com/p/zJ9Gqhfq9B - Huomaa, että
Xorg.0.log
korvataan aina, kun X11-palvelin käynnistyy, joten jos ’ olet jo käynnistänyt graafisen käyttöliittymän uudelleen tai käynnistänyt järjestelmän uudelleen kaatumisen jälkeen, katsoXorg.0.log.old
sen sijaan. - Ok, tässä on koko
Xorg.0.log.old
-tiedosto: paste.ubuntu .com / p / 925mb7xMtz Kiitos avustasi! Siinä lukeexf86CloseConsole: KDSETMODE failed
sekäVT_GETMODE
jaVT_ACTIVATE
. Ja etukäteen se mainitsi GPU: n. - Hmm, se näyttää onnistuneelta X11-palvelimen sammutukselta ilman merkittäviä virheitä. Jos kyseinen loki on kaatumisesta, syy on todennäköisesti se, että näytönhallintaprosessi kaatuu ja aiheuttaa X11-istunnon loppumisen sivuvaikutuksena. Onko järjestelmässäsi
/var/log/*dm.log
vastaavia lokitiedostoja? Tai jos Ubuntu 18.04 on vakioitujournald
-pohjaiseen kirjaamiseen, varmista, että/var/log/journal
-hakemisto on olemassa ja sinun pitäisi pystyä käyttämäänsudo journalctl -xb -1
nähdäksesi edellisen käynnistyksen lokit sammutukseen saakka. - Minun olisi pitänyt kirjoittaa tarkka aika, jolloin se tapahtui. Tänään sain vain odottamattoman kirjautumisen.
*dm.log
ei ole, muttajounal
-asia toimi. Liitin lokit kriittisen ajankohdan ympärille täältä: paste.ubuntu.com/p/37XmRYRpVK
Vastaa
Tämä voi olla vähän pitkä laukaus, mutta minulla on ollut koneessani täsmälleen samat oireet, jotka kuvasit tänään (kaatumiset ja myöhemmin uloskirjautuminen mustan ruudun sijaan).
Olen myös Ubuntu 18.04 -käyttöjärjestelmässä ja käyttämällä Nvidia-GPU: ta.
Kaikki mainitsevat, että heidän oletetaan, että tämä saattaa olla ongelma Nvidida-ohjaimissa I päätti antaa vastauksen tässä säikeessä, vaikka se koskisi vain osittain ongelmaa:
-
Poista nvidia-ohjaimesi
sudo apt-get purge nvidia*
-
Käynnistä uudelleen
-
Asenna Nvidida-ohjaimet uudelleen
Minulla ei ole toistaiseksi ollut mustia näyttöjä tai äkillisiä uloskirjautumisia
Kommentit
- Ok, minä ’ kokeilen tätä!
- G Anna meille päivitys, jos se ratkaisi ongelman puolestasi :).
- Pikahuomautus: Koska käytän
zsh
-tunnusta, minun piti laittaanvidia*
lainausmerkeiksi, katso github.com/robbyrussell/oh-my-zsh/issues/6748 .
vastaus
Toinen ratkaisu tähän. Minulla oli jo sama ongelma, enkä löytänyt mitään ehdotetuista ratkaisuista hyödyllisiä tapauksessani. Käytin VMware-työasemaa ja kohdasin saman ongelman, kun Ubuntu alkoi käynnistää. Tärkein syy kaatumiseen ei ollut tapauksessani grafiikkakorttiohjaimesta tai vastaavista. Asennetussa Ubuntussa ei ollut tarpeeksi vapaata tilaa. Siksi seurasin seuraavia vaiheita ongelman ratkaisemiseksi.
1) Muuta .vmx-määritystiedosto lisäämällä siihen seuraava rivi:
bios.bootDelay = ”50000”
* Tämä johtaa pidempään käynnistykseen Tämän vuoksi voit siirtyä Grub-valikkoon painamalla Vaihto + Enter.
* Jos sinulla on ongelmia .vmx-tiedoston avaamisessa Windowsissa, muuta ensin tiedostotunniste .txt-tiedostoon, lisää sitten edellä mainittu rivi siihen ja tallenna tiedosto ja muuta sitten laajennus takaisin .vmx
2) Suorita VMware ja suorita Ubuntu
3) Kun olet napsauttanut näyttöä, pidä vaihtonäppäintä alhaalla ja paina Enter-näppäintä päästäksesi grub-valikkoon.
4) valitse Lisäasetukset Ubuntulle.
5) Valitse root ja paina sitten Enter.
6) Nyt sinulla on pääkäyttäjän oikeudet poistaa kaikki tiedostot tehdä vapaata tilaa Ubuntussa.
Huomaa, että jotkut käyttäjät ehdottivat Alt + Shift + F2 tai F3 käyttämistä päätelaitteen saamiseksi. Tämä ei toiminut minulle, koska minulla ei ollut salasanaa pääkäyttäjälle. Seuraavien vaiheiden käyttö auttoi minua kuitenkin ratkaisemaan ongelman.
Onnea, Hamed
Vastaa
Minun tapauksessani se johtui gdm3 ei ole käynnissä. Joten aloitin sen uudelleen seuraavilla komennoilla:
sudo service gdm3 status (to ckeck status) sudo service gdm3 start
Sillä ei ole väliä, jos käytät lightgdm-, gdm- tai gdm-tiedostoja. Selvittääksesi mitä käytät kokeile sudo service --status-all | grep gdm
Vastaa
Tässä on toinen ratkaisu, jota en ole nähnyt muualla ajattelin, että voi olla hyödyllistä jakaa se.
Käytän Ubuntu 20.04 LTS: ää, amd64 distroa, ja minulla oli sama ripustus käynnistyksen yhteydessä, kun näytin ” / dev / sda1: puhdas … ” -virhe.Minun tapauksessani ongelman toissijainen syy oli, että -levy oli täynnä .
Joten, jos sinulla on tämä oire, tee nopea df
tai df -h
nähdäksesi, kuinka paljon tilaa sinulla on jäljellä osio (t). du
– tai du -h
-komennoilla voit hioa hakemistoja, jotka sisältävät paljon tietoa. Ratkaisu voi olla yhtä yksinkertainen kuin tarpeettomien tiedostojen poistaminen.
Minun tapauksessani kuitenkin kävi ilmi, että / var / log-hakemisto oli noin 100 Gt (?!), Jonka aiheutti jokin järjestelmän ongelma. kirjoittamalla / var / log / syslog-tiedostoon jatkuvasti ja lopulta täyttämällä asema. Joten se oli ongelman ensisijainen syy. Tässä vaiheessa en ole varma, mikä resurssi on syyllinen, mutta / var / log / syslog-tiedoston tarkistaminen saattaa tarjota joitain viitteitä tapauksessasi. Jos tämä koskee myös sinua, suosittelen tutkimaan, kuinka / var / log / syslog-tiedosto poistetaan oikein, ja yritä sitten ratkaista ongelman ensisijainen syy.
Koska järjestelmässäni ei ole yhtään tärkeitä asioita, joten en ollut kiinnostunut lokitiedostojen pitämisestä, asensin logrotate-paketin ja asetin päivittäisen kierron ja määritin järjestelmän poistamaan käännetyn tiedoston. Löysin myös suuren päiväkirjatiedoston, joten asensin cronjobin juureksi poistamaan yli 1 päivää vanhemmat päiväkirjatiedostot. Tämän voit tehdä crontab -e
-käyttäjänä ja lisäämällä tämän rivin tiedoston loppuun:
0 * * * * journalctl –vacum-time = 1d
Tein myös apt-get update
– ja apt-get upgrade
-syklin hyväksi.
Suosittelen joitain jatkokäsittely:
https://ma.ttias.be/clear-systemd-journal/
https://github.com/andyholmes/gnome-shell-extension-gsconnect/issues/588 https://askubuntu.com/questions/515146/very-large-log-files-what-should-i-do https://kifarunix.com/how-to-configure-log-rotation-with-logrotate-on-ubuntu-18-04-lts/
Pidä hauskaa virheenkorjauksessa ja onnea,
8 bittiä
vastaus
Minulla oli tietokoneellani ongelma, joka liittyy tähän /dev/sd*: clean
-ongelma. En halunnut avata uutta kysymystä, koska niitä on jo niin paljon ja koska asiani näyttää olevan nyt korjattu. Joten päätin kirjoittaa vastauksen aiheeseen liittyvään aiheeseen (johon voin itse kirjoittaa vastauksen, enkä tarvitse 10 mainepistettä tai vastaavaa).
Ennen kuin aloitan, joitain teknisiä tietoja:
- Ubuntu 18.04.4
- Käynnistän kaksoiskäynnistyksen Windowsilla
- Tietokoneessani on AMD Radeon RX 5500 XT -näytönohjain
Lisää teknisiä tietoja en ajattele juuri nyt — vain ilmoita minulle.
Ensimmäinen tapaamiseni tästä ongelmasta näytti tältä: Valitsin Ubuntu kaksoiskäynnistysvalikossa . Tässä valikossa on violetti tausta. Kun napsautin Enter-painiketta, valikko katosi (kuten sen pitäisi), mutta violetti tausta pysyi vähintään 15 minuuttia. Päätin käynnistää uudelleen. Hieman Googlen selaamisen jälkeen onnistuin siirtymään palautustilaan, jossa muokkain /etc/default/grub
riviä
GRUB_CMDLINE_LINUX_DEFAULT="quiet splash"
muotoon
GRUB_CMDLINE_LINUX_DEFAULT="quiet splash nomodeset"
Käynnistyin uudelleen vain nähdäksesi ruudun vilkkuvan seuraavan viestin
/dev/sdb1: Superblock last mount time is in the future. (by less than a day, probably due to the hardware clock being incorrectly set) /dev/sdb1: Superblock last write time is in the future. (by less than a day, probably due to the hardware clock being incorrectly set) /dev/sdb1: clean, 30163/6594560 files, 5137309/26366943 blocks
joka ~ 10 sekuntia noin ~ 0,5 sekunnin ajan. Täällä jo ”tiesin”, että tämä ongelma liittyy asennettuihin graafisiin ohjaimiin. Käynnistyin uudelleen palautustilassa uudelleen poistaaksesi AMD-näytönohjaimen ohjaimet
$ amdgpu-pro-uninstall
Tämän jälkeen Ubuntu käynnistyi normaalisti, paitsi että vain yksi näyttö oli tunnistettu resoluutiolla 1024×768, jota en voinut muuttaa (minulla on 2 näyttöä 1920×1080). Muutaman lisätarkistuksen jälkeen muutin tiedoston etc/fstab
tiedostosta
# /etc/fstab: static file system information. # # Use "blkid" to print the universally unique identifier for a # device; this may be used with UUID= as a more robust way to name devices # that works even if disks are added and removed. See fstab(5). # # <file system> <mount point> <type> <options> <dump> <pass> # / was on /dev/sdb1 during installation UUID=b440d779-f2d8-4e85-a425-86c264cf1086 / ext4 errors=remount-ro 0 1 # /boot/efi was on /dev/nvme0n1p2 during installation UUID=4E80-9146 /boot/efi vfat umask=0077 0 1 # /home was on /dev/sdb3 during installation UUID=3b2456a3-8d84-41f8-81b1-094c3014126f /home ext4 defaults 0 2 # swap was on /dev/sdb2 during installation UUID=5d727b45-f3f0-40ad-8f6b-41528f8fb611 none swap sw 0 0
tiedostoksi
# /etc/fstab: static file system information. # # Use "blkid" to print the universally unique identifier for a # device; this may be used with UUID= as a more robust way to name devices # that works even if disks are added and removed. See fstab(5). # # <file system> <mount point> <type> <options> <dump> <pass> # / was on /dev/sdb1 during installation UUID=b440d779-f2d8-4e85-a425-86c264cf1086 / ext4 errors=remount-ro 0 0 # /boot/efi was on /dev/nvme0n1p2 during installation UUID=4E80-9146 /boot/efi vfat umask=0077 0 1 # /home was on /dev/sdb3 during installation UUID=3b2456a3-8d84-41f8-81b1-094c3014126f /home ext4 defaults 0 2 # swap was on /dev/sdb2 during installation UUID=5d727b45-f3f0-40ad-8f6b-41528f8fb611 none swap sw 0 0
(Muutin viimeisen 1
-numeron 0
ensimmäiselle ei-kommenttiriville) . Asensin AMD GPU -ohjaimen uudelleen, käynnistin uudelleen ja ongelma oli poissa. Kirjoitan tämän kahdelle monitorilleni 1920×1080-tarkkuudella. Poistin myös nomodeset
kohdassa /etc/default/grub
.
Joten jos kenellekään on sama ongelma, ehkä tämä henkilö löytää vastaukseni ja ehkä lähestymistapani ratkaisee ongelman.
smartmontools
ja tarkistaa asemiesi SMART-tiedot.smartctl --all /dev/sda
-lähtö.