pad systemu - tvrdy restart, jak najit pricinu?

Toto čo si ty opisoval som mal aj ja na svojom PC tiež tam bol Linux ale iná odroda (distribúcia), a problém bol zlý disk a nie chyba SW

zdravim,
asi to nebude uplne stejnej problem, ale FEDORA 12 (32bit) se mi chova podobne. Bez problemu ji nainstaluju, prihlasim, a chvili to funguje, pak cca. po pul hodine od instalace a prvniho pusteni to zatuhne, tak, ze se rozmaze obrazovka a musim tvrde restatovat. Pote uz se to chova dost nestabilne, vetsinou pri nekolika dalsich spusteni to samo restartuje pocitac casto jeste v dobe startu systemu, ale neni to vzdy, nekdy to v pohode nabehne a pak se to restartuje kdykoliv a pri jakykoliv akci vetsinou po kratke chvili.
Jedine co jsem vypozoroval, ze je vzdy stejne, je to zatuhnuti po nove instalaci. Pak uz to pada v ruznych mistech a ruznych casech.

  1. disk to nebude - zkousel jsem 2 ruzne a vzdy stejny efekt. Navic na tom jednom bezi Windows XP bez problemu.
  2. Pamet (4GB ) to asi taky nebude, delal jsem nekolik testu asi 13 hodin a vse bylo ok.
  3. Dival jsem se do /var/log/messages a tam taky nic neni.
  4. Procesor - myslel jsem ze by to mohlo byt take prehrivanim procesoru, ale nainstaloval jsem si lm_sensors, pridal na panel, a teploty se pohybuji vetsinou cca. od 37 - 47 stupnu.

Nevim jestli to muze souviset, ale mel jsem na svem pocitaci problem s externim diskem HD 320GB, ktery se dal pripojit pouze nekdy a k nekterym USB portum a to jeste vetsinou fungoval pouze na USB 1.1 a nikolv na 2. Coz by mohlo souviset s nedostatecnym napajenim USB deskou…, ale jestli to muze naznacovat nejaky problem na desce to opravdu netusim, ani nevim jak bych to mel pripadne otestovat. Nemate nekdo prosim nejaky napad co bych mohl jeste zkusit, uz opravdu nevim…

############
Ted se mi podarilo v textovym modu dostat vypis kdyz to zrovna zatuhlo, obsahuje informace jako:

kernel-panic-not syncing: Fatal exception in interrupt

bad_area_nosemaphore
error_code +0x73/0x78
_run_hrtimer +0x73/0x78
apic_timer_interrupt

posledni hlaska:
drm:[drm_fb_helper_panic] *ERROR**panic occurred, switching back to text console

Bylo tam toho vic, ale tohle mi prislo nejzajimavejsi. Moc tomu sice nerozumim, ale troufl bych si tvrdit ze to opravdu souvisi s procesorem. Muj procesor je AMD Athlon X2 5200+, 2,7 GHz dual-core. Kdyz se mi nahodou podarilo dostat do GUI, tam jsem si pridal take informace o procesoru, kde mi tvrdi, ze mam v podstate 2 procesory a ze implicitne zobrazi cpu0 a jeho frekvence 1 GHz, kdyz to nastavim na plnou 2.7GHz tak zacne rust teplota az na nejakych 60 stupnu. To mu bych i rozumel, pokud on jak on rika ma 2 procesory z nich kazdy by mel zvladnout polovinu z 2.7 GHz. Jenze nechapu, proc ma 2? V nazvu je sice DUAL, ale je to prece jenom jeden fyzicky procesor, tak proc to linux rozdeluje na 2 logicke?
Nicmene zpatky k te chybe, rozumel bych z toho, ze ty radoby 2 procesory maji problem se domlouvat, predavat rizeni nebo tak neco.
Muzete mi poradit jestli z te chyby neco rozumneho vyctete, pripadne co bych mohl jinak nastavit? Predem dekuji za jakekoliv napady, protoze me uz dochazeji.

Mozna trochu z krizkem po funusu ale…
Na zalohovani muzes taky pouzit clonezilla z teto stranky http://clonezilla.org/
Je to live CD a umozni ti zalohovat, kopirovat cely disk i jednotlive oddily. Z disku na disk z disku na sit apod. Muzes naklonovat disk a nebo jenom vytvorit image a pak z nej obnovit na jiny disk. Docela pekny program.

FL

DRM - Drirect Rendering Manager - problem bude v graficke karte. A to dost mozna v ovladaci. Tzn. co mas za grafiku a jako pouzivas ovladac?

Athlon X2 je dvoujadrovy procesor - tzn. v podstate dva procesory v jednom futralu.

aha, tak to uz jsem asi doma. Mam nvidia geforce 6100, vzhledem k tomu, co se pise vsechno na tomto foru o nvidii, tak by to mohl byt skutecne problem. Jenom me zaskakuje, ze se z toho system takovym zpusobem slozi a tak jsem myslel, ze je problem jinde.
Ted nejsem u sveho pocitace, ale mam pocit, ze tam je ovladac ‘nouveau’.
Zkusim tedy aplikovat postup na instalaci ovladace nvidia podle prirucky na wikine.
Teda pokud se mi podari vubec prihlasit.:slight_smile:
Diky moc za voditko.

tak bohuzel ani po nainstalovani ovladace graficke karty podle prirucky, neprineslo zmenu. Porad to zamrzava, nebo se restartuje, ted dokonce uz mi to nedovoli ani nabootovat, okamzite po spusteni boot linuxu skoci cerna obrazovka a blikajici kursor.

Nicmene jeste pred tim jsem stihl overit jestli ovladac byl opravdu nainstalovan spravne.
Zkouse jsem se take divat jestli funguje akcelerace ‘glxinfo | grep -i render’, tak to skutecne vypsalo:
direct rendering: Yes
OpenGL renderer string: GeForce 6150SE nForce 430/PCI/SSE2
Coz predtim nefungovalo.

Uz v /var/log/message se neobjevuje informace o problemech s ‘nouveau’, protoze je nainstovana jiz nvidia. Ale zase se tam zacal objevovat hlaska jako:

  • FAST TSC calibration failed (ta tam byla myslim pouze jednou, takze to asi nebude ten problem…)
  • AMI BIOS detected: BIOS may corrupt low RAM, working around it (to uz tam bylo vicekrat a zrejme v dobe kdy to take padalo). Ta moje grafika je vestavena na zakladni desce, takze pamet ma prirazenou z RAM (ted je nastaveno na 128 MB), nemuze to zpusobovat jeste nejake problemy?

Stejnou grafiku jsem do nedavno dlouho pouzival a zadny problem jsem s ni nemel.
To s tim ze hned po startu linuxu naskoci cerna obrazovka je divne. Zkus ve startovacim menu zmacknout “e” a nakonec radku zacinajiciho “kernel” pripis “nomodeset” a umaz “rhgb quiet”, uvidis podrobne informace o startu systemu. Pokud se to “zasekne” az pri startu grafickeho rozhrani, tak stejnym zpusobem na konec radku pripis “3” - nastartujes do textoveho rezimu, tam se prihlas, a podivej se do /var/log/message a /var/log/Xorg.0.log (tam bude zaznam startu GUI z minuleho bootu).

tak jsem to udelal jak pises, ale az po novy instalaci, protoze ta predchozi uz vubec nenabootovala.
Presne jak jsem by v grafickym rozhrani tak to zatuhlo, zrestartoval jsem to v textovym rezimu a podival jsem se do logu Xorg.0.log a vubec nic tam nebylo, jenom informace jak se vsechno podarilo v tom predchazejicim behu… To same v /var/log/message - posledni hlaska byla neco jako ze pulseaudio: pid_c: Daemon already running
a pak nic az zase nove bootovani systemu.
Nemuze treba vadit, ze mam geforce 6100 a treba na tom vypisu te 3d akcelerace to vyhodi:
OpenGL renderer string: GeForce 6150SE nForce 430/PCI/SSE2?

A opravdu je ten pocitac zatuhly? Nemas proste jen cernou obrazovku tzn. nic se zi nezobrazuje? Zkousel ses prepnout do textoveho rozhrani (Ctrl+Alt+F2)? Priznam se ze nevim jaky je rozdil mezi temi grafickymi kartami - 50SE bude zrejme nejaka slabsi verze, ale stejne nevim jak presvedcit ovladac, aby detekoval jinou grafickou kartu. Mimochodem v tom logu Xorg.0.log bylo ze se pouziva ovladac “NOUVEAU” nebo “NVIDIA”?

je opravdu zatuhly, navic se mi to obcas stalo i v textovym rezimu, ale vetsinou ze 3 pripadu se 2x restartuje a jednou zatuhne. Ten ovladac tam mam jiz NVIDIA, ktery jsem nainstaloval jelikoz jsem myslel, ze tim se vyresi prave Ten problem. Takze se nechtene chovani zmenou ovladace nezmenilo.

Pokud se to stava i v textovem rezimu, tak to je skutecne podivne. Zkus jeste pridat parametr “nomodeset” na radku kernel v zavadeci, pripadne uprav Xorg tak aby se pouzival ovladac “vesa” - jak najdes jiste popsano na spouste mist.

tak ani nastaveni driveru na ‘vesa’ nepomohlo. chova se to porad stejne. zrejme to nebude nakonec problem s ovladacem grafiky, ale spis opravdu nejaky problem s HW, potom by bylo ale divne ze Windowsy jedou bez problemu…

Hele, zkopiruje sem celou tu hlasku co z ni je nahore jen vycuc - pokud ji mas - ono totiz je mozne ze to DRM vubec nesouvisi s tim kernel exception co je tam predtim. Mohla by to byt taky nejaka blbost s hrtimerem nebo apicem (zkus pridat ke kernelu parametr “noapic”).

Tu hlasku co jsem tam nahore vypsal bohuzel nemam, protoze mi ta obraozvka vykysla, pokousel jsem se to vyfotit, ale z nevalnym uspechem, tak jsem si poznamenal pouze to co se mi zdalo dulezite.

tak to jsi ted mozna uhodil hrebicek na hlavicku, sice to zase spadlo jak jsem nastavil jako posledni parameter kernelu noapic a ani kdyz jsem v BIOSu nastavil APIC na DISABLED, tak to taky nepomohlo, ale pak jsem zkusil jeste krome ‘noapic’ pridat jako parametr ‘acpi=off’ a od te doby se to zatim drzi, coz uz je vic jak hodina.
Nejsem si uplne jisty dopadem techto nastaveni, jestli tim nesnizuji take trochu vykon pocitace, jelikoz jak jsem se docetl tak prave APIC je tam od toho aby ty 2 procesory umely spolu lepe komunikovat…
Pripadne nebylo by jeste lepsi, kdyby se tyto parametry nastavily jiz pri instalaci? Pokud ano, pak jak bych toho mohl dosahnout?
A co ten hrtimer, mel bych pripadne zkusit nastavit jeste neco?

Covexi, jinak ti patri velke diky moc za bleskurychle reakce a pomoc:-)

APIC je “funkce” pro obsluhu preruseni (puvodne melo PC jen 15 IRQ, coz je na dnesni PC casto malo - pro domaci PC bez spousty periferii to ale stale staci), ma i nejake dalsi vyhody, ale neni to zivotni nezbytnost. Muzes nakonec zkusit jen parametr “acpi=off” a “noapic” zrusit.

ACPI je naproti tomu sprava napajeni (nahrada za APM).

Kazdopadne pokud je problem s jednim nebo druhym, byva casto na vine chyba v BIOSu.