zase ta nvidia... a zničehož nic!

Jsou tu:
kernel 2.6.40.6-0.fc15.i686
GNOME 3.0.1
GeForce 8500 GT
akmod-nvidia.i686 (1:280.13-2.fc15.3)
kmod-nvidia-2.6.40.6-0.fc15.i686.i686 (1:280.13-2.fc15.3)
nvidia-settings.i686 (1.0-11.fc15)
nvidia-xconfig.i686 (1.0-9.fc15)
xorg- x11-drv-nvidia.i686 (1:280.13-1.fc15)
xorg-x11-drv-nvidia-libs.i686 (1:280.13-1.fc15)

Na neměnné sestavě mi již několik vydání fedory zpátky bezvadně a fakticky bezzásahově fungovaly ovladače z rpmfusion. Až doteď…
Můj způsob používání fedory se vyznačuje tím, že vždy bootuju do textového režimu, nejen abych se vyhnul všelijakým těm splashím, gdm a jiným ohavnostem, ale abych si třeba i při bootu povšiml nějakého problému. Tentokrát jsem si nepovšiml žádného a poněvadž jsem do grafiky nijak nespěchal, ještě v textu jsem (jakož obvykle činívám) spustil yum update. Z logu vyplývá, že aktualizace byla docela tučná:


Oct 25 15:42:45 Updated: 1:perl-Pod-Escapes-1.04-162.fc15.noarch
Oct 25 15:42:46 Updated: 1:perl-Module-Pluggable-3.90-162.fc15.noarch
Oct 25 15:42:47 Updated: 1:perl-Pod-Simple-3.13-162.fc15.noarch
Oct 25 15:42:55 Updated: 4:perl-libs-5.12.4-162.fc15.i686
Oct 25 15:43:12 Updated: 4:perl-5.12.4-162.fc15.i686
Oct 25 15:43:13 Updated: 1:perl-Locale-Maketext-Simple-0.21-162.fc15.noarch
Oct 25 15:43:13 Updated: 1:perl-Params-Check-0.26-162.fc15.noarch
Oct 25 15:43:14 Updated: 1:perl-Module-Load-0.16-162.fc15.noarch
Oct 25 15:43:15 Updated: perl-Module-Load-Conditional-0.34-162.fc15.noarch
Oct 25 15:43:15 Updated: 1:perl-Log-Message-0.02-162.fc15.noarch
Oct 25 15:43:16 Updated: 1:perl-Digest-SHA-5.47-162.fc15.i686
Oct 25 15:43:17 Updated: 1:perl-ExtUtils-ParseXS-2.2206-162.fc15.noarch
Oct 25 15:43:18 Updated: 4:perl-devel-5.12.4-162.fc15.i686
Oct 25 15:43:20 Updated: perl-ExtUtils-MakeMaker-6.56-162.fc15.noarch
Oct 25 15:43:21 Updated: perl-Test-Harness-3.17-162.fc15.noarch
Oct 25 15:43:22 Updated: perl-CPAN-1.9402-162.fc15.noarch
Oct 25 15:43:23 Updated: 1:perl-IPC-Cmd-0.54-162.fc15.noarch
Oct 25 15:43:23 Updated: perl-File-Fetch-0.24-162.fc15.noarch
Oct 25 15:43:24 Updated: 1:perl-Archive-Extract-0.38-162.fc15.noarch
Oct 25 15:43:24 Updated: perl-Log-Message-Simple-0.06-162.fc15.noarch
Oct 25 15:43:25 Updated: perl-Term-UI-0.20-162.fc15.noarch
Oct 25 15:43:26 Updated: 1:perl-Object-Accessor-0.36-162.fc15.noarch
Oct 25 15:43:26 Updated: perl-Module-CoreList-2.50-162.fc15.noarch
Oct 25 15:43:27 Updated: 1:perl-Module-Loaded-0.06-162.fc15.noarch
Oct 25 15:43:27 Updated: 1:perl-Package-Constants-0.02-162.fc15.noarch
Oct 25 15:43:29 Updated: perl-CPANPLUS-0.90-162.fc15.noarch
Oct 25 15:43:30 Updated: 1:perl-ExtUtils-CBuilder-0.27-162.fc15.noarch
Oct 25 15:43:30 Updated: perl-ExtUtils-Embed-1.28-162.fc15.noarch
Oct 25 15:43:31 Updated: 1:perl-IO-Zlib-1.10-162.fc15.noarch
Oct 25 15:43:31 Updated: perl-Time-Piece-1.15-162.fc15.i686
Oct 25 15:43:32 Updated: perl-core-5.12.4-162.fc15.i686
Oct 25 15:43:40 Updated: clamtk-4.36-1.fc15.noarch
Oct 25 15:43:42 Updated: mock-1.1.16-1.fc15.noarch
Oct 25 15:43:47 Updated: pybliographer-1.2.15-2.fc15.noarch
Oct 25 15:43:51 Updated: avr-libc-1.7.1-1.fc15.noarch
Oct 25 15:43:52 Updated: sane-backends-libs-1.0.22-5.fc15.i686
Oct 25 15:43:55 Updated: sane-backends-1.0.22-5.fc15.i686
Oct 25 15:44:00 Updated: avr-gcc-4.6.1-3.fc15.i686
Oct 25 15:44:02 Updated: avr-gcc-c++-4.6.1-3.fc15.i686
Oct 25 15:44:04 Updated: sane-backends-drivers-scanners-1.0.22-5.fc15.i686
Oct 25 15:44:27 Updated: kdelibs3-3.5.10-31.fc15.i686
Oct 25 15:44:30 Updated: ibus-chewing-1.3.10-1.fc15.i686
Oct 25 15:44:33 Updated: nautilus-dropbox-0.7.0-1.fc10.i386
Oct 25 15:44:34 Updated: dcraw-9.11-1.fc15.i686

Pak jsem se normálně přepnul z roota zpět a nastartxoval grafiku. Nenaběhla, zamrzla. Po letech. Tak nějak zamrzly i periferie. S kurzorem hýbat (ale nic jiného) šlo, klávesnice přepnout do jiné konzole neumožnila, nereagoval ani numlock. A dál jsem se už nikdy nedostal. Při dalších bootech v textovém režimu funguje vše (co jsem zkoušel), jen přechod do grafiky ne. Ani ve starších jádrech. Nefunguje ani boot rovnou do grafiky, to na mě jen vybafne něcotakového malého, bílého, kulatého a ošklivého, s čím lze po monitoru posouvat, ale to je asi tak všechno. V xorg.0.logu se lze dočíst:


[   417.777] (EE) NVIDIA(0): Failed to allocate 2D engine
[   417.779] (EE) NVIDIA(0):  *** Aborting ***
[   417.780] (EE) NVIDIA(0): Failed to allocate 2D objects
[   417.780] (EE) NVIDIA(0):  *** Aborting ***
[   417.780] (EE) NVIDIA(0): Error recovery failed.
[   417.780] (EE) NVIDIA(0):  *** Aborting ***

Dříve jsem si ničeho takového nevšiml. Důvod, proč tady vše popisuji, tkví v tom, že mi absolutně není jasné, proč tento problém nastal a proč právě po této aktualizaci. Xorg.conf jsem rozhodně nijak neměnil. Chěl bych se zeptat, zdali někdo nezaznamenal podobnou zkušenost, či zda někdo z výpisu aktualizace neodhalí důvod tohoto nezdárného chování (četl jsem kdesi cosi o nefunkčnosti proprietárních nvidia ovladačů v fc16, ale proč tady a teď?), nebo jestli mi prostě nezbývá než se pokorně uchýlit k nouveau ovladačům, s nimiž jsem doposud nemusel mít tu čest.

  1. Nouveau uz davno neni takova hruza - pouzivam ho na Gnome3 bez problemu.
  2. Zkus reinstalovat nvidia ovladace.
  3. Zkus pomoci “yum history” zjisti cislo transakce a pomoci “yum history undo ID” zkus zrusit tu aktualizaci kterou popisujes.

Osobne v ni nevidim nic zavadneho, ale treba akmod pouziva perl a pri rebootu rekompiloval z nejakeho duvodu kmod… tezko rict.

Dík za odpověď. Stručně popíšu, co jsem mezitím dělal. Napřed jsem si výše v yum.logu všimnul, že den před začátkem potíží se aktualizoval balíček akmods. V tu chvíli padlo podezření na něj, protože při inkriminovaném bootu měl vlastně poprvé příležitost podílet se na kompilaci. Takže jsem dal yum downgrade akmods a v klidu čekal, že bude po problémech. Nebylo, ixka zase nenaběhly. Pak jsem zkoušel různé varianty od- a přeinstalací nvidiáckých balíčků, verzi úplně bez akmodů, pořád to nešlo. Nakonec jsem tedy všechno stran nvidie z rpmfusion odinstaloval, že tedy zkusím to nouveau. Potěšilo mě, že si systém sám odstranil kernelargument, jenž ho blacklistoval a spokojeně se těšil, jak to naběhne. Nenaběhlo, a to ani do konzole! Jednu chvíli na mě prostě nouveau začalo vykřikovat nějaké pgraphické chyby (ILLEGAL_MTHD nebo ILLEGAL_CLASS nebo ještě něco jiného), kouslo se a opakovaně s ním nebyla žádná další řeč. To už jsem si dost zoufal, ale řekl jsem si, že ještě než si půjdu koupit novou grafárnu, zkusím live cd. První mi padla do ruky fc12. Zkusil jsem ji spustit defaultně do grafiky a nenaběhla. Pak jsem našel cd s fc15, zvolil boot do vesa režimu a oproti všem mým očekáváním systém sice strašlivě pomalu, ale nakonec úspěšně naběhl (do fallback modu pochopitelně). Takže jsem zkusil z live cd fc15 normální boot, raději bez rhgb quiet a do textu. Během bootování jsem nezaznamenal nic podezřelého. V konzoli jsem rozechvěle přihlásil liveusera a odklepl startx. Systém normálně NABĚHL do Gnome Shellu! Pak jsem zkusil zase boot z harddisku. Napadlo mě ještě přidat kernelargument vmlinuz0. Systém naběhl a od té doby je vše v pořádku. Jsem sice dost rád, že to chodí, ale jsem taky dost nerad, že nevím proč a příhodě se všemi těmi illegály vůbec nerozumím.

Jinak závěr pochopitelně je, že jsem měl nouveau používat už dávno (google earth vypadá fantasticky), ale měl jsem nvidia ovladače tak nějak zažité, a když to fungovalo…

Jo, a děkuji za yum history. To jsem neznal ( = tak daleko jsem man yum nikdy nedočetl).

Jásot v minulém příspěvku byl nepatřičný. Grafika jednak zamrzala při nečinnosti, tu a tam se kousla za běhu jen tak sama od sebe, zdařil se jeden boot z mnoha a i illegálové se kradí navraceli. Při dalším pátrání po příčinách mě trklo, že mi epylog (jehož reporty se v tomoto období rozrostly až někam k těžko uvěřitelným 2 MB) mimo jiné přinesl tuto:

NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context

nebo tuto informaci:

[drm] nouveau 0000:01:00.0: PFIFO_CACHE_ERROR - Ch 2/7 Mthd 0x1ffc Data 0xffffffff

Pak jsem udělal dvě věci. Pořádně jsem vyluxoval skříň a do kernelargumentů namísto zjevných hovadin, k nimž jsem se přiznal výše, přidal parametr nolapic_timer. Takže nyní jsem už asi 15 hodin (současný uptime 12 hodin) bez problémů. Ale pořád nevím, jestli je to tím, že se stroj pořádně chladí (stěnu jsem ještě zpět nevrátil) nebo něčím jiným.

Opravdu to vypada skoro na nejaky HW problem. Nezkousel si kartu vyndat a zandat do slotu, zda se nejak nepovysunula? Dalsi moznost je, ze ti v systemu zustala strasit nejaka knihovna k Xorg, ktera tam nema byt. Tezko rict co presne ale zkus neco jako
rpm -v -V rpm -qa | grep mesa
pro verifikaci obsahu baliku mesa apod.

Jen aby téma nezůstalo bez pointy. Po celou dobu se dělo to, že karta pomalu odcházela, občas se ještě vzpamatovala, dokonce jsem s ní úspěšně upgradeoval na fc16, až mě před týdnem opustila definitivně. Po čtyřech letech. Nic moc.

Já měl podobný problém s nvidií minulý týden, kdy přišlo nové jádro ale ne update rpmfusion. Vše se spravilo až včera. Lidský omyl respektive nekoordinace. To samé s flashpluginem pro firefox. Tam pro změnu zřejmě updatovali stránky. Už je vše OK.