nvlddmkmやPK41病系のブラックアウトはメインメモリ(RAM)が原因だった!(大嘘)

2023/4/29追記

結局グラボ自体が壊れました。本記事は私の環境下では無意味でした。

okometsubulog.hatenablog.com

===========================

 

我が家のPCではデスストランディング等の負荷のかかるゲームをプレイすると度々ブラックアウトが発生するようになってしまいました。以下過去記事。

 

 

okometsubulog.hatenablog.com

okometsubulog.hatenablog.com

我が家の場合の状況を整理するとこういう感じになっていました。

 

■ブラックアウトが発生する状況

  • ブラウザやメール等を使っているときは一切起こらない
  • デスストランディング3DMark等でGPUを使う時にブラックアウトが発生。頻度は1日1,2回。
  • デスストランディング3DMark等のアプリを閉じた後2,3分後にブラックアウトするというのも稀に発生
  • 上記よりGPUに原因がありそう(※イマココ)

 

という感じです。で、Windowsにはイベントビューアというログ機能が標準で備わっています。虫眼鏡から「イベント ビューア」※"イベント"の後にスペースが必要。割と罠

 

で検索すると出てくると思います。

 

 

見るべきポイントはWindows ログの「システム」の部分。

 

 

で、これでブラックアウトが発生した時間帯のエラー状況を確認した所、症状がバラバラでしたが、概ねGPU側に問題がありそうなエラーが多かったです。

 

■発生したエラー内容

  • ソース "nvlddmkm" からのイベント ID 0 の説明が見つかりません。
  • Kernel Power 41問題(BugcheckCode 0 or BugcheckCode 278)

 

nvlddmkmはNVIDIAのドライバーからのエラーらしいので、やっぱGPUかなぁという感じ。

 

で、Kernel Power41にも種類があるらしく「詳細」のBugcheckCodeで種類が分かるんだとか。0の場合は不明で278の場合はグラフィック系絡みっぽというのが分かった。

 

あかん。GPUが故障してる匂いがプンプンする。

 

GPUはパソコンの中でもかなり高価なもので、私が入れてるのは6~8万円ぐらいする超絶御高いしなものなのだ。こんなのもう一回買いたくない!!!(RTX 3060Ti)

 

対策方法として色々調べましたが効果無し。以下試したことを一応まとめます

 

■試してきたこと・無駄だったもの編

  • PCのメインメモリチェックmemtest86+でメモリ診断→12周して問題なし
  • 「最小のプロセッサの状態」を5%から100%にする(電源カスタマイズ)

以下参考URLより引用させていただきます。

ついに解決「ディスプレイ ドライバー nvlddmkm が応答を停止しましたが、正常に回復しました。」問題 | ひとりアウトプット広場

https://www.losspass.com/article/nvlddmkm.html

「コントロールパネル」(⇒「システムセキュリティ」)⇒「電源オプション」⇒現在設定しているプランの「プラン設定変更」を選びます。

~~~

その開いたウィンドウの「詳細設定」タブ(または「詳細な電源設定の変更」)で、「プロセッサの電源管理」の中にある「最小のプロセッサの状態」設定が5%になっていたので、100%にしました。
同じく、最大のプロセッサの状態も100%に変更しました。

 

  • ブラックアウトが発生したらGPUを再起動(※ [Windows]+[Ctrl]+[Shift]+[B]キー 同時押しで数秒程度落ちるがGPU再起動可能らしい。が、立ち上がってこなかった。)
  • 垂直同期をオフにすると改善するらしい→ダメでした。
  • Nvidia コントロール パネルで「最大パフォーマンスを優先する」設定→ダメでした
  • 逆に「最大パフォーマンス」を「バランス」にしたら改善する記事があったので試す→どっちもダメでした。

以下参考にさせて頂いたURL。海外サイト。

How to fix "The description for Event ID 0 from source nvlddmkm cannot be found"?

ttps://ugetfix.com/ask/how-to-fix-the-description-for-event-id-0-from-source-nvlddmkm-cannot-be-found/

  • ゲームをフル画面じゃなくウィンドウでやると改善するらしい噂を聞く→ダメでした
  • 「デバイス管理」で使っていないオーディオドライバをひとつずつ無効化する→ダメでした※なんか干渉することがあるらしい。でも今回はだめ。
  • BIOSバージョンアップ未実施
  • GPUドライバアップグレード実施→ブラックアウト発生後2回ぐらいバージョンがアップされたが無駄でした
  • 面倒なのでGPUドライバ再インストール未実施
  • Displayポートがおかしいかも?と思いHDMIケーブルで試す→ダメでしたそりゃそうか

 

ということで、全然だめ。後は電源の故障の問題も頭をちらついてくる。こっちも取り換えるの面倒そう。大体BIOSのバージョンアップとかで治った!って人を見たことが無いので期待してない。「まず最初にやりましょう」って記事良く見るけどね。

 

が、調べているうちに、一縷の望みが出てきました。以下Tack'nさんの記事を引用します

 

【解決】CPUとグラボをアップグレードしたらブラックアウトのトラブル発生!

https://www.tackn.jp/post-5375.html

さらに言うと、このメモリは購入直後に行ったmemtest86の検査もパスしています。

~~~

今回のトラブルの原因はメモリである可能性が高いのではないかと考えました。

 

上記記事ではRyzenシリーズの話で私はIntelなので全く関係ありません。全く関係ありませんが、ともあれ、同じ症状が出ている人でmemtest86+でメモリエラーが出ていないが、それでもメモリが原因であることを記載していました。

 

記事の中で「OCCTのVRAMテスト」を実施した所、問題が再現されたということで、私もさっそく「OCCT」をダウンロードしてVRAMのテストを実施してみました。以下公式サイトと思いますが、合ってるか不明だし負荷試験ツールなので自己責任での確認をお願いします。※割と老舗っぽいから大丈夫か?

 

ttps://www.ocbase.com

 

Downloadページから、←側を選択しました。インストールタイプではなく即実行タイプなので適当なフォルダに入れて動かす感じです。

 

 

ということで、VRAMテストを実行

 

 

すると・・・PCがブラックアウトした!!つまり、VRAMを使うとなんか良い感じに落ちるのだ!!!

 

でも、ブラックアウトしてしまうのでレポート記録が残らないのでした・・・原因が特定できてねぇ・・・分からないけれども、VRAMの試験で起こるのでVRAMが悪いってことでいいんじゃないかな・・・

 

じゃあ次にVRAMってなんやねん!って話になるのですが、VRAMとは「GPUに搭載されたメモリ」のことらしい。以下ドスパラプラスサイトより引用します。

 

VRAMとは?ビデオメモリとの違いは? - | 法人様向けパソコンならドスパラプラス

https://dosparaplus.com/library/details/000734.html

VRAM( Video Random Access Memory) とは、 VRAMは映像をモニター出力することに特化した パーツ「GPU」に搭載されているメモリのことです。VRAMはVRAMに分けられますが、そもそもRAMというのは高速で読み書きができるデータ保存領域のことで「メモリ」とも呼ばれます。PCスマートフォンでよく聞かれる「メモリ」はRAMのことです。そのためVRAMは「ビデオメモリ」と呼ばれることもあります。 

 

ダメじゃん!!やっぱGPUが問題じゃん!!!GPU交換しないと!!!

 

って思ったのですが、参考にさせて頂いたサイトでは何故か「メインメモリ」である主記憶装置(RAM)を交換して問題が解決されていました。

 

あれ?VRAMとRAMって全然違うから関係なくないの?って思いましたが、参考にさせていただたサイトでは「UMA Frame Buffer Size」をいじっておりました。じゃあ今度はこの「UMA」ってなんやねん!を調べればいいわけだ。

 

以下IT用語辞典バイナリサイトより引用させて頂きました。

UMAとは 「Shared Memory Architecture, SMA」 ユーエムエー: - IT用語辞典バイナリ

https://www.sophia-it.com/content/Unified+Memory+Architecture

UMAとは、パソコンの画面表示用の専用メモリとして、メインメモリの一部を活用する技術のことである。

UMAを使うと、画面表示用の専用メモリを用意する必要がなくなるため、製品自体のコストの削減に大きな効果を発揮する。

 

ビンゴ!これや!!!「メインメモリの一部を活用する技術」や!!!

 

なるほど、つまり稀にブラックアウトが起こるのはこのUMAを使ってたまーにメインメモリの壊れた部分に遭遇した時に発生してるっていうわけか!!!

 

だから通常時は画像処理なんて大したことしてないし、メインメモリ16GBもあるので使わないメモリも大量にありそうなので通常パソコン使用時には引っかからなかったってことかも!?

 

ということで、さっそく8GB * 2本刺ししているので、一本抜いてみた。GPUファンからの風が当たって故障しそうな方を抜いてみた。

 

これがビンゴ!4日たってもOCCTで負荷かけてもデスストランディングしても3DMarkしても落ちない!!!!!

 

まだ4日しか経ってませんが、1日1回は起こっていたし、負荷試験を何回もかけて起こっていない状況を見るに、これはかなりの確率でメインメモリが問題だったと言っていいんじゃあないでしょうか!嬉しい!!!

 

Tack'nさんの記事のおかげで助かりました。本当にありがとうございました!(※直接御礼を言いに行かない人間の屑)

 

で、今8GBでデスストランディングをプレイしてるのですが、遅延を感じません。あれ、今の時代でもメインメモリ8GBで余裕なんだね・・・

 

グラフィック設定「中」にして負荷落としたりしてるからこんなもんか。ただ、動画編集時はメモリを大量に使うらしいのでやっぱもう1枚物理メモリ買うかなぁ。それか過去に持ってたPCの残骸に8GB * 2個残ってるのでそっから付けるかどうか。

 

ともあれ、無事メインメモリ(RAM)だけで済んで良かったねって話でこの話はおしまいです。いやー、メインメモリは3000円前後なので安価で本当に助かった。

 

が、実はRAMが直接的な原因じゃないかもしれない問題が残っている。

 

RAMが原因以外のケース想像

  • マザーボードのメインメモリが刺さるスロット側が壊れている可能性
  • メインメモリとGPUの相性が悪くて落ちてる可能性
  • 抜いたスロットの部分だ相性悪いとかそういうやつも要検討

 

参考にさせて頂いたサイトでもメインメモリとGPUの相性問題っぽいことから始まってるので、RTX 3060 Tiもメインメモリ問題で相性問題があるのかもしれない。分からない。マザボ側のスロットに問題があるかもしれない。

 

我が家のPCではスロット3に刺さっていたメモリを抜いたら問題が解決した。

 

ということで、次に私の起こす行動は

 

「スロット1,3に刺さっていたメモリをスロット2,4に指して試す」

スロット1に故障したと思われるRAMを差して再度試す(※任意)

 

ということになりそうです。これで問題が再発したら、スロット側の問題じゃなさそうってことが証明できる。うん。これやって終わりにしよう。

 

話が脱線しました。

 

ということで教訓

 

■まとめ

  • パソコンが突然落ちる系の問題が発生して原因が分からなかったら一回メモリを片方抜いてみろ

 

でした。memtest86+で問題が無いのにRAMが原因だったなんて分かるわけないだろいい加減にしろ!!!

 

っていう感じでした。突然氏系は特にメモリを疑うのが一番楽かもしれません。抜くのも他の機器に比べたら圧倒的に労力面でも財布面でも楽ですしね。