パスワードを忘れた? アカウント作成
15045580 story
Intel

リーナス・トーバルズ氏、Intelが一般向け製品でECCメモリに対応しないことを批判 110

ストーリー by nagazou
エラー 部門より
あるAnonymous Coward 曰く、

「何十年も説明できない奇妙なカーネルエラーに悩まされてきましたが、それらはおそらくメモリのエラーによるものです」とトーバルズ氏は推測しており、ECCがあれば回避できたエラーに遭遇し続けていることに腹を立てているとのこと。「現代のメモリは信頼性が高いので、ECCは必要ない」という意見を自身の経験から一蹴しています。

Linuxカーネルレベルの話になると、メモリ起因としか思えないトラブルも定期的にやってくるんでしょうな。そりゃトーバルズ氏の立場なら怒るかも。

情報元へのリンク

リーナス・トーバルズ氏が、コミュニティ「Real World Tech」で、IntelのECCに対する方策を批判するコメントをしたらしい。書かれているのはRyzen 9 5000シリーズ関連のトピック。曰く、

ECCの可用性は非常に重要だ。しかしIntelが市場を細分化をしたことにより、ECC業界全体を殺してしまった。今、市場でECC対応のDIMMを買おうとしても探すのはとても大変だ。最近は少しは入手性もマシになってきたが、それはAMDのおかげだろう。Intelは、ECCに関するポリシーは業界全体とユーザーに悪影響を及ぼしている。

(中略)

メモリメーカー側は経済性と低電力を実現するための措置だとしている。しかし、これらの「ピー(放送禁止用語)」どもは、壊れたハードウェアを消費者に喜んで販売している。私からすれば手抜きを販売しているにすぎない。

といった感じの発言になっている。発言の背景等についてはGIGAZINEの記事に詳しい。

  • by tmiura (6268) on 2021年01月06日 12時50分 (#3953878) 日記

    かつて職場では、SPARC SolarisがECCによる誤り訂正イベントをsyslogに吐いてくれていたので、100台動かしていると1年で100発くらいソフトエラー訂正がかかるということが可視化されていました。

    また、シングルイベントだけでなく系統的なエラー発生からチップ故障やモジュール故障が示唆されて「このモジュールを交換せよ」までログに出ていたのでまあありがたかったです。

    PCサーバになるとSolarisでもLinuxでも誤り訂正ログが出なくなってしまい、DellやHPやIBMのECCも音無しで訂正してくれるだけ(モジュール故障はインジケータにランプがつくので交換の契機にできますが)になったので、ECCの必要性が見えてこなくて気持ち悪いことになりました。

    私が調査をさぼっているだけで本当はチップセットドライバなどでログ出せたりするのかしら。

    Intelがデスクトップ環境にはECC要らんと強弁するのに対しては、ECCを使える環境にある人が誤り訂正イベントをログに吐いて必要性を可視化するしかないと思うんですよね。

    ここに返信
  • by kusakan (11993) on 2021年01月06日 12時20分 (#3953863) 日記
    センマイのモジュールなら チップは問わん
    ここに返信
  • by tmiura (6268) on 2021年01月06日 12時56分 (#3953881) 日記

    まだRyzenが出る前、Intelの方が性能が高かったころに組んだおうちPCは、それでもECCが欲しかったので、CPUをXeon E3にしました。買おうと思って調べると、シングルソケット用XeonはCore i5並の値段だったので、なあんだ、って感じでした。

    ただ、メジャーなマザーボードの選択肢がほとんどなくて(ASUSのWSサフィックスのついているやつぐらいしかない)困りましたが。

    ここに返信
  • CPU側のコストがあまり変わらないとしてもメモリのコストは上がる。それで得られるメリットが1年一回の「おそらくは何にも影響しないエラーを防ぐ」なのでコストに見合ってない。それよりはLinux由来のエラーの方が致命的だし多い。

    メモリエラーが致命的だとしてもOSやソフト側で対処する方がECCよりもコストに安いはず。
    例えば「1bitのフラグを多bitにする」「deamonでCRC検査」

    そんな研究が流行ってないってことはそういうこと。
    ここに返信
  • コスト的には配線が1/8増えるけど、
    だからと言ってわざわざ無効化しなくてもとは思う。

    Rdgisteredと両対応になればなお良いんだけどな…

    ここに返信
  • 買えよ (スコア:0, 荒らし)

    by Anonymous Coward on 2021年01月06日 8時27分 (#3953718)

    ECC対応の製品買えよって思う

    ここに返信
    • Re:買えよ (スコア:3, 参考になる)

      by Anonymous Coward on 2021年01月06日 8時55分 (#3953734)

      リーナスはRyzenを使用しているはずで、Ryzenは全製品非公式とはいえECCメモリに対応しています。 正式対応はryzen proのみ。
      Xeonだってシングルソケット向けはcoreシリーズと同じダイを流用してるので、Intelがその気になればcoreシリーズでもECCメモリ対応は容易な事だから対応しろ、というお話だと思います。
      中華マザーボードにはデスクトップ向けチップセットでXeon&ECCメモリ対応しているのもあるので、チップセットもデスクトップ向けで大丈夫っぽいです。

    • by nekopon (1483) on 2021年01月06日 8時41分 (#3953724) 日記
      "売れよ" と言ってるわけで
      // ECCは知っててもそれだけじゃ困ります…
    • by Anonymous Coward

      リーナスが買っても、ECC対応買ってない人からメモリ起因のせいで解決できないエラー報告が来るんだよ。
      だから「例外なくECC付けろよエラー減るから」って話。

    • by Anonymous Coward

      どうせならMPU(チップセット)からマザーボードまで作っちまえよって思う。

      # 関係ないけどZynqでECC使うと半分しかDDR使えんってどういう仕様なんだよ…

    • by Anonymous Coward

      リーナス・トーバルズ氏がIntel社を買い取れば解決するって話?

  • DRAMは、微細化による信頼性低下の影響をかなり受けやすくなってる
    また、ROWHAMMERや類似攻撃は、ECCがあれば影響を緩和できる

    ここに返信
  • by Anonymous Coward on 2021年01月06日 8時41分 (#3953725)

    記憶にあるのは30PIN SIMMの頃かな。ちょい増しの値段で普通にECC対応が売られてた。
    まあ買ったのは非対応メモリだったけど。一万/1MBだった。

    ここに返信
  • by Anonymous Coward on 2021年01月06日 8時55分 (#3953733)

    消費電力を減らしてCO2を削減しよう!!

    ここに返信
  • by Anonymous Coward on 2021年01月06日 9時44分 (#3953765)

    ECC付きのメモリで、ちゃんとステータスが取れるサーバだったら分かるのだろうけど。
    どなたか情報持ってませんかね。

    ここに返信
  • by Anonymous Coward on 2021年01月06日 10時13分 (#3953788)

    どーなんだ?

    ここに返信
  • by Anonymous Coward on 2021年01月06日 10時41分 (#3953805)

    DDR5はECC必須になるらしいから
    そのうち対応するでしょ

    ここに返信
  • by Anonymous Coward on 2021年01月06日 10時51分 (#3953811)

    エラーでなけりゃOK?違うの?
    CPU負荷とか関係していたら違ってくるかもだけど
    # CPU内部キャッシュはECC無くていいのか そしたら内部レジスタにもECC要る?
    # 宇宙用とかだと付いているかもしれないな

    ここに返信
  • by Anonymous Coward on 2021年01月06日 11時11分 (#3953825)

    DDR5からはオンダイECCが基本仕様になるから、Intelも否応なく対応すると思われるけど、
    高速化・微細化による信頼性の低下の補完だから、従来方式を御所望って感じなのかしら。

    ここに返信
typodupeerror

UNIXはただ死んだだけでなく、本当にひどい臭いを放ち始めている -- あるソフトウェアエンジニア

読み込み中...