パスワードを忘れた? アカウント作成
14257447 story
Intel

リーナス、Intel AVX512の苦痛にまみれた死を望む 80

ストーリー by nagazou
呪詛 部門より
あるAnonymous Coward 曰く、

カーネルMLにて
「gcc-11はavx512をサポートしないが大丈夫か?」
というコメントに対し、Linusは
「AVX512の苦痛にまみれた死を望む("I hope AVX512 dies a painful death")」
と返したことが評判になっている(メーリングリストのLinus Torvalds氏のメールOSDN Magazine)。

AVX512のせいで周波数が上がらないことや、コア数が増えないことへの不満が述べられ、曰く、もっとマシなことにトランジスタを使うべきだ、とのこと。AMDみたいに、シングルスレッド性能が良好でAVX512のようなゴミのついてこないコアをもっとくれ。などと散々な言われようである。

他にもintel CPUのFP性能への不満や、ベンチマーク重視への嘆きなども語られている。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Anonymous Coward on 2020年08月04日 16時16分 (#3864267)

    Skylake-SP のラインナップがカオス [fc2.com]

    Skylake-SPはAVX2を使う場合とAVX512を使う場合でクロックが異なり更に両方使わない場合もクロックが異なるので1コア辺り3種類のクロックが同時に存在し、通常命令(通常クロック) > AVX2(低クロック) > AVX512(更に低いクロック) の順でクロックが低く(つまり動作が遅く)設定されています。

    AVX512は失敗作ではないか? [fc2.com]

    AVX2よりもAVX-512の方が遅い論拠は、単純にAVX-512ではクロックが低く設定されている為で、AVX2 とクロックが等速になっても、それは等速になるだけで高速にはならず、理論的にもボトルネックを計算するとメモリ帯域で律速しているのは確かです。

    正直にAVX-512は遅いので使わないで下さいと言って互換性目的で残すだけにして欲しいと思う訳です。

    発熱が凄くてクロック落ちる、メモリ律速になる、って AVX512 に対応する必要性を感じないですねぇ

    • by Anonymous Coward

      回路が大きいがゆえに発熱が大きくクロックが落ちるというのはSIMDの宿命なのでそれ言い出すとSIMDいらないってなる。
      回路の最適化で将来的に発熱が小さくなればオッケー。
      メモリ帯域がボトルネックということは言い換えればそこが早くなれば高速化できる。DDR5で1サイクル当たりの転送量が増えればボトルネックが解消されるかもしれない。
      無理やり擁護してみたものの全体的には早すぎた感じですかね。

      • by Anonymous Coward

        早すぎるくらいの時期に出しとかないと普及に時間がかかりますし。
        AVXは特に文句とかは出てなかったけどSSEの時もMMXのほうが使えるなんて話もありましたし。

        • by Anonymous Coward

          SSE の話は懐かしいですね。SSE 初版は NetBurst アーキテクチャーで x86 デコーダーが重すぎる Pentium 4 のために、レジスター長は MMX の倍だけれどレイテンシーも倍という、だいぶ辛い仕様でした。実質 SSE 1 命令で MMX を 2 回処理するような振る舞いでした。その後 NetBurst を捨てた Pentium M で MMX が SSE より高速に動いたりして、初期は本当に不遇でした。SSE が見直されたのは、Core シリーズで SSE 命令セットの仕様変更があって、レイテンシーが徐々に半減されたあたりからですね。Nehalem あたりでほとんどの SSE 命令セットが MMX の倍速で動くようになった印象です。ほんと懐かしいです。

      • by Anonymous Coward

        実際SIMDなんていらんだろ。

  • by miyuri (33181) on 2020年08月04日 17時43分 (#3864345) 日記

    https://www.wdic.org/w/SCI/Intel%20AVX-512 [wdic.org]

    Intel AVX-512は様々な機能を提供するが、全てのプロセッサーで全機能が実装されることを想定していない、複数の要素から構成されている。
    Intel AVX-512として全プロセッサーで対応するのはAVX512F(AVX-512 Foundation)のみで、他はオプションである。

    めんどくさい。

  • by Anonymous Coward on 2020年08月04日 19時16分 (#3864428)

    AVX512は優れた拡張だと思いますよ。
    新命令には有用なものもそこそこありますし、マスクレジスタの実装で分岐の排除がよりスマートにできるようになりました。
    ブロードキャストも便利ですし。

    ただし512bit化だけは現状だとダメダメですね。将来を見据えての実装でしょうけど現状ではコストが高すぎです。
    512bit化せずにAVX3としてでも世の中に出ていればここまで叩かれることもなかったでしょう。
    SIMDなんていらないという決まりきった文句を除けば。

  • by Anonymous Coward on 2020年08月04日 14時23分 (#3864185)

    ベクトルプロセッサ化???
    素人目に見ても継ぎ接ぎし過ぎの感はあります。
    もっと良い実装の方法はなかったのだろうか
    チップセット側でコプロみたいにするとか

    • by Anonymous Coward

      Larrabee…

    • by Anonymous Coward

      コプロにしたら通信のオーバーヘッドを挽回できるくらいのパフォーマンスを出せないとメリットがないんじゃない?
      で、それは今のGPUみたいな演算器の塊にならざろうえなくて、intelが何のためにそんなものを作るのかという話になると思う。

  • by Anonymous Coward on 2020年08月04日 14時37分 (#3864195)

    https://linux.srad.jp/story/20/07/12/0420200/ [linux.srad.jp]

    deathとかpainfulとか禁止してなくて。

  • by Anonymous Coward on 2020年08月04日 14時40分 (#3864196)

    色々な人を不快にさせたから、人の気持ちを勉強してくるとか言ってなかったっけ?
    その結果、「苦痛にまみれた死を望む」を筆頭にした Intel への暴言くらいなら許されるという結論に至ったのか?
    だとしたら、あんな謝罪なんてすべきじゃなかったと思う

    • by Anonymous Coward on 2020年08月04日 15時57分 (#3864251)

      これは取り上げ方が悪い

      記事では最後に、

       「もちろん、僕は偏見がある。僕はFPベンチマークが大嫌いだが、FPベンチマークが重要という人がいることも知っている。ただ、AVX-512は完全に間違っていると思っている」「Intelがやる完全なる間違いの好例だ。市場の分断化を促進するという部分だけ見ても、間違っていると言える」。

       Torvalds氏はIntelに対し、特別なケースではなく中核の共通部分での取り組みを求め、最後に「そう、僕は不機嫌だ」と書いている。

      と、丁寧に言っているし、極めて共感出来る内容
      確かに Intel にはケチをつけているが、「特別なケースだけ高速化するのではなく、一般的な部分での高速化を図って欲しい」ってそんなに眉をひそめるような指摘かい?

      親コメント
      • by Anonymous Coward

        > これは取り上げ方が悪い
         
        なるほど確かに。
        マスコミが議員の発言の一部だけ抜いてくる奴と同じだ。

    • by Anonymous Coward

      一時的なガス抜きでしょう。

    • by Anonymous Coward

      今回の相手は命令セットであって人では無いからでしょう
      intelに対しては苦言の範囲かと

      #又吉イエスじゃないんだからとは思いますが

      • by Anonymous Coward

        #3864217 [srad.jp]を書いたACですが、もしかしてあなたはわたしですか?

        #又吉イエスをググってた時間分だけ遅かったか。

        • by Anonymous Coward

          式はどこにしましょう?

          #というのが通じるのはいつまでやら

      • by Anonymous Coward

        人格修正される以前のリーナス擁護で散々使われた詭弁ですね。

    • by Anonymous Coward

      対人攻撃機能は制限付きだけど、相手が法人なら違ってくる。
      仕様漏れかテスト漏れかは微妙なところ。

      #なんとなく又吉イエスを思い出した。

    • by Anonymous Coward

      伏字にしてxxX512なら…

    • by Anonymous Coward

      AVXを憎んでIntelを憎まず

      • by Anonymous Coward

        政治でも宗教でも、それ重要。
        支持してるから何でも賛成はタダのバカ。支持してるからこそダメと思ったものはダメと言わんとね。

    • by Anonymous Coward

      PC新調してAMDユーザになったからやむなし

  • by Anonymous Coward on 2020年08月04日 14時51分 (#3864203)

    って何かあるのでしょうか。

    動画エンコーダーとかでサポートしているものってあるんですかね?

    # スパコン専用機能のような状態だとしたらLinusの反応も理解できる

      • by Anonymous Coward

        EmEditorは、少しでも高速化するなら何でもするというスタンスみたいだからなあ。
        なにか違和感を覚えるようになって某Mに乗り換えたんだけど、とくにgrepなんて数倍違うみたい。
        まあそれでも、戻る気はないんだけど。

    • > 動画エンコーダーとかでサポートしているものってあるんですか
      X.265がサポートしているけど、せいぜい10%しか性能が改善しない [fc2.com]。

      この手のハード支援なら、Turing世代GeForceのNVENCを使うんじゃないかな。ローエンド価格帯のGTX1650の第2世代(TU106ベースとTU116ベースの異なったGPUが使われたカードが混在しているらしい)でTuring NVENCが積まれるらしいから。

      • by Anonymous Coward

        NVENCはビットレート抑える(FHDで5M bps以下くらい)とx265エンコードより圧倒的低画質なイメージです。
        よく画質変わらず圧倒的高速という方いるけどまず作例が数十Mbpsなんですよね。

      • by Anonymous Coward

        コマンド一つで10%も早くなるなら大したもの、って思うんだけど、必要なリソースに対して割に合わないってことなのかな?

        • by Anonymous Coward

          コマンド一つって、利用するには専用の最適化コードを用意する必要があるわけですが。
          環境に合わせて最適化コードを用意するなら、追加機能なしでも10%くらいは早くなりそうなものですしね。

    • by Anonymous Coward

      Intel Distribution for Python [intel.com]とか言ってみるテスト。
      確かにベンチマーク厨なら悪くない [intel.com]と思うのかもしれない。

    • by Anonymous Coward

      まともにAVX512を使って最適化できるコンパイラが特殊なものしかないのが現実。
      AVXをサポートしないCPUを未だに切り捨てられないでいるから、仕方ない面もある。

      • by Anonymous Coward

        この手のやつって intrinsics を使ってゴリゴリ書くイメージあるので、コンパイラの最適化は期待していないんじゃないかな
        CPUID で切替すればいいので、古い CPU を切り捨てることもないし

        # 流石に SSE2 未対応の CPU は切り捨てた

        • by Anonymous Coward

          intrinsicsで書く場合はかなりコンパイラの最適化を期待してますよ。
          レジスタ割付管理や命令の並べ替えはコンパイラの仕事です。

    • by Anonymous Coward

      ハードウェアだと iMac Pro [apple.com] が AVX-512 を売り文句に使ってるけど
      これ黒歴史になるのか・・

  • by Anonymous Coward on 2020年08月04日 14時59分 (#3864207)

    もともとAVX512みたいな命令は、Xeon Phi向けにつくられたものでしょう
    Xeon Phi用プログラムを手元で作成・デバッグができる

    Xeon Phiが中止になって、持て余してる感じ

    • by Anonymous Coward

      搭載されているのはPhiと上位のXeonに限られるので開発デバッグ用としては不便だと思う。
      CPUに載ってないよりは載ってた方がいいというそれだけの理由で搭載されたのだろう。
      命令の将来性についてはCore iにも載るとか中・下位のXeonにも載る・載らないみたいな意見が分かれる状態のままずるずる来てますね。
      それもこれも10nmの遅延のせいですが。

      • by Anonymous Coward

        まだモバイル用しか出てませんがIcelakeにはCore iでも載ってますよ。

  • by Anonymous Coward on 2020年08月04日 16時11分 (#3864263)

    intel CPUのFPこそ時代遅れのレガシーな存在で放置されている。AVX系に回路によるマイクロコード化されることはあっても、これ以上強化されることはない。期待しても無駄なのだ。

  • by Anonymous Coward on 2020年08月04日 18時50分 (#3864405)

    正直、AVX512を実装してなくてもクロックは変わらなさそうだし、コア数もPort5を強化しているサーバー系なら28コアダイを30コアくらいにはできそうだけど、クライアント向けはコア数増えるほどAVX512関連でダイを占有しているとは思えないんだが。

typodupeerror

私はプログラマです。1040 formに私の職業としてそう書いています -- Ken Thompson

読み込み中...