パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

リーナス、Intel AVX512の苦痛にまみれた死を望む」記事へのコメント

  • by Anonymous Coward on 2020年08月04日 16時16分 (#3864267)

    Skylake-SP のラインナップがカオス [fc2.com]

    Skylake-SPはAVX2を使う場合とAVX512を使う場合でクロックが異なり更に両方使わない場合もクロックが異なるので1コア辺り3種類のクロックが同時に存在し、通常命令(通常クロック) > AVX2(低クロック) > AVX512(更に低いクロック) の順でクロックが低く(つまり動作が遅く)設定されています。

    AVX512は失敗作ではないか? [fc2.com]

    AVX2よりもAVX-512の方が遅い論拠は、単純にAVX-512ではクロックが低く設定されている為で、AVX2 とクロックが等速になっても、それは等速になるだけで高速にはならず、理論的にもボトルネックを計算するとメモリ帯域で律速しているのは確かです。

    正直にAVX-512は遅いので使わないで下さいと言って互換性目的で残すだけにして欲しいと思う訳です。

    発熱が凄くてクロック落ちる、メモリ律速になる、って AVX512 に対応する必要性を感じないですねぇ

    • by Anonymous Coward

      回路が大きいがゆえに発熱が大きくクロックが落ちるというのはSIMDの宿命なのでそれ言い出すとSIMDいらないってなる。
      回路の最適化で将来的に発熱が小さくなればオッケー。
      メモリ帯域がボトルネックということは言い換えればそこが早くなれば高速化できる。DDR5で1サイクル当たりの転送量が増えればボトルネックが解消されるかもしれない。
      無理やり擁護してみたものの全体的には早すぎた感じですかね。

      • by Anonymous Coward

        早すぎるくらいの時期に出しとかないと普及に時間がかかりますし。
        AVXは特に文句とかは出てなかったけどSSEの時もMMXのほうが使えるなんて話もありましたし。

        • by Anonymous Coward

          SSE の話は懐かしいですね。SSE 初版は NetBurst アーキテクチャーで x86 デコーダーが重すぎる Pentium 4 のために、レジスター長は MMX の倍だけれどレイテンシーも倍という、だいぶ辛い仕様でした。実質 SSE 1 命令で MMX を 2 回処理するような振る舞いでした。その後 NetBurst を捨てた Pentium M で MMX が SSE より高速に動いたりして、初期は本当に不遇でした。SSE が見直されたのは、Core シリーズで SSE 命令セットの仕様変更があって、レイテンシーが徐々に半減されたあたりからですね。Nehalem あたりでほとんどの SSE 命令セットが MMX の倍速で動くようになった印象です。ほんと懐かしいです。

          • by Anonymous Coward

            SSE は Pentium III からだから NetBurst じゃないでしょ。
            NetBurst に初めて載ったのは SSE2。

            • by Anonymous Coward

              MMXとの比較だしSIMD整数にのみに目が行って、単精度浮動小数点数のみの初代SSEをうっかり忘れていたんじゃない?

          • by Anonymous Coward

            > Core シリーズで SSE 命令セットの仕様変更があって
            仕様変更なんてあった?実装方法の変更は(CPUアーキテクチャが変わると)あったかもしれんが

        • by Anonymous Coward

          MMXは整数演算だけだから用途が限られると言われていたような気がする

      • by Anonymous Coward

        実際SIMDなんていらんだろ。

        • by Anonymous Coward on 2020年08月04日 19時02分 (#3864415)

          SIMDがいる人もいらない人もいる。
          あなたやリナースはSIMDがいらない側の人間ってだけさ。
          そして私はSIMDがいる側の人間ってだけさ。

          親コメント
          • by Anonymous Coward

            フリーランチの時代が終わった以上ソフトもハードも複雑になっていくほかないでしょうね。
            シンプルな実装でどんな時でも高速になんてのはもう無理。

            • by Anonymous Coward

              いやハードはシンプルな並列でソフトのスケジューリングとかが大変とかも有り得るやも

    • by Anonymous Coward

      初めはこんなもんですよ。

      まずAVX512を実装する。
      今の時点ではハードが重すぎてそれほど性能が出ない。
      でもソフト開発は進められる。

      次にプロセスが進歩して、使えるトランジスタ数が増えたら、AVX512を効率的に実行できる演算器を実装する。
      この時点でそこそこソフト開発は進んでるので、CPU出た時点で一気に性能が上がる。

      大体の新命令はこの流れなので、今回もソフト設計者は味見だけして本番まってればいいかと。

      • by Anonymous Coward

        使えないハードに向けて、誰がソフトを書くというのかw

        • by Anonymous Coward

          性能が出ない、使えないと言われても特定の条件の時には性能が出る、十分に使い物になるとかだからな。
          AVX512も用途によっては全く使えないし、使える用途でもピーキーだけど使ったほうが性能がでる用途も普通にあるから、そのような用途のソフトを書く人はAVX512の使用を検討するだろう。

        • by Anonymous Coward

          あなたではないことは確かですね。

          これまでも同じ方式で、先に新命令実装してあとからパフォーマンス確保することをやってます。
          それを理解してる人は先取りして書きますよ。

          例えば、x265なんかもAVX512の実装してます。
          今は+10%とか+20%の性能しか出ないけど、AVXの登場時だってそうだったし、いずれ改善することは明らかなので開発します。
          Intelのパートナーのベンダーだと、Intelからロードマップ示されて開発する場合も。

    • by Anonymous Coward

      ゲームがAVX対応、配信ソフトがAVX512対応、この2つを同時に動かしたらクロックが下がってゲームのパフォーマンスが落ちる。
      全てのプログラムが新命令に対応するわけではないからねぇ・・・

最初のバージョンは常に打ち捨てられる。

処理中...