アカウント名:
パスワード:
Skylake-SP のラインナップがカオス [fc2.com]
Skylake-SPはAVX2を使う場合とAVX512を使う場合でクロックが異なり更に両方使わない場合もクロックが異なるので1コア辺り3種類のクロックが同時に存在し、通常命令(通常クロック) > AVX2(低クロック) > AVX512(更に低いクロック) の順でクロックが低く(つまり動作が遅く)設定されています。
AVX512は失敗作ではないか? [fc2.com]
AVX2よりもAVX-512の方が遅い論拠は、単純にAVX-512ではクロックが低く設定されている為で、AVX2 とクロックが等速になっても、それは等速になるだけで高速にはならず、理論
回路が大きいがゆえに発熱が大きくクロックが落ちるというのはSIMDの宿命なのでそれ言い出すとSIMDいらないってなる。回路の最適化で将来的に発熱が小さくなればオッケー。メモリ帯域がボトルネックということは言い換えればそこが早くなれば高速化できる。DDR5で1サイクル当たりの転送量が増えればボトルネックが解消されるかもしれない。無理やり擁護してみたものの全体的には早すぎた感じですかね。
早すぎるくらいの時期に出しとかないと普及に時間がかかりますし。AVXは特に文句とかは出てなかったけどSSEの時もMMXのほうが使えるなんて話もありましたし。
SSE の話は懐かしいですね。SSE 初版は NetBurst アーキテクチャーで x86 デコーダーが重すぎる Pentium 4 のために、レジスター長は MMX の倍だけれどレイテンシーも倍という、だいぶ辛い仕様でした。実質 SSE 1 命令で MMX を 2 回処理するような振る舞いでした。その後 NetBurst を捨てた Pentium M で MMX が SSE より高速に動いたりして、初期は本当に不遇でした。SSE が見直されたのは、Core シリーズで SSE 命令セットの仕様変更があって、レイテンシーが徐々に半減されたあたりからですね。Nehalem あたりでほとんどの SSE 命令セットが MMX の倍速で動くようになった印象です。ほんと懐かしいです。
> Core シリーズで SSE 命令セットの仕様変更があって仕様変更なんてあった?実装方法の変更は(CPUアーキテクチャが変わると)あったかもしれんが
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
長期的な見通しやビジョンはあえて持たないようにしてる -- Linus Torvalds
AVX512 って問題児だったのか (スコア:2, 参考になる)
Skylake-SP のラインナップがカオス [fc2.com]
AVX512は失敗作ではないか? [fc2.com]
Re: (スコア:0)
回路が大きいがゆえに発熱が大きくクロックが落ちるというのはSIMDの宿命なのでそれ言い出すとSIMDいらないってなる。
回路の最適化で将来的に発熱が小さくなればオッケー。
メモリ帯域がボトルネックということは言い換えればそこが早くなれば高速化できる。DDR5で1サイクル当たりの転送量が増えればボトルネックが解消されるかもしれない。
無理やり擁護してみたものの全体的には早すぎた感じですかね。
Re: (スコア:0)
早すぎるくらいの時期に出しとかないと普及に時間がかかりますし。
AVXは特に文句とかは出てなかったけどSSEの時もMMXのほうが使えるなんて話もありましたし。
Re: (スコア:0)
SSE の話は懐かしいですね。SSE 初版は NetBurst アーキテクチャーで x86 デコーダーが重すぎる Pentium 4 のために、レジスター長は MMX の倍だけれどレイテンシーも倍という、だいぶ辛い仕様でした。実質 SSE 1 命令で MMX を 2 回処理するような振る舞いでした。その後 NetBurst を捨てた Pentium M で MMX が SSE より高速に動いたりして、初期は本当に不遇でした。SSE が見直されたのは、Core シリーズで SSE 命令セットの仕様変更があって、レイテンシーが徐々に半減されたあたりからですね。Nehalem あたりでほとんどの SSE 命令セットが MMX の倍速で動くようになった印象です。ほんと懐かしいです。
Re:AVX512 って問題児だったのか (スコア:0)
> Core シリーズで SSE 命令セットの仕様変更があって
仕様変更なんてあった?実装方法の変更は(CPUアーキテクチャが変わると)あったかもしれんが