アカウント名:
パスワード:
Skylake-SP のラインナップがカオス [fc2.com]
Skylake-SPはAVX2を使う場合とAVX512を使う場合でクロックが異なり更に両方使わない場合もクロックが異なるので1コア辺り3種類のクロックが同時に存在し、通常命令(通常クロック) > AVX2(低クロック) > AVX512(更に低いクロック) の順でクロックが低く(つまり動作が遅く)設定されています。
AVX512は失敗作ではないか? [fc2.com]
AVX2よりもAVX-512の方が遅い論拠は、単純にAVX-512ではクロックが低く設定されている為で、AVX2 とクロックが等速になっても、それは等速になるだけで高速にはならず、理論的にもボトルネックを計算するとメモリ帯域で律速しているのは確かです。
正直にAVX-512は遅いので使わないで下さいと言って互換性目的で残すだけにして欲しいと思う訳です。
発熱が凄くてクロック落ちる、メモリ律速になる、って AVX512 に対応する必要性を感じないですねぇ
回路が大きいがゆえに発熱が大きくクロックが落ちるというのはSIMDの宿命なのでそれ言い出すとSIMDいらないってなる。回路の最適化で将来的に発熱が小さくなればオッケー。メモリ帯域がボトルネックということは言い換えればそこが早くなれば高速化できる。DDR5で1サイクル当たりの転送量が増えればボトルネックが解消されるかもしれない。無理やり擁護してみたものの全体的には早すぎた感じですかね。
早すぎるくらいの時期に出しとかないと普及に時間がかかりますし。AVXは特に文句とかは出てなかったけどSSEの時もMMXのほうが使えるなんて話もありましたし。
SSE の話は懐かしいですね。SSE 初版は NetBurst アーキテクチャーで x86 デコーダーが重すぎる Pentium 4 のために、レジスター長は MMX の倍だけれどレイテンシーも倍という、だいぶ辛い仕様でした。実質 SSE 1 命令で MMX を 2 回処理するような振る舞いでした。その後 NetBurst を捨てた Pentium M で MMX が SSE より高速に動いたりして、初期は本当に不遇でした。SSE が見直されたのは、Core シリーズで SSE 命令セットの仕様変更があって、レイテンシーが徐々に半減されたあたりからですね。Nehalem あたりでほとんどの SSE 命令セットが MMX の倍速で動くようになった印象です。ほんと懐かしいです。
実際SIMDなんていらんだろ。
SIMDがいる人もいらない人もいる。あなたやリナースはSIMDがいらない側の人間ってだけさ。そして私はSIMDがいる側の人間ってだけさ。
https://www.wdic.org/w/SCI/Intel%20AVX-512 [wdic.org]
Intel AVX-512は様々な機能を提供するが、全てのプロセッサーで全機能が実装されることを想定していない、複数の要素から構成されている。Intel AVX-512として全プロセッサーで対応するのはAVX512F(AVX-512 Foundation)のみで、他はオプションである。
めんどくさい。
AVX512は優れた拡張だと思いますよ。新命令には有用なものもそこそこありますし、マスクレジスタの実装で分岐の排除がよりスマートにできるようになりました。ブロードキャストも便利ですし。
ただし512bit化だけは現状だとダメダメですね。将来を見据えての実装でしょうけど現状ではコストが高すぎです。512bit化せずにAVX3としてでも世の中に出ていればここまで叩かれることもなかったでしょう。SIMDなんていらないという決まりきった文句を除けば。
ベクトルプロセッサ化???素人目に見ても継ぎ接ぎし過ぎの感はあります。もっと良い実装の方法はなかったのだろうかチップセット側でコプロみたいにするとか
Larrabee…
コプロにしたら通信のオーバーヘッドを挽回できるくらいのパフォーマンスを出せないとメリットがないんじゃない?で、それは今のGPUみたいな演算器の塊にならざろうえなくて、intelが何のためにそんなものを作るのかという話になると思う。
https://linux.srad.jp/story/20/07/12/0420200/ [linux.srad.jp]
deathとかpainfulとか禁止してなくて。
確かリーナスにパッチ当ててあんまり攻撃的なことは言わないように修正したはずだがリグレッション?https://wired.jp/2018/09/21/linuxs-creator-is-sorry/ [wired.jp]
禁止ワードのblacklistに漏れがあったんでしょうあ、間違えたdenylistか
死はすべてのものに平等だからポリコレ的にはOKでしょう。
俺より先にあいつが死を手に入れたなんて許せない、差別だ!
色々な人を不快にさせたから、人の気持ちを勉強してくるとか言ってなかったっけ?その結果、「苦痛にまみれた死を望む」を筆頭にした Intel への暴言くらいなら許されるという結論に至ったのか?だとしたら、あんな謝罪なんてすべきじゃなかったと思う
これは取り上げ方が悪い
記事では最後に、
「もちろん、僕は偏見がある。僕はFPベンチマークが大嫌いだが、FPベンチマークが重要という人がいることも知っている。ただ、AVX-512は完全に間違っていると思っている」「Intelがやる完全なる間違いの好例だ。市場の分断化を促進するという部分だけ見ても、間違っていると言える」。 Torvalds氏はIntelに対し、特別なケースではなく中核の共通部分での取り組みを求め、最後に「そう、僕は不機嫌だ」と書いている。
「もちろん、僕は偏見がある。僕はFPベンチマークが大嫌いだが、FPベンチマークが重要という人がいることも知っている。ただ、AVX-512は完全に間違っていると思っている」「Intelがやる完全なる間違いの好例だ。市場の分断化を促進するという部分だけ見ても、間違っていると言える」。
Torvalds氏はIntelに対し、特別なケースではなく中核の共通部分での取り組みを求め、最後に「そう、僕は不機嫌だ」と書いている。
と、丁寧に言っているし、極めて共感出来る内容確かに Intel にはケチをつけているが、「特別なケースだけ高速化するのではなく、一般的な部分での高速化を図って欲しい」ってそんなに眉をひそめるような指摘かい?
> これは取り上げ方が悪い なるほど確かに。マスコミが議員の発言の一部だけ抜いてくる奴と同じだ。
一時的なガス抜きでしょう。
今回の相手は命令セットであって人では無いからでしょうintelに対しては苦言の範囲かと
#又吉イエスじゃないんだからとは思いますが
#3864217 [srad.jp]を書いたACですが、もしかしてあなたはわたしですか?
#又吉イエスをググってた時間分だけ遅かったか。
式はどこにしましょう?
#というのが通じるのはいつまでやら
人格修正される以前のリーナス擁護で散々使われた詭弁ですね。
対人攻撃機能は制限付きだけど、相手が法人なら違ってくる。仕様漏れかテスト漏れかは微妙なところ。
#なんとなく又吉イエスを思い出した。
伏字にしてxxX512なら…
AVXを憎んでIntelを憎まず
政治でも宗教でも、それ重要。支持してるから何でも賛成はタダのバカ。支持してるからこそダメと思ったものはダメと言わんとね。
PC新調してAMDユーザになったからやむなし
って何かあるのでしょうか。
動画エンコーダーとかでサポートしているものってあるんですかね?
# スパコン専用機能のような状態だとしたらLinusの反応も理解できる
「EmEditor」v19.2が正式公開 ~CPU命令セットAVX-512/SHA Extensionsをサポート [impress.co.jp]
# またテキストエディタでベンチマークが行われる [impress.co.jp]ようになるに違いない
EmEditorは、少しでも高速化するなら何でもするというスタンスみたいだからなあ。なにか違和感を覚えるようになって某Mに乗り換えたんだけど、とくにgrepなんて数倍違うみたい。まあそれでも、戻る気はないんだけど。
> 動画エンコーダーとかでサポートしているものってあるんですかX.265がサポートしているけど、せいぜい10%しか性能が改善しない [fc2.com]。
この手のハード支援なら、Turing世代GeForceのNVENCを使うんじゃないかな。ローエンド価格帯のGTX1650の第2世代(TU106ベースとTU116ベースの異なったGPUが使われたカードが混在しているらしい)でTuring NVENCが積まれるらしいから。
NVENCはビットレート抑える(FHDで5M bps以下くらい)とx265エンコードより圧倒的低画質なイメージです。よく画質変わらず圧倒的高速という方いるけどまず作例が数十Mbpsなんですよね。
コマンド一つで10%も早くなるなら大したもの、って思うんだけど、必要なリソースに対して割に合わないってことなのかな?
コマンド一つって、利用するには専用の最適化コードを用意する必要があるわけですが。環境に合わせて最適化コードを用意するなら、追加機能なしでも10%くらいは早くなりそうなものですしね。
Intel Distribution for Python [intel.com]とか言ってみるテスト。確かにベンチマーク厨なら悪くない [intel.com]と思うのかもしれない。
まともにAVX512を使って最適化できるコンパイラが特殊なものしかないのが現実。AVXをサポートしないCPUを未だに切り捨てられないでいるから、仕方ない面もある。
この手のやつって intrinsics を使ってゴリゴリ書くイメージあるので、コンパイラの最適化は期待していないんじゃないかなCPUID で切替すればいいので、古い CPU を切り捨てることもないし
# 流石に SSE2 未対応の CPU は切り捨てた
intrinsicsで書く場合はかなりコンパイラの最適化を期待してますよ。レジスタ割付管理や命令の並べ替えはコンパイラの仕事です。
ハードウェアだと iMac Pro [apple.com] が AVX-512 を売り文句に使ってるけどこれ黒歴史になるのか・・
もともとAVX512みたいな命令は、Xeon Phi向けにつくられたものでしょうXeon Phi用プログラムを手元で作成・デバッグができる
Xeon Phiが中止になって、持て余してる感じ
搭載されているのはPhiと上位のXeonに限られるので開発デバッグ用としては不便だと思う。CPUに載ってないよりは載ってた方がいいというそれだけの理由で搭載されたのだろう。命令の将来性についてはCore iにも載るとか中・下位のXeonにも載る・載らないみたいな意見が分かれる状態のままずるずる来てますね。それもこれも10nmの遅延のせいですが。
まだモバイル用しか出てませんがIcelakeにはCore iでも載ってますよ。
intel CPUのFPこそ時代遅れのレガシーな存在で放置されている。AVX系に回路によるマイクロコード化されることはあっても、これ以上強化されることはない。期待しても無駄なのだ。
正直、AVX512を実装してなくてもクロックは変わらなさそうだし、コア数もPort5を強化しているサーバー系なら28コアダイを30コアくらいにはできそうだけど、クライアント向けはコア数増えるほどAVX512関連でダイを占有しているとは思えないんだが。
リーナスを逆さに読むとスナーリスナーリの逆だからスんナーリと反省したりしてくれない
はっはっは、おーい山田くん、……地下でのワークアウトのあとで飲む「プロテイン」は美味かったか? 出番だ。
Fワードを使わないと言う意味では?
バイトするマシーンだから
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
ナニゲにアレゲなのは、ナニゲなアレゲ -- アレゲ研究家
AVX512 って問題児だったのか (スコア:2, 参考になる)
Skylake-SP のラインナップがカオス [fc2.com]
AVX512は失敗作ではないか? [fc2.com]
発熱が凄くてクロック落ちる、メモリ律速になる、って AVX512 に対応する必要性を感じないですねぇ
Re: (スコア:0)
回路が大きいがゆえに発熱が大きくクロックが落ちるというのはSIMDの宿命なのでそれ言い出すとSIMDいらないってなる。
回路の最適化で将来的に発熱が小さくなればオッケー。
メモリ帯域がボトルネックということは言い換えればそこが早くなれば高速化できる。DDR5で1サイクル当たりの転送量が増えればボトルネックが解消されるかもしれない。
無理やり擁護してみたものの全体的には早すぎた感じですかね。
Re: (スコア:0)
早すぎるくらいの時期に出しとかないと普及に時間がかかりますし。
AVXは特に文句とかは出てなかったけどSSEの時もMMXのほうが使えるなんて話もありましたし。
Re: (スコア:0)
SSE の話は懐かしいですね。SSE 初版は NetBurst アーキテクチャーで x86 デコーダーが重すぎる Pentium 4 のために、レジスター長は MMX の倍だけれどレイテンシーも倍という、だいぶ辛い仕様でした。実質 SSE 1 命令で MMX を 2 回処理するような振る舞いでした。その後 NetBurst を捨てた Pentium M で MMX が SSE より高速に動いたりして、初期は本当に不遇でした。SSE が見直されたのは、Core シリーズで SSE 命令セットの仕様変更があって、レイテンシーが徐々に半減されたあたりからですね。Nehalem あたりでほとんどの SSE 命令セットが MMX の倍速で動くようになった印象です。ほんと懐かしいです。
Re: (スコア:0)
実際SIMDなんていらんだろ。
Re:AVX512 って問題児だったのか (スコア:1)
SIMDがいる人もいらない人もいる。
あなたやリナースはSIMDがいらない側の人間ってだけさ。
そして私はSIMDがいる側の人間ってだけさ。
めんどくさい (スコア:2)
https://www.wdic.org/w/SCI/Intel%20AVX-512 [wdic.org]
めんどくさい。
AVX512は優れた拡張 ある1点を除いて (スコア:1)
AVX512は優れた拡張だと思いますよ。
新命令には有用なものもそこそこありますし、マスクレジスタの実装で分岐の排除がよりスマートにできるようになりました。
ブロードキャストも便利ですし。
ただし512bit化だけは現状だとダメダメですね。将来を見据えての実装でしょうけど現状ではコストが高すぎです。
512bit化せずにAVX3としてでも世の中に出ていればここまで叩かれることもなかったでしょう。
SIMDなんていらないという決まりきった文句を除けば。
アプリケーションサブシステム? (スコア:0)
ベクトルプロセッサ化???
素人目に見ても継ぎ接ぎし過ぎの感はあります。
もっと良い実装の方法はなかったのだろうか
チップセット側でコプロみたいにするとか
Re: (スコア:0)
Larrabee…
Re: (スコア:0)
コプロにしたら通信のオーバーヘッドを挽回できるくらいのパフォーマンスを出せないとメリットがないんじゃない?
で、それは今のGPUみたいな演算器の塊にならざろうえなくて、intelが何のためにそんなものを作るのかという話になると思う。
よかったね (スコア:0)
https://linux.srad.jp/story/20/07/12/0420200/ [linux.srad.jp]
deathとかpainfulとか禁止してなくて。
Re:よかったね (スコア:1)
確かリーナスにパッチ当ててあんまり攻撃的なことは言わないように修正したはずだが
リグレッション?
https://wired.jp/2018/09/21/linuxs-creator-is-sorry/ [wired.jp]
Re:よかったね (スコア:1)
禁止ワードのblacklistに漏れがあったんでしょう
あ、間違えたdenylistか
Re: (スコア:0)
死はすべてのものに平等だからポリコレ的にはOKでしょう。
Re: (スコア:0)
俺より先にあいつが死を手に入れたなんて許せない、差別だ!
リーナスの謝罪は何だったのか (スコア:0)
色々な人を不快にさせたから、人の気持ちを勉強してくるとか言ってなかったっけ?
その結果、「苦痛にまみれた死を望む」を筆頭にした Intel への暴言くらいなら許されるという結論に至ったのか?
だとしたら、あんな謝罪なんてすべきじゃなかったと思う
Re:リーナスの謝罪は何だったのか (スコア:3, 興味深い)
これは取り上げ方が悪い
記事では最後に、
と、丁寧に言っているし、極めて共感出来る内容
確かに Intel にはケチをつけているが、「特別なケースだけ高速化するのではなく、一般的な部分での高速化を図って欲しい」ってそんなに眉をひそめるような指摘かい?
Re: (スコア:0)
> これは取り上げ方が悪い
なるほど確かに。
マスコミが議員の発言の一部だけ抜いてくる奴と同じだ。
Re: (スコア:0)
一時的なガス抜きでしょう。
Re: (スコア:0)
今回の相手は命令セットであって人では無いからでしょう
intelに対しては苦言の範囲かと
#又吉イエスじゃないんだからとは思いますが
Re: (スコア:0)
#3864217 [srad.jp]を書いたACですが、もしかしてあなたはわたしですか?
#又吉イエスをググってた時間分だけ遅かったか。
Re: (スコア:0)
式はどこにしましょう?
#というのが通じるのはいつまでやら
Re: (スコア:0)
人格修正される以前のリーナス擁護で散々使われた詭弁ですね。
Re: (スコア:0)
対人攻撃機能は制限付きだけど、相手が法人なら違ってくる。
仕様漏れかテスト漏れかは微妙なところ。
#なんとなく又吉イエスを思い出した。
Re: (スコア:0)
伏字にしてxxX512なら…
Re: (スコア:0)
AVXを憎んでIntelを憎まず
Re: (スコア:0)
政治でも宗教でも、それ重要。
支持してるから何でも賛成はタダのバカ。支持してるからこそダメと思ったものはダメと言わんとね。
Re: (スコア:0)
PC新調してAMDユーザになったからやむなし
AVX512を使用しているソフトウェア (スコア:0)
って何かあるのでしょうか。
動画エンコーダーとかでサポートしているものってあるんですかね?
# スパコン専用機能のような状態だとしたらLinusの反応も理解できる
Re: (スコア:0)
「EmEditor」v19.2が正式公開 ~CPU命令セットAVX-512/SHA Extensionsをサポート [impress.co.jp]
# またテキストエディタでベンチマークが行われる [impress.co.jp]ようになるに違いない
Re: (スコア:0)
EmEditorは、少しでも高速化するなら何でもするというスタンスみたいだからなあ。
なにか違和感を覚えるようになって某Mに乗り換えたんだけど、とくにgrepなんて数倍違うみたい。
まあそれでも、戻る気はないんだけど。
あるけど、たいしたことない (スコア:0)
> 動画エンコーダーとかでサポートしているものってあるんですか
X.265がサポートしているけど、せいぜい10%しか性能が改善しない [fc2.com]。
この手のハード支援なら、Turing世代GeForceのNVENCを使うんじゃないかな。ローエンド価格帯のGTX1650の第2世代(TU106ベースとTU116ベースの異なったGPUが使われたカードが混在しているらしい)でTuring NVENCが積まれるらしいから。
Re: (スコア:0)
NVENCはビットレート抑える(FHDで5M bps以下くらい)とx265エンコードより圧倒的低画質なイメージです。
よく画質変わらず圧倒的高速という方いるけどまず作例が数十Mbpsなんですよね。
Re: (スコア:0)
コマンド一つで10%も早くなるなら大したもの、って思うんだけど、必要なリソースに対して割に合わないってことなのかな?
Re: (スコア:0)
コマンド一つって、利用するには専用の最適化コードを用意する必要があるわけですが。
環境に合わせて最適化コードを用意するなら、追加機能なしでも10%くらいは早くなりそうなものですしね。
Re: (スコア:0)
Intel Distribution for Python [intel.com]とか言ってみるテスト。
確かにベンチマーク厨なら悪くない [intel.com]と思うのかもしれない。
Re: (スコア:0)
まともにAVX512を使って最適化できるコンパイラが特殊なものしかないのが現実。
AVXをサポートしないCPUを未だに切り捨てられないでいるから、仕方ない面もある。
Re: (スコア:0)
この手のやつって intrinsics を使ってゴリゴリ書くイメージあるので、コンパイラの最適化は期待していないんじゃないかな
CPUID で切替すればいいので、古い CPU を切り捨てることもないし
# 流石に SSE2 未対応の CPU は切り捨てた
Re: (スコア:0)
intrinsicsで書く場合はかなりコンパイラの最適化を期待してますよ。
レジスタ割付管理や命令の並べ替えはコンパイラの仕事です。
Re: (スコア:0)
ハードウェアだと iMac Pro [apple.com] が AVX-512 を売り文句に使ってるけど
これ黒歴史になるのか・・
Xeon Phi用命令 (スコア:0)
もともとAVX512みたいな命令は、Xeon Phi向けにつくられたものでしょう
Xeon Phi用プログラムを手元で作成・デバッグができる
Xeon Phiが中止になって、持て余してる感じ
Re: (スコア:0)
搭載されているのはPhiと上位のXeonに限られるので開発デバッグ用としては不便だと思う。
CPUに載ってないよりは載ってた方がいいというそれだけの理由で搭載されたのだろう。
命令の将来性についてはCore iにも載るとか中・下位のXeonにも載る・載らないみたいな意見が分かれる状態のままずるずる来てますね。
それもこれも10nmの遅延のせいですが。
Re: (スコア:0)
まだモバイル用しか出てませんがIcelakeにはCore iでも載ってますよ。
intel CPUのFP (スコア:0)
intel CPUのFPこそ時代遅れのレガシーな存在で放置されている。AVX系に回路によるマイクロコード化されることはあっても、これ以上強化されることはない。期待しても無駄なのだ。
AVX512のコストはどのくらい? (スコア:0)
正直、AVX512を実装してなくてもクロックは変わらなさそうだし、コア数もPort5を強化しているサーバー系なら28コアダイを30コアくらいにはできそうだけど、クライアント向けはコア数増えるほどAVX512関連でダイを占有しているとは思えないんだが。
Re: (スコア:0)
リーナスを逆さに読むとスナーリ
スナーリの逆だからスんナーリと反省したりしてくれない
Re: (スコア:0)
はっはっは、おーい山田くん、……地下でのワークアウトのあとで飲む「プロテイン」は美味かったか? 出番だ。
Re: (スコア:0)
Fワードを使わないと言う意味では?
Re: (スコア:0)
バイトするマシーンだから