リーナス、Intel AVX512の苦痛にまみれた死を望む 80
ストーリー by nagazou
呪詛 部門より
呪詛 部門より
あるAnonymous Coward 曰く、
カーネルMLにて
「gcc-11はavx512をサポートしないが大丈夫か?」
というコメントに対し、Linusは
「AVX512の苦痛にまみれた死を望む("I hope AVX512 dies a painful death")」
と返したことが評判になっている(メーリングリストのLinus Torvalds氏のメール、OSDN Magazine)。
AVX512のせいで周波数が上がらないことや、コア数が増えないことへの不満が述べられ、曰く、もっとマシなことにトランジスタを使うべきだ、とのこと。AMDみたいに、シングルスレッド性能が良好でAVX512のようなゴミのついてこないコアをもっとくれ。などと散々な言われようである。
他にもintel CPUのFP性能への不満や、ベンチマーク重視への嘆きなども語られている。
AVX512 って問題児だったのか (スコア:2, 参考になる)
Skylake-SP のラインナップがカオス [fc2.com]
AVX512は失敗作ではないか? [fc2.com]
発熱が凄くてクロック落ちる、メモリ律速になる、って AVX512 に対応する必要性を感じないですねぇ
Re: (スコア:0)
回路が大きいがゆえに発熱が大きくクロックが落ちるというのはSIMDの宿命なのでそれ言い出すとSIMDいらないってなる。
回路の最適化で将来的に発熱が小さくなればオッケー。
メモリ帯域がボトルネックということは言い換えればそこが早くなれば高速化できる。DDR5で1サイクル当たりの転送量が増えればボトルネックが解消されるかもしれない。
無理やり擁護してみたものの全体的には早すぎた感じですかね。
Re: (スコア:0)
早すぎるくらいの時期に出しとかないと普及に時間がかかりますし。
AVXは特に文句とかは出てなかったけどSSEの時もMMXのほうが使えるなんて話もありましたし。
Re: (スコア:0)
SSE の話は懐かしいですね。SSE 初版は NetBurst アーキテクチャーで x86 デコーダーが重すぎる Pentium 4 のために、レジスター長は MMX の倍だけれどレイテンシーも倍という、だいぶ辛い仕様でした。実質 SSE 1 命令で MMX を 2 回処理するような振る舞いでした。その後 NetBurst を捨てた Pentium M で MMX が SSE より高速に動いたりして、初期は本当に不遇でした。SSE が見直されたのは、Core シリーズで SSE 命令セットの仕様変更があって、レイテンシーが徐々に半減されたあたりからですね。Nehalem あたりでほとんどの SSE 命令セットが MMX の倍速で動くようになった印象です。ほんと懐かしいです。
Re: (スコア:0)
実際SIMDなんていらんだろ。
Re:AVX512 って問題児だったのか (スコア:1)
SIMDがいる人もいらない人もいる。
あなたやリナースはSIMDがいらない側の人間ってだけさ。
そして私はSIMDがいる側の人間ってだけさ。
めんどくさい (スコア:2)
https://www.wdic.org/w/SCI/Intel%20AVX-512 [wdic.org]
めんどくさい。
AVX512は優れた拡張 ある1点を除いて (スコア:1)
AVX512は優れた拡張だと思いますよ。
新命令には有用なものもそこそこありますし、マスクレジスタの実装で分岐の排除がよりスマートにできるようになりました。
ブロードキャストも便利ですし。
ただし512bit化だけは現状だとダメダメですね。将来を見据えての実装でしょうけど現状ではコストが高すぎです。
512bit化せずにAVX3としてでも世の中に出ていればここまで叩かれることもなかったでしょう。
SIMDなんていらないという決まりきった文句を除けば。
アプリケーションサブシステム? (スコア:0)
ベクトルプロセッサ化???
素人目に見ても継ぎ接ぎし過ぎの感はあります。
もっと良い実装の方法はなかったのだろうか
チップセット側でコプロみたいにするとか
Re: (スコア:0)
Larrabee…
Re: (スコア:0)
コプロにしたら通信のオーバーヘッドを挽回できるくらいのパフォーマンスを出せないとメリットがないんじゃない?
で、それは今のGPUみたいな演算器の塊にならざろうえなくて、intelが何のためにそんなものを作るのかという話になると思う。
よかったね (スコア:0)
https://linux.srad.jp/story/20/07/12/0420200/ [linux.srad.jp]
deathとかpainfulとか禁止してなくて。
Re:よかったね (スコア:1)
確かリーナスにパッチ当ててあんまり攻撃的なことは言わないように修正したはずだが
リグレッション?
https://wired.jp/2018/09/21/linuxs-creator-is-sorry/ [wired.jp]
Re:よかったね (スコア:1)
禁止ワードのblacklistに漏れがあったんでしょう
あ、間違えたdenylistか
Re: (スコア:0)
死はすべてのものに平等だからポリコレ的にはOKでしょう。
Re: (スコア:0)
俺より先にあいつが死を手に入れたなんて許せない、差別だ!
リーナスの謝罪は何だったのか (スコア:0)
色々な人を不快にさせたから、人の気持ちを勉強してくるとか言ってなかったっけ?
その結果、「苦痛にまみれた死を望む」を筆頭にした Intel への暴言くらいなら許されるという結論に至ったのか?
だとしたら、あんな謝罪なんてすべきじゃなかったと思う
Re:リーナスの謝罪は何だったのか (スコア:3, 興味深い)
これは取り上げ方が悪い
記事では最後に、
と、丁寧に言っているし、極めて共感出来る内容
確かに Intel にはケチをつけているが、「特別なケースだけ高速化するのではなく、一般的な部分での高速化を図って欲しい」ってそんなに眉をひそめるような指摘かい?
Re: (スコア:0)
> これは取り上げ方が悪い
なるほど確かに。
マスコミが議員の発言の一部だけ抜いてくる奴と同じだ。
Re: (スコア:0)
一時的なガス抜きでしょう。
Re: (スコア:0)
今回の相手は命令セットであって人では無いからでしょう
intelに対しては苦言の範囲かと
#又吉イエスじゃないんだからとは思いますが
Re: (スコア:0)
#3864217 [srad.jp]を書いたACですが、もしかしてあなたはわたしですか?
#又吉イエスをググってた時間分だけ遅かったか。
Re: (スコア:0)
式はどこにしましょう?
#というのが通じるのはいつまでやら
Re: (スコア:0)
人格修正される以前のリーナス擁護で散々使われた詭弁ですね。
Re: (スコア:0)
対人攻撃機能は制限付きだけど、相手が法人なら違ってくる。
仕様漏れかテスト漏れかは微妙なところ。
#なんとなく又吉イエスを思い出した。
Re: (スコア:0)
伏字にしてxxX512なら…
Re: (スコア:0)
AVXを憎んでIntelを憎まず
Re: (スコア:0)
政治でも宗教でも、それ重要。
支持してるから何でも賛成はタダのバカ。支持してるからこそダメと思ったものはダメと言わんとね。
Re: (スコア:0)
PC新調してAMDユーザになったからやむなし
AVX512を使用しているソフトウェア (スコア:0)
って何かあるのでしょうか。
動画エンコーダーとかでサポートしているものってあるんですかね?
# スパコン専用機能のような状態だとしたらLinusの反応も理解できる
Re: (スコア:0)
「EmEditor」v19.2が正式公開 ~CPU命令セットAVX-512/SHA Extensionsをサポート [impress.co.jp]
# またテキストエディタでベンチマークが行われる [impress.co.jp]ようになるに違いない
Re: (スコア:0)
EmEditorは、少しでも高速化するなら何でもするというスタンスみたいだからなあ。
なにか違和感を覚えるようになって某Mに乗り換えたんだけど、とくにgrepなんて数倍違うみたい。
まあそれでも、戻る気はないんだけど。
あるけど、たいしたことない (スコア:0)
> 動画エンコーダーとかでサポートしているものってあるんですか
X.265がサポートしているけど、せいぜい10%しか性能が改善しない [fc2.com]。
この手のハード支援なら、Turing世代GeForceのNVENCを使うんじゃないかな。ローエンド価格帯のGTX1650の第2世代(TU106ベースとTU116ベースの異なったGPUが使われたカードが混在しているらしい)でTuring NVENCが積まれるらしいから。
Re: (スコア:0)
NVENCはビットレート抑える(FHDで5M bps以下くらい)とx265エンコードより圧倒的低画質なイメージです。
よく画質変わらず圧倒的高速という方いるけどまず作例が数十Mbpsなんですよね。
Re: (スコア:0)
コマンド一つで10%も早くなるなら大したもの、って思うんだけど、必要なリソースに対して割に合わないってことなのかな?
Re: (スコア:0)
コマンド一つって、利用するには専用の最適化コードを用意する必要があるわけですが。
環境に合わせて最適化コードを用意するなら、追加機能なしでも10%くらいは早くなりそうなものですしね。
Re: (スコア:0)
Intel Distribution for Python [intel.com]とか言ってみるテスト。
確かにベンチマーク厨なら悪くない [intel.com]と思うのかもしれない。
Re: (スコア:0)
まともにAVX512を使って最適化できるコンパイラが特殊なものしかないのが現実。
AVXをサポートしないCPUを未だに切り捨てられないでいるから、仕方ない面もある。
Re: (スコア:0)
この手のやつって intrinsics を使ってゴリゴリ書くイメージあるので、コンパイラの最適化は期待していないんじゃないかな
CPUID で切替すればいいので、古い CPU を切り捨てることもないし
# 流石に SSE2 未対応の CPU は切り捨てた
Re: (スコア:0)
intrinsicsで書く場合はかなりコンパイラの最適化を期待してますよ。
レジスタ割付管理や命令の並べ替えはコンパイラの仕事です。
Re: (スコア:0)
ハードウェアだと iMac Pro [apple.com] が AVX-512 を売り文句に使ってるけど
これ黒歴史になるのか・・
Xeon Phi用命令 (スコア:0)
もともとAVX512みたいな命令は、Xeon Phi向けにつくられたものでしょう
Xeon Phi用プログラムを手元で作成・デバッグができる
Xeon Phiが中止になって、持て余してる感じ
Re: (スコア:0)
搭載されているのはPhiと上位のXeonに限られるので開発デバッグ用としては不便だと思う。
CPUに載ってないよりは載ってた方がいいというそれだけの理由で搭載されたのだろう。
命令の将来性についてはCore iにも載るとか中・下位のXeonにも載る・載らないみたいな意見が分かれる状態のままずるずる来てますね。
それもこれも10nmの遅延のせいですが。
Re: (スコア:0)
まだモバイル用しか出てませんがIcelakeにはCore iでも載ってますよ。
intel CPUのFP (スコア:0)
intel CPUのFPこそ時代遅れのレガシーな存在で放置されている。AVX系に回路によるマイクロコード化されることはあっても、これ以上強化されることはない。期待しても無駄なのだ。
AVX512のコストはどのくらい? (スコア:0)
正直、AVX512を実装してなくてもクロックは変わらなさそうだし、コア数もPort5を強化しているサーバー系なら28コアダイを30コアくらいにはできそうだけど、クライアント向けはコア数増えるほどAVX512関連でダイを占有しているとは思えないんだが。
Re: (スコア:0)
リーナスを逆さに読むとスナーリ
スナーリの逆だからスんナーリと反省したりしてくれない
Re: (スコア:0)
はっはっは、おーい山田くん、……地下でのワークアウトのあとで飲む「プロテイン」は美味かったか? 出番だ。
Re: (スコア:0)
Fワードを使わないと言う意味では?
Re: (スコア:0)
バイトするマシーンだから