Linus Torvalds氏のSSDが故障、Linuxカーネルの開発作業に影響 89
ストーリー by hylom
さすがにこの問題にはLinusも対処できず 部門より
さすがにこの問題にはLinusも対処できず 部門より
あるAnonymous Coward 曰く、
Linuxの開発リーダーとしておなじみLinus Torvalds氏がメインで使っているワークステーションのSSDストレージがお亡くなりになってしまい、そのためにLinux 3.12カーネルの作業が中断しているそうだ(本家/.)。
Linusの投稿した「RIP — dead harddisk..」というメッセージによると、当日分のpullはほぼpushしていたそうで、失われたデータは多くはないという。しかし、現在git.kernel.orgに含まれていないpullリクエストやパッチがある場合は再送したほうが良いとのこと。
ディスクはリカバリ出来ておらず、ブートセクタも復旧できていないため希望は薄いとのこと。復旧できない場合、残りのmergeは別マシンで行うとのこと。Linus曰く、この出来事がmergeウィンドウ開始タイミングで起きなかったことが唯一の救いだそうだ。
ちなみにバックアップは無いとのこと。後に投稿されたメッセージによると、Linusはリプレース可能なマシンを使う形を取っているとのことで、大事なものは基本複数台のマシンに載せており、キーなどは別の暗号化されたされたUSBメモリに入れているとのことだ。
ほらやっぱり... (スコア:5, おもしろおかしい)
バックドアのこと、さわぎにしちゃうから.... :p
# 当局、仕事早いなぁ。
Re:ほらやっぱり... (スコア:2)
Re: (スコア:0)
Linusがいつものようにドライブへアクセスすると、
そこにはRdRandで生成された乱数がびっしりと…。
ほら、Linus氏のPCのSDDが壊れてLinuxのKernel開発が滞ることもあることだし (スコア:2)
僕の業務用PCのHDDが壊れて、過去メール全喪失なんて
よくあることだし、仕方ないことだし、この世界じゃ些細な出来事だよね
#上司 激おこ
やっぱりやめた (スコア:2)
Re:やっぱりやめた (スコア:5, すばらしい洞察)
HDDでも瞬間に全滅することはありますし、SSDだってchkdsk /r が必要な壊れ方をすることも
あります。
結局のところ、問題はHDDであるかSSDであるか、という話にはありません。
復旧のシナリオがあり、そのために必要な準備が適切に実行されているかという話なのです。
バックアップは取ってたよ!どこに取ってたかわかんないけど!とか
バックアップは取ってたよ!戻すソフトそのPCにしか入ってなかったけど!とか
バックアップは取ってたよ!どうやって戻せばいいかわかんないけど!とか
こうすればリストアできるよ!って手順書通りに作業してみたら
実はバックアップを正しく取得できてなかったことが判明するとか
こうすればリストアできるよ!ただし丸3日くらいかかるけど!とか。
どれもよくあることです。バックアップを取ってるってだけで安心していてはダメです。
Re:やっぱりやめた (スコア:2)
そうですよね。
HDDでもchkdsk /rが必要なこともあるのでHDDもやめほうがいいのかもしれませんね。
ですのでフロッピーとかテープとかに変えておいた方が良いかもしれません。
Re: (スコア:0)
テープやフロッピーは触る場所を間違えるだけでダメになってしまうので止めた方がよいですよ。
Linusみたいに大切な物はUSBメモリに入れるのがいいのかな。
Re: (スコア:0)
USBは記録が揮発するので紙媒体で・・・
<中略>
石板に刻んで下さい。
Re: (スコア:0)
SSDは、HDDに比べてコントローラが故障しやすいとか、
ウェアレベリングとかで処理が多いし、 SandForce系は圧縮もかけるからね。
Re: (スコア:0)
急に、いつも使っているアプリが起動しないなど調子が悪くなって。
思いつく限りの原因を調べた後、ふと、アプリのバイナリのチェックサムを、別のマシンと比べたら違ってたりして。
あれこれ壊れたファイルを見ていくと、テキストファイル中の「hoge」が「hnge」にずれてたりみたいな、ビット化けが起こっていて。
そのファイル自体は、数年前に作ったもので、同じく作った直後に取ったバックアップ中では、「hoge」になっていたから、
少なくとも、書き込んだ直後には、正しく「hoge」が読み出せたはず。
その後、どのタイミングでかは分からないけど、1ビット化けたとしか考えられない。
それ以降、名のあるブランドのしか買ってない。
なぜミラーリングしていなかった? (スコア:0)
Linuxには標準でmdraidがあるというのに。
なぜノートPCには、SSDを二基組み込めない! (スコア:2)
LinusはMacBookにLinuxを入れて使っているという報があったりして
ノートPCでやってたんじゃないかと思います。
そうすると、RAIDを組むにも、HDDがひとつしか無いという残念なことに。
だからに二台用意するという考え方に至ったのかもしれませんね。
たしかに、mdドライバーとLinuxのSCSI互換としたSATA機器やUSB機器の管理は
たとえUSB-HDDやUSBメモリーと内蔵HDDの組み合わせでもRAIDが組めます。
でも、それを持ち歩くことを考えると…
また、USB機器の速度などを考えると
やっぱりそういうRAID構築は、実用性に問題があるんじゃないかと思います。
Re:なぜノートPCには、SSDを二基組み込めない! (スコア:1)
G+の本人の投稿では
>My main desktop SSD just gave up the ghost.
と、書かれていますよ。
Re:なぜミラーリングしていなかった? (スコア:1)
SSDのRAID1って意味あるの?
どちらのデバイスにも同じ回数書き込むんだから、壊れるはほぼ同時じゃね?
Re:なぜミラーリングしていなかった? (スコア:1)
3台以上を用意しておいて, 定期的に1台を休ませるスケジュールを回すとかしておくぐらいでしょうか. そうすれば, ある程度は書き込み回数のばらつきが出来るんじゃないかと.
Re:なぜミラーリングしていなかった? (スコア:1)
Re:なぜミラーリングしていなかった? (スコア:1)
SSDの場合, 読み出し処理については寿命にほとんど影響を与えませんし, 書き込みについても, 特にRAID1の場合はディスク全体を通じて1回だけしかブロック更新しませんから, 機械的な動作を伴うハードディスクに比べるとリビルドの影響は小さいでしょう.
# もっともアクセスの集中による発熱の影響はあるかもしれませんが
Re:なぜミラーリングしていなかった? (スコア:1)
普通に意味あるよ。SSDの故障の大半は、書き換え寿命が尽きたのか原因じゃなくて。コントローラその他の故障が要因。
書き換え回数ならS.M.A.R.T.で確認できるし。
Re:なぜミラーリングしていなかった? (スコア:1)
Linus氏がどのモデルを使っていたのか解りませんが、熱ストレスが要因で壊れる物もあるようですね。 [nikkeibp.co.jp]
# 基板見れば解りますが、ブランドと価格とプチフリしないで爆発的に売れたアレ [bing.com]っぽいです。
S.M.A.R.T.もHDDと同じでイマイチ信用できない事があるのもネックですね。
故障抜きでも閾値設定が微妙なのでBIOS等でアラートが上がらない(書き込み回数不明) [iinaa.net]とか、アラートが上がるはず [iinaa.net]でもその前に壊れるケース [iinaa.net]も。
Re: (スコア:0)
最初の交換を想定寿命の半分でやればいいんじゃない?
Re: (スコア:0)
ミラーリングするよりも構成を冗長化させて壊れたら取り替えれば済むという風にしてただけじゃないですか
僕の場合だとミラーリングなんて要らないよ、というLinusの主張でしょう
# 用途に応じて耐障害性を設計するのは普通だと思うよ
Re: (スコア:0)
こんな影響が出るようでは、耐障害性を設計にLinusは失敗したんですね。
キレてなーい (スコア:0)
(髭剃りCM風に)
Linuxでは環境再構築が簡単? (スコア:0)
Windowsは1台のPCが起動不能になった際に
修復して、起動するようにしたいという人をよく見る。
アプリケーションの再導入などが大変だとも聞く。
Linuxの場合は、再構築するのが簡単で
修復するよりも、再インストールからやるほうが早いと言う。
/home下と/etc下のファイルをとっておけば再設定も簡単だとか
aptの管理情報からリストを作っておけば
aptで入れておいたソフトは全部、スクリプトで一括で再導入できるとか…
でも、Linusみたいな人になると
ソースからビルドしたものがかなり多くて
同じ環境を二台作っておくことも、けっこう大変なんじゃないか?
Re:Linuxでは環境再構築が簡単? (スコア:2)
LinuxじゃなくてFreeBSDですけど, サーバのシステムディスクをSSDにしたのを契機に, システムの構築・メンテナンスをハードディスク上のシステムディスクイメージで行い, そのイメージをSSD上のパーティションに物理コピーするような運用にしました.
この運用の目的は, SSD上での細かい書き込みを排除することにより, 寿命を伸ばそうとするものですが, 副次的にシステム環境をパーティションの切り直しとイメージコピーのみで復旧できるようになりました. もっとも, こんな運用ができるのも, OSのディスク管理やブートローダの仕組みを理解した上で, さらに比較的シンプルなUFSを使っているからという条件付きですが.
Re:Linuxでは環境再構築が簡単? (スコア:1)
Linuxは1台のPCが起動不能になった際に
修復して、起動するようにしたいという人をよく見る。
アプリケーションの再導入などが大変だとも聞く。
Windowsの場合は、再構築するのが簡単で
修復するよりも、再インストールからやるほうが早いと言う。
bot投稿でしょうか? (スコア:2)
たぶんCore i5くらいのPCなら、Ubuntuのインストールを開始して
それから30分くらいあれば、Ubuntuの上に、LibreOfficeやGIMPや
GCCその他の開発のためのひと通りのソフトを全部導入することができます。
/homeからユーザー設定を全部コピーして
データなどをすべてNASなどに保存していたら
一時間もかからず、作業を再開できるはずです。
精神的ダメージが無ければ。
Windowsも、最近はそのくらい簡単に再構築ができるようになったのでしょうか?
Re:bot投稿でしょうか? (スコア:2)
こういう危機的な状態に陥った場合は、
短い時間で戻せる、とかいうのはどうでもよくて、どれくらい正しく前と同じ環境を復元出来るか、の方が重要だと思うけどね。
WindowsはXPを最後に使ってないからわからないけど、当時は全体をイメージバックアップするのが主流だったかな。
これなら一応完全に戻せるとは思うけど、ソフト的な問題点も戻っちゃう難点。今はどうなんだろう?
MacはLinuxと同じように、最初にOSをインストールして、あとはバックアップ(前のファイルシステムをそのままバックアップしたもの)をマウントして必要なファイルを戻す感じだね。書き戻すファイルを指定して全自動でやってくれる。TimeMachineの場合。
マシンを買い替えた時も同様の方法で移行できる。
Re:bot投稿でしょうか? (スコア:2)
最近のPCだったら主なアプリケーションも含め、インストール直後の状態まで持っていくのに1時間は無理としても2時間あればおつりがあってもおかしくないけど、WindowsとOfficeのアップデータを並行してローカルにダウンロードでもしておかないと、そこからの所用時間が読めないんだよね。
Re: (スコア:0)
Windowsの場合は修復するのは大変なことが多いですよ。
設定ファイルやレジストリが・・・とかログがいたるところに散らかっていたりとか
WinSXSフォルダの変態仕様もやめてほしい。
壊れると復元できない。
Linuxだから簡単だとは思わないけど・・・。
設定やログがまとまっているのはやや救いかなとは思う。
Re: (スコア:0)
Linusくらいになるとどうだか知りませんが、パッケージ管理をしてるディストリを使ってるなら、
自分でビルドしたパッケージをそのままmake installとかしないで、パッケージ化して
パッケージ管理下に置くのではないですかね。
自分はそうしてますが。
Re: (スコア:0)
Winでもメールをローカルで管理しなくなって、ホームディレクトリ(プロファイル他一式)を別ドライブに移したら、
OSの再インストールにあんまり抵抗なくなったなぁ。
ソフトによってはライセンス認証がめんどくさいけど(解除してからOS入れなおさないといけないのに忘れてたとかできないとか。サポートに連絡すれば済むけど電話なかなかつながらなかったり面倒)。
Linuxもドットファイルとetcがあれば再設定はできるだろうねぇ。
/var/www とかは戻ってこないけど、これはWin同様パーティション次第。
究極のバックアップ (スコア:0)
vzエディタの場合、ソースは正規ユーザー全員が持っているという究極の超冗長バックアップ
Re: (スコア:0)
製品リリースしたバージョンだけしかないですな。
Re: (スコア:0)
メリーランド州のユーザーですね。
Re:究極のバックアップ (スコア:2)
何も設定しなくても、自動的にバックアップが作成されるサービスでしたっけ?
確かNSAとかいう。
だんまり後復活 (スコア:0)
自分が使っていたSSDはあるとき認識しなくなり、
電源を入れて30分くらいあれこれやってたら
また復活したこともあった。
(Ubuntuの)GUIのバックアップツール Déjà Dup (Deja Dup) 使ってる? (スコア:0)
バックアップツール Déjà Dup (Deja Dup) 使ってる方はいらっしゃいますか?
アイコンが金庫のやつです。
Mac OSのTime Machineみたいで便利そうなんですが。
love && peace && free_software
t-nissie
Re:リスク (スコア:2, すばらしい洞察)
いや、各開発者の元にコードはあるから究極の分散保存では?
各自確認してpushすればいーんだし。
Linusの仕事はそれをマージすることだから。
Re: (スコア:0)
未作業のpullリクエストは消えたかもって言ってるんだから、
そのマージのための情報は(分散されてなく)信頼できるように回復できないらしいわけで。
元スレッドでもキーとかUSBメモリに入れて保存したとかどうなんだとちょっと突っ込まれてますな。
IBMとか会社単位でLinuxコミットしてるくらいたくさんの人がかかわっているプロジェクトだけど
いまだあくまでLinusの個人プロジェクトなんだと改めて思う次第。
Re: (スコア:0)
pullリクエストは送った人の元にもあるんじゃ?
ちなみにPMのPCが飛んだらプロジェクトの進捗に影響出ないの?
Re:リスク (スコア:1)
Linus Torvaldsのクローンを作る計画がスタートしているとは( ;゚Д゚)
Re:リスク (スコア:1)
> Linus個人の環境で発生する問題次第で大きく影響するリスクがLinuxにあることがわかったってことか。
違うと思うよ。カーネルパッチの公開がちょっとだけ遅れる、ぐらいの影響では?
Re: (スコア:0)
今回の話はそうだけど、今後発生するかもしれないリスクの話でしょ。
Re:リスク (スコア:1)
完全に失われたのは「その時のLinusの作業結果」以外にはない(pullリクエストは送り直せばいいだけ)わけだけど
それが何ほどの影響だというの?
Re: (スコア:0)
逆にOSは安定していてバックアップしなくても大丈夫だったってことも言える。
Re: (スコア:0)
Git使ったことないんですか?
Re:リスク (スコア:2)
Re:リスク (スコア:2)