分散型システムにおける予防(Prevention)と回復(Recovery)
※まだご覧になっていない方は、1つ前の動画の翻訳もお読みください。前回のお話と関連しています。
2023.01.25
2023/01/24 Cardano Stall
https://www.youtube.com/watch?v=RJvy2tqkE4U ノードのフリーズについて 皆さん、こんにちは。チャールズ・ホスキンソンです。いつも暖かい日差しが降り注ぐコロラドから生放送でお届けしています。今日は2023年1月24日です。週末の多くの方が寝て...
皆さん、こんにちは。チャールズ・ホスキンソンです。いつも暖かい日差しが降り注ぐコロラドから生放送でお届けしています。今日は2023年1月24日です。今日の動画ではホワイトボードを使ってシステムの運用と、分散型システムにおける予防と回復についてお話しします。
先日カルダノのネットワークのノードが突然停止しました。停止は2分間足らずですぐに正常に戻りましたが、今回の件で私から提起したいことがあります。それは、分散型システムの運用について考えるとき、私達は常に「問題が発生する予防」と「問題を解決して回復する」というバランスを取らなければならないということです。
どんな問題も跳ねのけて常に100%のパフォーマンスをしてくれるシステムを作ることができるのが望ましいことで、カルダノももちろんそれが目標です。目標を達成するのが難しい原因は実は私達人間にあります。人間というのは欲深い生き物で欲求を満たすためにシステムに悪魔のようなもの(新機能)を取り込んでしまいます。
欲求は大きく分けると3つあります。「スピード・便利さ」、「オープンアクセス:誰でもネットワークにアクセスできる」、「パーミッションレス・オペレーション:許可制を排除したシステム」です。例えば、システムを許可制にするとスループットを最適化することができる代わりに、ネットワークが中央集権になってしまいます。
このように、欲求を満たすことは一部の予防メカニズムを失うということを意味しています。逆に言えば、予防メカニズムを守ることに重点を置くことはシステムのスピードや機能の向上を犠牲にすることを意味しています。分散型システムでは予防と回復のバランスをうまくとることが大変重要です。
2022年、カルダノはVasilハードフォークにより一年を通してたくさんの新しいコンセプトを導入しました。例えば拡張パイプライン(Diffusion Pipelining)です。拡散パイプラインは大歓迎を受けました。ブロック生成のプロセスをより速く、より効率的に、より安くすることができるからです。しかし、拡散パイプラインを導入するとトランザクションの安全性を検証する作業が疎かになるためトランザクションの接続に支障が出ます。
私はカルダノが今経験していることは分散型システムを設計する上で経験せざるを得ないごく自然な成長痛だと考えています。停止したノードを2分以内に回復できたということはシステム内部で予防と回復の機能が上手くバランスをとっていることを示す良い兆候だと思います。
私はカルダノの自己回復能力の高さに関心しています。このエコシステムならこの先もパフォーマンスの向上、運用コストの削減、バリデータ(妥当性の確認を行う機能やソフトウエア)の種類を増すといったことを追求しつつ、最適な障害モデルや回復モデルは何かを議論していけると信じています。みんなで一緒に課題を乗り越えて行きましょう。そして、将来に渡って繁栄し生き残る、幸せで素晴らしいエコシステムを作りましょう。
コメント