オブザーバビリティ・エンジニアリング

本日読了。

オブザーバビリティとは、もともと数学的制御理論の概念で、外部出力の知識からシステムの内部状態をどれだけうまく推測できるかの尺度。一方、オブザーバビリティのSaaSベンダーは、単なるテレメトリーやモニタリングの同義語であり、メトリクス・ログ・トレースのことだと宣伝する。本書は、後者ではなく前者を追求しており、全く異なるものだという立場。複雑化するシステムにおいて、既知の未知を探るテレメトリーではなく、未知の未知を探るオブザーバビリティが重要で、高いカーディナリティ(情報のユニークさ)と高いディメンジョン(豊富なキー)が求められる。

というここまでの1章で、ワクワクする。

しかしながら、以下の章は、オライリー本のイケてないパターンである「オムニバスにいろいろ関連話題を詰め込んだだけで、全体の主張がよくわからない本」になってしまっていた。

  • 基礎。構造化イベント、分散トレース。
  • ツール。OpenTelemetory。
  • 分析方法。コア分析ループ。間違いの可能性の認識→例外をみつける→異常のある領域のディメンジョンを探す→分離されたディメンジョンから潜在的な異常の原因を特定する→最初に戻る。このループを人間とAIで協力してまわす。
  • オブザーバビリティ駆動開発。シフトレフト。デリバリーへの組み込み