指標・特徴量の設計から始める データ可視化学入門 データを洞察につなげる技術

本日読了。

可視化、および、効果的な可視化に必要な指標・特徴量の設計についてのお話。

  • 探索志向型データ可視化と説明志向型データ可視化。前者はデータの特徴を知るため、後者はデータがロジックに当てはまっているかを知るため。前者は多くのパターンを表示させる、後者は特定のパターンに絞り込む。
  • ロジックにあてはまっているかを見るには、そもそも何の値を描画するか?であり、なんらかの指標・特徴量に着目することが必要。
  • 可視化で読み取るのは、大小・遠近・多寡、変数間の関係性の存在、現象ダイナミクス(動き)の特徴、理論ロジックとの紐付け。
  • 数量を把握する可視化の例、棒グラフ、折れ線グラフ、ワードクラウド、ツリーマップ、ストリッププロット、スウォームプロット、ヒストグラム、バイオリンプロット、箱ひげ図。
  • カニズムをとらえる可視化の例。これまでのものに加えて、積み上げチャート、散布図、バブルチャート。
  • 多変数をとらえる、レーダーチャート、パラレルプロット、ヒートマップ。
  • ネットワークをとらえる、ネットワークグラフ。
  • 指標化は略。