.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。

目次

概要

なぜそのデータ(数字)なのか、

  • 物事を細かく解き開き、
  • 理論的に研究することで

原因を探ること。

定義

明確な定義はないが、なんとなく、

ビジネス インテリジェンス(BI)の、

の延長上のデータ分析がデータ解析と呼ばれている雰囲気がある。
(専門性の高めのデータマイニング(DM)手法は別に分類される事が多そう)

確証 / 探索

確証的データ解析

仮説を立てて、それを検証する。

探索的データ解析

データを見ながら、その意味を読み取ろうとする。

詳細

解析方法

クロス集計分析

決定木分析

  • 分類によって絞り込んでいく手法
  • 分類(仮説)を何回も繰り返し、
    その結果から何通りもの予測を行う。
  • 経過が樹木状に枝分かれしたモデル図になる。
    • 「回帰木」「分類木」「ディシジョンツリー」などとも呼ばれる。
    • 複雑かつ多様な要因を整理、要因や属性を分析、分岐毎の確率計算も可能。
  • 以下で利用される。
    • マーケティング
    • リスク・マネジメント
  • 缶コーヒーの顧客像を分析する例
    ○○缶コーヒーを選ぶ人(のクラスタ)
    • 毎日飲む人:全体のx%
    • +年齢:全体のy%
    • +性別:全体のz%

ロジスティック回帰分析

ある事象の発生確率を予測する手法。

  • 重回帰分析と同じ複数の予測変数と一つの基準変数を取り扱うが、
    事象の有無がはっきりと決まる場合(基準変数が 0 or 1 の場合)に使う。
  • ある質問に対する答えを「はい」または「いいえ」の形で集計
    • 結果は確率なので、0-1, (0-100%) の間の数値で表わされる。
  • 以下で利用される。
  • 病気の発生する確率の予測
    予測変数:アルコール摂取量と喫煙本数
  • ターゲット顧客の商品購入率の予測
    予測変数:職業・性別・趣味

アソシエーション分析

相関関係を分析する手法

  • 一見関連性がなさそうでも、
    共起性(同時に起こる項目)を
    分析し隠れた関連性を発見する。

統計解析

可視化の方法

アドホック分析

ダッシュボード

モニタリング

  • 以下の様にモニタリングする。
    • 対象 : KPIなど。
    • 目的 : データドリブンな意思決定を行う。
    • 出力 : 月次レポートなど
    • 特徴 : 長期的なデータの推移を可視化、集計の条件の変更。

ツール

各種、可視化ツール

以下の様に分類可能

  • スプレッドシート
    大量のデータを扱えない。
    複雑なダッシュボードを作るのが難しい。
  • アドホック分析・ツール
    • Jupyter Notebook
      • 通常はローカル・ホストで起動するWebアプリケーション
      • PythonやRuby、R言語などのスクリプト言語を実行する。
      • Pandasでアドホック分析し、Matplotlibで可視化する。
  • ダッシュボード・ツール
    • Redash
      • Python製のダッシュボード・ツール
      • 多数のデータソースに対応
      • SQLクエリの実行結果を可視化
  • Superset
    • 対話的ダッシュボードを作るためのPython製のWebアプリケーション
    • 画面上でマウス操作によってグラフを作るのが基本
    • 時系列データに対応した列指向ストレージ(Druid)を標準でサポート
    • リアルタイムなダッシュボードを作る目的でよく利用される。
  • Kibana
    • バックエンドはElasticsearch一択になる。
    • 同様に、リアルタイムなダッシュボードを作る目的でよく利用される。

BIツール

対話的な(≒ アドホック分析できる)ダッシュボード


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2021-12-10 (金) 20:56:06 (36d)