.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。

目次

概要

確証的データ解析

仮説を立てて、それを検証する。

探索的データ 解析

データを見ながら、その意味を読み取ろうとする。

詳細

解析方法

クロス集計分析

ロジスティック回帰分析

ある事象の発生確率を予測する手法。

  • ある質問に対する答えを「はい」または「いいえ」の形で集計
    • 結果は確率なので、0-1, (0-100%) の間の数値で表わされる。
  • 以下で利用される。
    • 病気の発生する確率の予測
    • ターゲット顧客の商品購入率の予測

アソシエーション分析

相関関係を分析する手法

  • 一見関連性がなさそうでも、
    • 共起性(同時に起こる項目)を分析し、隠れた関連性を発見する。
    • ...。
  • 以下で利用される。
    • マーケットバスケット分析(バスケット分析)
      • 実店舗とECサイトでの行動の違いを発見する。
      • 同時に購入されることが多いものを発見する。
        (レコメンドエンジンシステム)

統計解析

アドホック分析、ダッシュボード、モニタリング

アドホック分析

ダッシュボード

モニタリング

  • 以下の様にモニタリングする。
    • 対象 : KPIなど。
    • 目的 : データドリブンな意思決定を行う。
    • 出力 : 月次レポートなど
    • 特徴 : 長期的なデータの推移を可視化、集計の条件の変更。

ツール

各種、可視化ツール

以下の様に分類可能

  • スプレッドシート
    大量のデータを扱えない。
    複雑なダッシュボードを作るのが難しい。
  • アドホック分析・ツール
    • Jupyter Notebook
      • 通常はローカル・ホストで起動するWebアプリケーション
      • PythonやRuby、R言語などのスクリプト言語を実行する。
      • pandasでアドホック分析し、matplotlibで可視化する。
  • ダッシュボード・ツール
    • Redash
      • Python製のダッシュボード・ツール
      • 多数のデータソースに対応
      • SQLクエリの実行結果を可視化
  • Superset
    • 対話的ダッシュボードを作るためのPython製のWebアプリケーション
    • 画面上でマウス操作によってグラフを作るのが基本
    • 時系列データに対応した列指向ストレージ(Druid)を標準でサポート
    • リアルタイムなダッシュボードを作る目的でよく利用される。
  • Kibana
    • バックエンドはElasticsearch一択になる。
    • 同様に、リアルタイムなダッシュボードを作る目的でよく利用される。

BIツール


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2020-05-01 (金) 03:02:45 (73d)