- 追加された行はこの色です。
- 削除された行はこの色です。
「[[.NET 開発基盤部会 Wiki>http://dotnetdevelopmentinfrastructure.osscons.jp]]」は、「[[Open棟梁Project>https://github.com/OpenTouryoProject/]]」,「[[OSSコンソーシアム .NET開発基盤部会>https://www.osscons.jp/dotNetDevelopmentInfrastructure/]]」によって運営されています。
-[[戻る>要素技術]]
-[[戻る>データサイエンス力]]
*目次 [#l1537ebc]
#contents
*概要 [#fab74aa5]
**確証的データ解析 [#mdebc5a6]
仮説を立てて、それを検証する。
**探索的データ 解析 [#hf37903c]
データを見ながら、その意味を読み取ろうとする。
*詳細 [#t9a000a2]
**解析方法 [#t25f60b2]
***[[クロス集計分析]] [#hae158f2]
***ロジスティック回帰分析 [#f8862775]
ある事象の発生確率を予測する手法。
-ある質問に対する答えを「はい」または「いいえ」の形で集計
--結果は確率なので、0-1, (0-100%) の間の数値で表わされる。
-以下で利用される。
--病気の発生する確率の予測
--ターゲット顧客の商品購入率の予測
***アソシエーション分析 [#wec1e143]
相関関係を分析する手法
-一見関連性がなさそうでも、
--共起性(同時に起こる項目)を分析し、隠れた関連性を発見する。
--...。
-以下で利用される。
--マーケットバスケット分析(バスケット分析)
---実店舗とECサイトでの行動の違いを発見する。
---同時に購入されることが多いものを発見する。~
(レコメンドエンジンシステム)
***統計解析 [#w121da97]
-[[決定木分析>統計解析#lcaf7a28]]
-[[クラスタ分析>統計解析#df844c06]]
-[[主成分分析>統計解析#f800acad]]
**アドホック分析、ダッシュボード、モニタリング [#edaac400]
***アドホック分析 [#l43753a6]
-アドホック・クエリを投げるパワーユーザ的な人向け
-ツール~
[[アドホック分析・ツール>#s006468d]]の利用が適している。
***ダッシュボード [#xdaf8a56]
-定型レポートを参照するエンドユーザ的な人向け
-ツール~
[[ダッシュボード・ツール>#s006468d]]の利用が適している。
***モニタリング [#e02e4838]
-以下の様にモニタリングする。
--対象 : KPIなど。
--目的 : データドリブンな意思決定を行う。
--出力 : 月次レポートなど
--特徴 : 長期的なデータの推移を可視化、集計の条件の変更。
-ツール~
[[BIツール>#i37df7b9]]の利用が適している。
**ツール [#nf68b131]
***各種、可視化ツール [#s006468d]
以下の様に分類可能
-スプレッドシート~
大量のデータを扱えない。~
複雑なダッシュボードを作るのが難しい。
--Googleスプレッドシート
--[[Microsoft Excel>https://techinfoofmicrosofttech.osscons.jp/index.php?Excel%20%E3%83%94%E3%83%9C%E3%83%83%E3%83%88%E3%83%BB%E3%83%86%E3%83%BC%E3%83%96%E3%83%AB%E3%80%81%E3%83%94%E3%83%9C%E3%83%83%E3%83%88%E3%83%BB%E3%82%B0%E3%83%A9%E3%83%95]]
-アドホック分析・ツール
--Jupyter Notebook
---通常はローカル・ホストで起動するWebアプリケーション
---PythonやRuby、R言語などのスクリプト言語を実行する。
---pandasでアドホック分析し、matplotlibで可視化する。
-ダッシュボード・ツール~
--Redash
---Python製のダッシュボード・ツール
---多数のデータソースに対応
---SQLクエリの実行結果を可視化
--Superset
---対話的ダッシュボードを作るためのPython製のWebアプリケーション
---画面上でマウス操作によってグラフを作るのが基本
---時系列データに対応した列指向ストレージ(Druid)を標準でサポート
---リアルタイムなダッシュボードを作る目的でよく利用される。
--[[Kibana>Elasticsearch#xdb2a250]]
---バックエンドは[[Elasticsearch]]一択になる。
---同様に、リアルタイムなダッシュボードを作る目的でよく利用される。
--[[BIツール>#i37df7b9]]~
対話的なダッシュボード
***[[BIツール>ビジネス インテリジェンス(BI)#j255e469]] [#i37df7b9]