「.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。
目次 †
概要 †
情報科学系の知識
- 統計学、数学、計算機科学などと関連し、
主に大量のデータから、何らかの意味のある
情報、法則、関連性などを導き出すこと、または、
大量のデータの処理の手法に関する研究を行う。
領域 †
探索的 †
静的 †
- 分類
- 可視化
- 性質/関係の把握
- グラフィカルモデル
- 機械学習
動的 †
プロセス †
データ収集から施策に落とすまでのプロセスを実行する能力。
データ収集 †
社内外の取得可能なデータの収集
データ蓄積 †
社内外の取得可能なデータの蓄積
データ分析 †
顧客や市場変化に関する重要な知見や洞察を導き出す
施策(改善) †
分析結果に基づいたオペレーションの改善
↓ データ収集へ戻る
詳細 †
データサイエンス観点 †
- 数値、記号、イメージなどが非定型化、復号化しているデータ
- 大量かつ複雑:数値≒文字<イメージ<動画
- 形式を整えるのが難しい:如何に数値化するか。
- 定常状態になり難い:時間的変化の扱い
- 統一的な手法で扱い難い:深層学習の進展で状況が一変
その他 †
シミュレーション †
- 物造りのから人間活動を含む社会的課題に焦点が移ってきた。
- 人間活動が含まれた途端に課題は複雑になる。
- ステークホルダーが抱える多様な問題関心を紐解く必要。
- この10年の間にエージェントベースモデリング、
社会シミュレーションと呼ばれる研究分野で急速に発展している。
- 説明できるAIの導入よりステークホルダーを巻き込みやすい。
(恐らく)説明できるAIより視覚的で説明し易い故に、
- 現場の介入で、問題や関心の洗い出しが出来る。
- また、予測の結果を信用して貰い易い。
- 事例
- ペイメントシステム導入時のレジ周辺エリアのデザイン
システム導入時のレジ周辺エリアのシミュレーション
- カスタマーセンターの生産性向上
施策(ローテーション、KB導入)のシミュレーション
- 空港ターミナルの混雑緩和
混雑緩和施策のシミュレーション
複雑系データ †
- 金融市場もしくは人間の行動などに関するデータ。
- 時間で構造やパターンが変化する。
- データを複製できないので数が限定的。
- モデルを複雑にすると過学習を起こす。
- 事例
- 株価予測モデル
データドリブンでモデル同定
- 状態空間モデルで
一期前の状態を使って現在の状態を予測して予想モデルを作る。
...のではなく、現在の状態を抽出して、予想モデルを作る。
- シンプルな予想モデルがワークする空間を探索して切り出すため、
決定木を大規模組み合わせの最適化からベストなものを選んでいく。
- 予想のたびに繰り返す(ウォークフォーワードモデル)
- 主観に左右されずに複雑系データを説明して予想できるが
計算量が非常に大きくスパコンを使っても計算が収束しない。
- 金融機関の破綻連鎖推定
希少イベントを生成・分析し対応策を探す
- 金融機関の銀行間取引・資金取引をネットワークの形でモデル化
- 銀行の中のバランスシートをモデル化
- 破綻連鎖の増加と媒介中心性の関係をシミュレーション
- 決定木学習で連鎖破綻しやすいノードを発見
- 自己資本比率と連鎖破綻数の関係をシミュレーション
参考 †
Qiita †