「.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。
目次 †
概要 †
詳細 †
クラウド・サービス †
メガクラでは、一般的に、
非構造化データのAIサービスが提供されている。
AWS †
GCP †
サービス †
文書検索 †
Google検索
エンリッチメント †
画像・言語からの自動タグ付けサービス
価格最適化 †
在庫最小化、価格(利益)の最大化
- 需要予測
- 教師あり学習
- 訪問者数、購買、価格(やSKU)
のデータから需要量を予測する。
- 数理最適化
- 数理モデル
- 制約条件の下で目的関数を最大(小)化する決定変数を見つける。
- 価格別の需要予測を元に在庫情報を加味し最適な価格を推定する。
- 制約漏れのケースが多いので、アジャイルに試行錯誤しながら進めていく。
※ 様々な、思想や嗜好、チャネルや販促などを含むので難しいらしい。
マーケティング †
感情分析 †
文書の要約と分類 †
- Gmailのスマートリプライ
- ナレッジ・シェアサービス(ニュースのレコメンド
不正検出 †
出会い系 †
ビジネス上での活用シーン †
バックオフィス †
テキスト系が多い気が。
フロントオフィス †
画像系が多い気が。
- クリーニングの受付(セルフレジ
- ブランド品の査定買取(セルフレジ?
- きゅうりの仕訳など、農業ノウハウ
- 食品加工のための骨領域の判別
音と振動からの異常検知と予防保全 †
- 伝統的な正常・異常の判断(異常振動の発生周波数の分類)
- 低周波:偏心 / 偏芯 / ゆるみ、外観検査 / 寸法測定 / 打音検査
- 中周波:摩耗や衝突、打音検査 / 潤滑油検査 / 分解検査
- 高周波:摩耗や衝突 / 傷や割れ、潤滑油検査 / 分解検査
- 統計量
- 正規分布からの外れを数値化して閾値で判定
- MT法(マハラノビス・タグチ法)
- 機械学習
- k-近傍法
- One-class SVM
- 混合正規分布(GMM)
- 異常検知は教師なし学習が基本
- 高精度のクラス分類モデルには大量データが必要
- 異常の種類が多様(要因の重なり、カバーできない)
- 正常データのみで学習、正常・異常データでテスト
- 難易度
- やさしい:一定速度で回転する機械
- やや難しい:動作モードの変化がある
- 異常診断
- 物理現象が不明:そもそも難しい
- 物理モデルがある場合:シミュレーション+機械学習
- 耐用期間
- 1ヶ月程度:データを集め易い。
- 数ヶ月~数年間:データを集め難い。
- 設備モニタリングの進化
2で運用して3のためのデータを集める。
- 稼働状況のモニタリング
- 稼働状況+異常検知
- 予兆検知して事前に対応する。
業種別の活用シーン †
医療・介護 †
- データヘルス、Personal Health Record(PHR)
- 病気の治療 → 未病ケア・予防
- 画一的な治療 → 個別化された治療
- 医療関係者中心 → 個人の主体的な関与
- Stealth-Adaptive Exergame Design Framework
意識させない計測 → 運動能力の推定 → 難易度への反映
- 診断での利用
・複雑化した医学研究の成果の効率的な応用
・希少疾患(病理診断、画像診断、遺伝子ゲノム解析の統合)
・客観性の高い自閉症スペクトラムの診断の均てん化
・病理医の負荷軽減
・画像認識による診断
・新たな所見や疾患概念の発見
・インフォームド・コンセント
- 患者データの共有化
- Personal Health Record(PHR)
- Patient Reported Outcome(患者報告アウトカム)
- 鑑別診断システム、在宅看護支援システム
金融 †
- 特徴
- データ(説明変数)選択の自由度の高さがある。
- コロナ第1、2波以降等、一過性の振る舞いが多い。
- フェアな検証の限界
・バック・テスト:過去データを用いたAIの過学習のテスト
・フォワード・テスト:未来データを用いた説明変数を"選択"した開発者の過学習のテスト
- ファンダメンタル等
・売上の伸び
・中央銀行の金融政策および金利
- 普遍的、市場心理の現れ
・チャートの形
・需給バランス
- 仮説ドリブン
データ(説明変数)を厳選し、仮説に合う特徴量に加工
- シンプル・イズ・ベスト
市場予測AIの失敗原因のほとんどが過学習
- 最適化ではなく安定化
既存データに対して最適点を見つけても
未来のデータに対して最適点ではない可能性が高い
- 効率的市場仮説
成り立つ市場と成り立たない市場がある(らしい
・成り立たない「小型株、新興国通貨、暗号資産」などの市場で効果的
・成り立つ市場では「オルタナティブ・データ」を追加して予測する。
- 複雑系データの事例
- 株価予測モデル
データドリブンでモデル同定
- 状態空間モデルで
一期前の状態を使って現在の状態を予測して予想モデルを作る。
...のではなく、現在の状態を抽出して、予想モデルを作る。
- シンプルな予想モデルがワークする空間を探索して切り出すため、
決定木を大規模組み合わせの最適化からベストなものを選んでいく。
- 予想のたびに繰り返す(ウォークフォーワードモデル)
- 主観に左右されずに複雑系データを説明して予想できるが
計算量が非常に大きくスパコンを使っても計算が収束しない。
- 金融機関の破綻連鎖推定
希少イベントを生成・分析し対応策を探す
- 金融機関の銀行間取引・資金取引をネットワークの形でモデル化
- 銀行の中のバランスシートをモデル化
- 破綻連鎖の増加と媒介中心性の関係をシミュレーション
- 決定木学習で連鎖破綻しやすいノードを発見
- 自己資本比率と連鎖破綻数の関係をシミュレーション
- 証券
- ネット証券:個人投資家向け投資助言サービス
- FX取引:自動トレード → 裁量トレード(支援ツール)
農業 †
農業バリューチェーン効率化に活用されるAI
- 課題
- 気候変動や災害被害
- 過酷な労働環境+高齢化=人手不足
- バリューチェーン全体でさまざまなロスが発生
- 廃棄ロス、機会ロス
- 事業者でのロスと家庭でのロスが半分ずつ
- 方向
- 栽培環境の整備
- 栽培制御性の向上
- 需要と供給のマッチング
- ソリューション
AIによる植物工場バリューチェーン効率化システム
コンセプト:全体最適化によるロス削減
- 需要・供給予測と受注マッチング
- 作物生産の各プロセスを精密制御
- 変動要因
- 春夏秋冬といった季節
- 盆正月や市場が休むタイミング
- 前日・先週・先月といった過去の価格動向
- 生産地や消費地の現在と過去の天気
- 重回帰分析
簡単に計算でき 全体傾向を捉えるのに効果的
大きな動きに対してはズレが大きい傾向にある。
- 種
・個体によるばらつき
・種蒔き収穫の季節によるばらつき
・保存の期間や条件によるばらつき
・苗八作、苗半作(苗の出来で作柄が決まる
- 栽培条件
・種蒔き、移植、定植は人手のばらつき
・光、温度、湿度、風、水流、肥料成分濃度の時間変化
・隣の株のありなしや株の高さ
- 苗八作、苗半作
- 画像のAI解析によりレタスの重量を推定
- 1週間前の予測の可能性