「.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。
機械学習(machine learning)について纏める。
依存して、特定の課題を効率的に実行する
※ DNNを用いた近似(勾配降下法、誤差逆伝播法)
である。
と期待されている。
重みとも呼ばれるモデルの学習実行後に獲得される値。
(過剰適合、過適合、オーバーフィッティング)
良いデータの準備が性能発揮の生命線となる。
本番運用しながら自然に追加学習できる仕組み
色々なデータを使う場合、色々なモデルが必要になる。
IBMのWatson(ワトソン)などが、
を使用して再登場したエキスパート・システム。
(supervised learning)
(unsupervised learning)
(semi-supervised learning)
(self-supervised Learning)
(reinforcement learning)
予測モデルの使い分け。
One-Hotエンコーディングでは説明変数が増え過ぎる(高次になる)
ことで計算が不安定になるので、ビットフラグ的に説明変数を使って削減する。
あまりにも特徴量の多い高次元データは主成分分析で複数の説明変数を圧縮して少なくする。
アンサンブル学習だが、新たな特徴量を作る方法でもある。
不均衡データに対して
(Machine Learning Operations)
管理 | セキュリティ | 性能 | 通信環境 | |
クラウド | ○ | △ | ○ | △ |
オンプレ | ✕ | ○ | △ | ○ |
エッジ | ✕ | △ | ✕ | ○ |
反比例のトレードオフ
ノウハウが必要(データ・パイプライン
※ 本番・運用のチェックの労力で学習データを作成し精度を上げていくサイクルを造るなど。
⽣産性向上が阻害されている主な要因はデータ・ツール・デプロイ
以下のような課題を持っている。
以下のような課題を持っている。
以下のような課題を持っている。