「.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。
目次 †
概要 †
詳細 †
教師データの作成 †
優れたアルゴリズムを用いても誤った教師データで学習すると
正しく学習できず精度の高い学習モデルが作れない。
アノテーション †
- 学習のため教師データを作成する(タグを付与する)こと。
- データに付与するタグを標準化、均一化しないと誤った推論結果となる。
- 複数のアノテーターが同じ能力を持っていると仮定した場合、
良い品質を得るために沢山の人が必要となる(コスト)。
- 実際は能力に差があるという前提で、アノテーターの能力を考慮。
- 異なる種類のデータ形式よるタグ付け
- 画像データを用いる
- テキストデータを用いる
- 構造化データを用いる
- データの意味は普遍的ではなく目的によって変わる。
→ ターゲット層に適したバイアス(推し)をかけたアノテーション
モデルの統合・分割 †
色々なデータを使う場合、色々なモデルが必要になる。
統合 †
一つの機械学習のモデルに色々なデータを入れて予測値を出す。
分割 †
人間が非常に理解し易くなる。
転移学習 †
- 人が過去の経験を活かして新しい物事を習得する流れと似ている。
- 犬の種類判別モデルと猫の種類判別モデルを作成する際に、猫の画像が少ない様な場合、
犬の種類判別の課題から得られた知識を猫の種類判別モデルに適応させ判別精度の向上を図る。
アクティブ・ラーニング †
本番運用しながら自然に追加学習できる仕組み
- AIのアウトプットを全て人間がチェックし、間違っていたものを修正して追加学習データとして利用
- AIのアウトプットの信頼度(Confident)の値が低いデータのみを人間がチェックして追加学習。