「.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。
目次 †
概要 †
- 従来は特徴量を設計する必要があった(特徴抽出+分類器)。
詳細 †
体系 †
目的軸 †
ステップがある
時間軸 †
次元軸 †
- 2D:画角の影響を受ける。
- 3D:画角の影響を受けず汎用的だが、難易度が高い。
手順 †
前処理 †
対象認識 †
対象領域を切り出す。
情報抽出 †
対象が何かを認識する。
事前学習 †
対象にラベル付けして学習する。
事例適用 †
人画像に対して適用する。
アルゴリズム †
シーン識別 †
画像認識中のシーンに関する画像認識(≒ 分類)、シーン認識とも。
- 2015、CNNを用い「シーン」(つまり映像の意味)を認識させることに成功。
- 例えば、「この写真は、公園 / 夜景 / 遊園地」など。
姿勢推定 †
人や関節位置を検出し姿勢位置を出力
- 2D
- 2Dで出力
- ボトムアップ:関節点から人を構成
- トップダウン:人を検出してから関節点を推定し人を構成
- 3D
- 3Dで出力
- 画角の影響を受けない。
- 速度と精度が課題。
トラッキング(物体追跡) †
深層学習の画像認識(CNN)で交差時も見失わなくなる。
ロボット・ビジョン †
活用例 †
パターン認識 †
物体識別、物体検出、領域検出を専門的に(部位に特化して)行う系
- 顔認識・検出
- 表情認識(2D, 3D顔特徴点抽出)
- 顔向き推定、視線推定(2D)
- 瞬き検知(動画、眠気・集中力の検知・測定)
- 顔認証(顔特徴点抽出と高速マッチング)
- 感情推定(学習させるので、プロが見ても解らない事は解らない)
- 性別・年齢推定(あくまで見た目でしかない、人種の差もある)
- 医療診断
- がん診断
- CTやMRIの診断
- グラム染色による細菌の分類や同定
OCR・文書構造化 †
- 言語識別
- テキスト抽出
- 文字起こし
- OCR文字校正
エンリッチメント系 †
画像・映像アノテーション
※ Googleフォトの機能など。
姿勢推定 †
Kinect等を使用した動作計測、解析
人物行動分析 †
自動車の自動運転 †
- カメラやレーダー、LIDAR、超音波センサー、GPS等で周囲の環境を認識し、行き先を指定するだけで自律的に走行する。
- 磁気マーカー(磁気ネイル)を埋込方式はコストや、積雪や除雪の問題から普及していない。
- 一般人が公道で走行できる(自動運転レベル4・5の)自動運転車は、現在の段階では市販されていない。
- レベル0:自動運転なし
ドライバーが常にすべての主制御系統(加速、操舵、制動)の操作を行う。
- レベル1:運転支援
加速、操舵、制動のいずれか一つをシステムが支援的に行う状態。
- レベル2:部分運転自動化
同時に複数の操作をシステムが行う状態。
- レベル3:条件付き運転自動化
限定的な環境・状況で自動運転(機能限界時は、ドライバーに権限移譲)。
- レベル4:高度自動運転
レベル3は権限移譲に備える必要があるが、レベル4では不要
- レベル5:完全自動運転
考え得る全ての状況下及び、極限環境で無人運転。
- 実用化に向けての2つのアプローチ
- 段階的発展のアプローチ
- 挑戦的アプローチ(レベル3以上を目指す
- 欧州の都市:ヘルシンキ、Easymile EZ10、Whim
- アメリカにおける「3大州」は隣り合っている
- カリフォルニア州:有料での無人による自動運転車配車サービスを許可
- アリゾナ州:自動運転タクシーの商用サービスをスタート
- ネバダ州:米国初のレベル3自動運転車
参考 †
Wikipedia †
ライブラリ †
オープンソース †
プロダクト †
サービス †
顔認識・検出 †
まだまだ、精度は低いもよう。
- スマホネイティブ組込
まだ、笑顔情報程度しか取得できないもよう。
- Google Face API
正確な名称が不明だが、Google Play servicesの、
Face Detection とか、Face API などと呼ばれている。
画像内の顔が笑顔であるかどうかを0から1の数値で取得できるもよう。
- Swift Core Image(iOS)
hasSmileプロパティで true or false のデータとして取得するもよう。
- Windows.Media.FaceAnalysis?(Windows)
- クラウドサービス型
AIと連動しており、もう少々、高度なことができるもよう(年齢・性別の推定など)。
- Microsoft Cognitive Services - Face API and Emotion API
- IBM Bluemix の AlchemyAPI Face Detection
IBM に統合された AlchemyAPI 社の人工知能 API が IBM Bluemix で公開されている。
... †
ソリューション †
... †