「[[.NET 開発基盤部会 Wiki>http://dotnetdevelopmentinfrastructure.osscons.jp]]」は、「[[Open棟梁Project>https://github.com/OpenTouryoProject/]]」,「[[OSSコンソーシアム .NET開発基盤部会>https://www.osscons.jp/dotNetDevelopmentInfrastructure/]]」によって運営されています。

-[[戻る>画像処理とコンピュータビジョン]]([[要素技術 > 非構造化データ処理 / 人工知能(AI)>要素技術]]、[[データ分析 > 非構造化データ処理>データ分析#p79a1ae5]]、[[深層学習(deep learning)]]、[[畳み込みニューラルネットワーク(CNN)]])
--[[言語処理(AI)]]
--[[音声処理(AI)]]
--画像処理(AI)
---[[物体識別>画像処理とコンピュータビジョン(物体識別)]]
---[[物体検出>画像処理とコンピュータビジョン(物体検出)]]
---[[領域検出>画像処理とコンピュータビジョン(領域検出)]]
---[[特定領域検出>画像処理とコンピュータビジョン(特定領域検出)]]

*目次 [#v642ed92]
#contents

*概要 [#p0d9d890]

-画像データを解析して特定のパターンを検出・抽出

-画像認識技術の進化

--従来は[[特徴量>機械学習(machine learning)#t209d0ea]]を設計する必要があった(特徴抽出+分類器)。

--[[深層学習の画像認識(CNN)>ニューラルネットワーク#fb7864bd]]では[[特徴量>機械学習(machine learning)#t209d0ea]]の設計が不要になった。

--様々な[[アルゴリズム>#e780581a]]がある。
---[[物体識別>#c30857f1]]
---[[シーン識別>#f8c95ac4]]
---[[物体検出>#j5d31a6f]]
---[[領域検出>#o768dc51]]
---[[特定領域検出>#d53f797d]]

*詳細 [#jca4fc0a]

**体系 [#a7d55b7a]

***目的軸 [#s40fdf65]
ステップがある
-デジタル定量化
-認識 → 判断

***時間軸 [#jdc16de8]
-画像
-映像("系列"の一貫性を保つ

***次元軸 [#u8acf79c]
-2D:画角の影響を受ける。
-3D:画角の影響を受けず汎用的だが、難易度が高い。
--[[姿勢推定>#lf3ddb61]]
--[[トラッキング(物体追跡)>#t261aee4]]

**手順 [#mca417b9]

***前処理 [#e24070e7]
-ノイズ除去
-輪郭抽出

***対象認識 [#c323c2d2]
対象領域を切り出す。

***情報抽出 [#f948a948]
対象が何かを認識する。

***事前学習 [#w90b62e0]
対象にラベル付けして学習する。

***事例適用 [#x2c87755]
人画像に対して適用する。

**アルゴリズム [#e780581a]

***[[物体識別>画像処理とコンピュータビジョン(物体識別)]] [#c30857f1]

***シーン識別 [#f8c95ac4]
[[画像認識中のシーンに関する画像認識(≒ 分類)>ニューラルネットワーク#fb7864bd]]、シーン認識とも。
-2015、[[CNN>ニューラルネットワーク#fb7864bd]]を用い「シーン」(つまり映像の意味)を認識させることに成功。
-例えば、「この写真は、公園 / 夜景 / 遊園地」など。

***[[物体検出>画像処理とコンピュータビジョン(物体検出)]] [#j5d31a6f]

***[[領域検出>画像処理とコンピュータビジョン(領域検出)]] [#o768dc51]

***[[特定領域検出>画像処理とコンピュータビジョン(特定領域検出)]] [#d53f797d]

***姿勢推定 [#lf3ddb61]
人や関節位置を検出し姿勢位置を出力

-2D
--2Dで出力
--ボトムアップ:関節点から人を構成
--トップダウン:人を検出してから関節点を推定し人を構成

-3D
--3Dで出力
--画角の影響を受けない。
--速度と精度が課題。

***トラッキング(物体追跡) [#t261aee4]
[[深層学習の画像認識(CNN)>深層学習(deep learning)#y3991151]]で交差時も見失わなくなる。

***ロボット・ビジョン [#qde2b94f]
-[[3D DNN>ニューラルネットワーク#lb526a13]]

**活用例 [#la3aa875]

***パターン認識 [#l5485c45]
[[物体識別>#c30857f1]]、[[物体検出>#j5d31a6f]]、[[領域検出>#o768dc51]]を専門的に(部位に特化して)行う系

-[[顔認識・検出>#a141dbf4]]
--表情認識(2D, 3D顔特徴点抽出)
--顔向き推定、視線推定(2D)
--瞬き検知(動画、眠気・集中力の検知・測定)
--顔認証(顔特徴点抽出と高速マッチング)
--感情推定(学習させるので、プロが見ても解らない事は解らない)
--性別・年齢推定(あくまで見た目でしかない、人種の差もある)

-[[医療診断>AIの活用例#m0dbf4e0]]
--がん診断
--CTやMRIの診断
--グラム染色による細菌の分類や同定

-異常・不正の検出
--製造:不良品検知
--社会:メンテナンス(異常検知)

-自動運転
--[[自動車の自動運転>#ibb37950]]
--[[ゴミ識別AI搭載自動運転クレーン>AIプロジェクトのマネジメント#b4c89dd3]]

-, etc.

***OCR・文書構造化 [#u30ea1b6]
-言語識別
-テキスト抽出
-文字起こし
-OCR文字校正

***エンリッチメント系 [#b80d75b8]
画像・映像アノテーション

-[[セグメンテーション>#o768dc51]]
-[[テキスト抽出>#u30ea1b6]]
-分類(分類もアノテーション)

※ Googleフォトの機能など。

***姿勢推定 [#k6cde46b]
Kinect等を使用した動作計測、解析

-産業:危険行動検知(事故防止
-医療:[[ロコモのスクリーニング>AIの活用例#m0dbf4e0]]

***人物行動分析 [#ifbd1032]
-行動不審者監視
-禁止危険行動検知
-店舗来場者管理

***自動車の自動運転 [#ibb37950]
-カメラやレーダー、LIDAR、超音波センサー、GPS等で周囲の環境を認識し、行き先を指定するだけで自律的に走行する。

-磁気マーカー(磁気ネイル)を埋込方式はコストや、積雪や除雪の問題から普及していない。

-一般人が公道で走行できる(自動運転レベル4・5の)自動運転車は、現在の段階では市販されていない。

-SAE J3016(自動運転レベルの定義

--レベル0:自動運転なし~
ドライバーが常にすべての主制御系統(加速、操舵、制動)の操作を行う。

--レベル1:運転支援~
加速、操舵、制動のいずれか一つをシステムが支援的に行う状態。

--レベル2:部分運転自動化~
同時に複数の操作をシステムが行う状態。

--レベル3:条件付き運転自動化~
限定的な環境・状況で自動運転(機能限界時は、ドライバーに権限移譲)。

--レベル4:高度自動運転~
レベル3は権限移譲に備える必要があるが、レベル4では不要

--レベル5:完全自動運転~
考え得る全ての状況下及び、極限環境で無人運転。

-実用化に向けての2つのアプローチ
--段階的発展のアプローチ
--挑戦的アプローチ(レベル3以上を目指す

-自動運転の盛んな都市

--欧州の都市:ヘルシンキ、Easymile EZ10、Whim

--アメリカにおける「3大州」は隣り合っている
---カリフォルニア州:有料での無人による自動運転車配車サービスを許可
---アリゾナ州:自動運転タクシーの商用サービスをスタート
---ネバダ州:米国初のレベル3自動運転車

*参考 [#qbfe7ad1]
-深層学習についてのレポート(CNN編)~
https://www.osscons.jp/joy1y64w3-537/#_537

-[[O'Reilly Japan - ゼロから作るDeep Learning >ニューラルネットワーク#w79e9c10]]~
(Pythonで学ぶディープラーニングの理論と実装)

**Wikipedia [#ba7d60b7]
-物体検出~
https://ja.wikipedia.org/wiki/%E7%89%A9%E4%BD%93%E6%A4%9C%E5%87%BA

-顔認識システム~
https://ja.wikipedia.org/wiki/%E9%A1%94%E8%AA%8D%E8%AD%98%E3%82%B7%E3%82%B9%E3%83%86%E3%83%A0

-自動運転車~
https://ja.wikipedia.org/wiki/%E8%87%AA%E5%8B%95%E9%81%8B%E8%BB%A2%E8%BB%8A

**ライブラリ [#re450249]

***オープンソース [#h303eec0]

***プロダクト [#jeb44b24]

**サービス [#u743d5fc]

***顔認識・検出 [#a141dbf4]
まだまだ、精度は低いもよう。

-スマホネイティブ組込~
まだ、笑顔情報程度しか取得できないもよう。

--Google Face API~
正確な名称が不明だが、Google Play servicesの、~
Face Detection とか、Face API などと呼ばれている。
>画像内の顔が笑顔であるかどうかを0から1の数値で取得できるもよう。

---Google Developers Japan: Google Play サービスでの顔検出~
https://googledevjp.blogspot.jp/2015/09/google-play_28.html~
・Face Detection in Google Play services | Android Developers Blog~
 http://android-developers.blogspot.jp/2015/08/face-detection-in-google-play-services.html

---Face APIで顔検出を試してみる - Qiita~
http://qiita.com/droibit/items/ec0ce34a0ad5e34593e5

---Androidの 顔検出API 笑顔判定 は「笑いながら怒る人」をどう認識するか~
https://android.benigumo.com/20150928/android%E3%81%AE-%E9%A1%94%E6%A4%9C%E5%87%BAapi-%E7%AC%91%E9%A1%94%E5%88%A4%E5%AE%9A-%E3%81%AF%E3%80%8C%E7%AC%91%E3%81%84%E3%81%AA%E3%81%8C%E3%82%89%E6%80%92%E3%82%8B%E4%BA%BA%E3%80%8D%E3%82%92/

---APIとしてはこちら。~
・Face  |  Google APIs for Android  |  Google Developers~
 https://developers.google.com/android/reference/com/google/android/gms/vision/face/Face

--Swift Core Image(iOS)~
hasSmileプロパティで true or false のデータとして取得するもよう。

---Swiftで笑顔認識をやってみた - Qiita~
http://qiita.com/ken0nek/items/4504a13bf58eb78c2538

---APIとしてはこちら。~
・CIFaceFeature - Core Image | Apple Developer Documentation~
 https://developer.apple.com/reference/coreimage/cifacefeature~
・【iOS9】Core Image の新機能:文字認識 /追加フィルタ47種 - Over&Out その後~
 http://d.hatena.ne.jp/shu223/20150622/1434924215

--Windows.Media.FaceAnalysis(Windows)

---Windows.Media.FaceAnalysis Namespace - UWP app developer | Microsoft Docs~
https://docs.microsoft.com/en-us/uwp/api/Windows.Media.FaceAnalysis

-クラウドサービス型~
AIと連動しており、もう少々、高度なことができるもよう(年齢・性別の推定など)。

--Microsoft Cognitive Services - Face API and Emotion API

---Microsoft Cognitive Services(マイクロソフト認知サービスAPI)まとめ | 蒼いねずみのお仕事~
http://sonic.blue/it/633~
・Microsoft Cognitive Services~
 ・Face API~
  https://www.microsoft.com/cognitive-services/en-us/face-api~
 ・Emotion API~
  https://www.microsoft.com/cognitive-services/en-us/emotion-api

---【LINE Bot】 bluemixとFaceAPIを使った年齢性別推定Bot - Qiita~
http://qiita.com/shuheilocale@github/items/da6ecdeced3c00acc6f8

---マイクロソフトの顔写真から年齢と性別を当てるサイトが話題!その精度は!? | たむらんち~
http://www.tamura.tottori.jp/2015/05/02/microsoft-azure-beta-test-face-api/

--IBM Bluemix の AlchemyAPI Face Detection~
IBM に統合された AlchemyAPI 社の人工知能 API が IBM Bluemix で公開されている。

---Bluemix の AlchemyAPI Face Detection(顔認識) API を使ってみた : まだプログラマーですが何か?~
http://dotnsf.blog.jp/archives/1023357255.html

***... [#mdab325c]

**ソリューション [#j074ed1b]

***... [#bd908082]

トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS