画像処理とコンピュータビジョン（AI）の変更点

追加された行はこの色です。
削除された行はこの色です。
画像処理とコンピュータビジョン（AI）へ行く。
画像処理とコンピュータビジョン（AI）の差分を削除
「[[.NET 開発基盤部会 Wiki>http://dotnetdevelopmentinfrastructure.osscons.jp]]」は、「[[Open棟梁Project>https://github.com/OpenTouryoProject/]]」,「[[OSSコンソーシアム .NET開発基盤部会>https://www.osscons.jp/dotNetDevelopmentInfrastructure/]]」によって運営されています。

-[[戻る>画像処理とコンピュータビジョン]]（[[要素技術 > 非構造化データ処理 / 人工知能（AI）>要素技術]]、[[データ分析 > 非構造化データ処理>データ分析#p79a1ae5]]、[[深層学習（deep learning）]]、[[畳み込みニューラルネットワーク（CNN）]]）
--[[言語処理（AI）]]
--[[音声処理（AI）]]
--画像処理（AI）
---[[物体識別>画像処理とコンピュータビジョン（物体識別）]]
---[[物体検出>画像処理とコンピュータビジョン（物体検出）]]
---[[領域検出>画像処理とコンピュータビジョン（領域検出）]]
---[[特定領域検出>画像処理とコンピュータビジョン（特定領域検出）]]

*目次 [#v642ed92]
#contents

*概要 [#p0d9d890]

-画像データを解析して特定のパターンを検出・抽出

-画像認識技術の進化

--従来は[[特徴量>機械学習（machine learning）#t209d0ea]]を設計する必要があった（特徴抽出＋分類器）。

--[[深層学習の画像認識（CNN）>ニューラルネットワーク#fb7864bd]]では[[特徴量>機械学習（machine learning）#t209d0ea]]の設計が不要になった。

--様々な[[アルゴリズム>#e780581a]]がある。
---[[物体識別>#c30857f1]]
---[[シーン識別>#f8c95ac4]]
---[[物体検出>#j5d31a6f]]
---[[領域検出>#o768dc51]]
---[[特定領域検出>#d53f797d]]

*詳細 [#jca4fc0a]

**体系 [#a7d55b7a]

***目的軸 [#s40fdf65]
ステップがある
-デジタル定量化
-認識 → 判断

***時間軸 [#jdc16de8]
-画像
-映像（"系列"の一貫性を保つ

***次元軸 [#u8acf79c]
-2D：画角の影響を受ける。
-3D：画角の影響を受けず汎用的だが、難易度が高い。
--[[姿勢推定>#lf3ddb61]]
--[[トラッキング（物体追跡）>#t261aee4]]

**手順 [#mca417b9]

***前処理 [#e24070e7]
-ノイズ除去
-輪郭抽出

***対象認識 [#c323c2d2]
対象領域を切り出す。

***情報抽出 [#f948a948]
対象が何かを認識する。

***事前学習 [#w90b62e0]
対象にラベル付けして学習する。

***事例適用 [#x2c87755]
人画像に対して適用する。

**アルゴリズム [#e780581a]

***[[物体識別>画像処理とコンピュータビジョン（物体識別）]] [#c30857f1]

***シーン識別 [#f8c95ac4]
[[画像認識中のシーンに関する画像認識（≒ 分類）>ニューラルネットワーク#fb7864bd]]、シーン認識とも。
-2015、[[CNN>ニューラルネットワーク#fb7864bd]]を用い「シーン」（つまり映像の意味）を認識させることに成功。
-例えば、「この写真は、公園 / 夜景 / 遊園地」など。

***[[物体検出>画像処理とコンピュータビジョン（物体検出）]] [#j5d31a6f]

***[[領域検出>画像処理とコンピュータビジョン（領域検出）]] [#o768dc51]

***[[特定領域検出>画像処理とコンピュータビジョン（特定領域検出）]] [#d53f797d]

***姿勢推定 [#lf3ddb61]
人や関節位置を検出し姿勢位置を出力

-2D
--2Dで出力
--ボトムアップ：関節点から人を構成
--トップダウン：人を検出してから関節点を推定し人を構成

-3D
--3Dで出力
--画角の影響を受けない。
--速度と精度が課題。

***トラッキング（物体追跡） [#t261aee4]
[[深層学習の画像認識（CNN）>深層学習（deep learning）#y3991151]]で交差時も見失わなくなる。

***ロボット・ビジョン [#qde2b94f]
-[[3D DNN>ニューラルネットワーク#lb526a13]]

**活用例 [#la3aa875]

***パターン認識 [#l5485c45]
[[物体識別>#c30857f1]]、[[物体検出>#j5d31a6f]]、[[領域検出>#o768dc51]]を専門的に（部位に特化して）行う系

-[[顔認識・検出>#a141dbf4]]
--表情認識（2D, 3D顔特徴点抽出）
--顔向き推定、視線推定（2D）
--瞬き検知（動画、眠気・集中力の検知・測定）
--顔認証（顔特徴点抽出と高速マッチング）
--感情推定（学習させるので、プロが見ても解らない事は解らない）
--性別・年齢推定（あくまで見た目でしかない、人種の差もある）

-[[医療診断>AIの活用例#m0dbf4e0]]
--がん診断
--CTやMRIの診断
--グラム染色による細菌の分類や同定

-異常・不正の検出
--製造：不良品検知
--社会：メンテナンス（異常検知）

-自動運転
--[[自動車の自動運転>#ibb37950]]
--[[ゴミ識別AI搭載自動運転クレーン>AIプロジェクトのマネジメント#b4c89dd3]]

-, etc.

***OCR・文書構造化 [#u30ea1b6]
-言語識別
-テキスト抽出
-文字起こし
-OCR文字校正

***エンリッチメント系 [#b80d75b8]
画像・映像アノテーション

-[[セグメンテーション>#o768dc51]]
-[[テキスト抽出>#u30ea1b6]]
-分類（分類もアノテーション）

※ Googleフォトの機能など。

***姿勢推定 [#k6cde46b]
Kinect等を使用した動作計測、解析

-産業：危険行動検知（事故防止
-医療：[[ロコモのスクリーニング>AIの活用例#m0dbf4e0]]

***人物行動分析 [#ifbd1032]
-行動不審者監視
-禁止危険行動検知
-店舗来場者管理

***自動車の自動運転 [#ibb37950]
-カメラやレーダー、LIDAR、超音波センサー、GPS等で周囲の環境を認識し、行き先を指定するだけで自律的に走行する。

-磁気マーカー（磁気ネイル）を埋込方式はコストや、積雪や除雪の問題から普及していない。

-一般人が公道で走行できる（自動運転レベル4・5の）自動運転車は、現在の段階では市販されていない。

-SAE J3016（自動運転レベルの定義

--レベル0：自動運転なし~
ドライバーが常にすべての主制御系統（加速、操舵、制動）の操作を行う。

--レベル1：運転支援~
加速、操舵、制動のいずれか一つをシステムが支援的に行う状態。

--レベル2：部分運転自動化~
同時に複数の操作をシステムが行う状態。

--レベル3：条件付き運転自動化~
限定的な環境・状況で自動運転（機能限界時は、ドライバーに権限移譲）。

--レベル4：高度自動運転~
レベル3は権限移譲に備える必要があるが、レベル4では不要

--レベル5：完全自動運転~
考え得る全ての状況下及び、極限環境で無人運転。

-実用化に向けての２つのアプローチ
--段階的発展のアプローチ
--挑戦的アプローチ（レベル3以上を目指す

-自動運転の盛んな都市

--欧州の都市：ヘルシンキ、Easymile EZ10、Whim

--アメリカにおける「3大州」は隣り合っている
---カリフォルニア州：有料での無人による自動運転車配車サービスを許可
---アリゾナ州：自動運転タクシーの商用サービスをスタート
---ネバダ州：米国初のレベル3自動運転車

*参考 [#qbfe7ad1]
-深層学習についてのレポート（CNN編）~
https://www.osscons.jp/joy1y64w3-537/#_537

-[[O'Reilly Japan - ゼロから作るDeep Learning >ニューラルネットワーク#w79e9c10]]~
（Pythonで学ぶディープラーニングの理論と実装）

**Wikipedia [#ba7d60b7]
-物体検出~
https://ja.wikipedia.org/wiki/%E7%89%A9%E4%BD%93%E6%A4%9C%E5%87%BA

-顔認識システム~
https://ja.wikipedia.org/wiki/%E9%A1%94%E8%AA%8D%E8%AD%98%E3%82%B7%E3%82%B9%E3%83%86%E3%83%A0

-自動運転車~
https://ja.wikipedia.org/wiki/%E8%87%AA%E5%8B%95%E9%81%8B%E8%BB%A2%E8%BB%8A

**ライブラリ [#re450249]

***オープンソース [#h303eec0]

***プロダクト [#jeb44b24]

**サービス [#u743d5fc]

***顔認識・検出 [#a141dbf4]
まだまだ、精度は低いもよう。

-スマホネイティブ組込~
まだ、笑顔情報程度しか取得できないもよう。

--Google Face API~
正確な名称が不明だが、Google Play servicesの、~
Face Detection とか、Face API などと呼ばれている。
>画像内の顔が笑顔であるかどうかを0から1の数値で取得できるもよう。

---Google Developers Japan: Google Play サービスでの顔検出~
https://googledevjp.blogspot.jp/2015/09/google-play_28.html~
・Face Detection in Google Play services | Android Developers Blog~
　http://android-developers.blogspot.jp/2015/08/face-detection-in-google-play-services.html

---Face APIで顔検出を試してみる - Qiita~
http://qiita.com/droibit/items/ec0ce34a0ad5e34593e5

---Androidの 顔検出API 笑顔判定 は「笑いながら怒る人」をどう認識するか~
https://android.benigumo.com/20150928/android%E3%81%AE-%E9%A1%94%E6%A4%9C%E5%87%BAapi-%E7%AC%91%E9%A1%94%E5%88%A4%E5%AE%9A-%E3%81%AF%E3%80%8C%E7%AC%91%E3%81%84%E3%81%AA%E3%81%8C%E3%82%89%E6%80%92%E3%82%8B%E4%BA%BA%E3%80%8D%E3%82%92/

---APIとしてはこちら。~
・Face  |  Google APIs for Android  |  Google Developers~
　https://developers.google.com/android/reference/com/google/android/gms/vision/face/Face

--Swift Core Image（iOS）~
hasSmileプロパティで true or false のデータとして取得するもよう。

---Swiftで笑顔認識をやってみた - Qiita~
http://qiita.com/ken0nek/items/4504a13bf58eb78c2538

---APIとしてはこちら。~
・CIFaceFeature - Core Image | Apple Developer Documentation~
　https://developer.apple.com/reference/coreimage/cifacefeature~
・【iOS9】Core Image の新機能：文字認識 ／追加フィルタ47種 - Over&Out その後~
　http://d.hatena.ne.jp/shu223/20150622/1434924215

--Windows.Media.FaceAnalysis（Windows）

---Windows.Media.FaceAnalysis Namespace - UWP app developer | Microsoft Docs~
https://docs.microsoft.com/en-us/uwp/api/Windows.Media.FaceAnalysis

-クラウドサービス型~
AIと連動しており、もう少々、高度なことができるもよう（年齢・性別の推定など）。

--Microsoft Cognitive Services - Face API and Emotion API

---Microsoft Cognitive Services（マイクロソフト認知サービスAPI）まとめ | 蒼いねずみのお仕事~
http://sonic.blue/it/633~
・Microsoft Cognitive Services~
　・Face API~
　　https://www.microsoft.com/cognitive-services/en-us/face-api~
　・Emotion API~
　　https://www.microsoft.com/cognitive-services/en-us/emotion-api

---【LINE Bot】 bluemixとFaceAPIを使った年齢性別推定Bot - Qiita~
http://qiita.com/shuheilocale@github/items/da6ecdeced3c00acc6f8

---マイクロソフトの顔写真から年齢と性別を当てるサイトが話題！その精度は！？ | たむらんち~
http://www.tamura.tottori.jp/2015/05/02/microsoft-azure-beta-test-face-api/

--IBM Bluemix の AlchemyAPI Face Detection~
IBM に統合された AlchemyAPI 社の人工知能 API が IBM Bluemix で公開されている。

---Bluemix の AlchemyAPI Face Detection（顔認識） API を使ってみた : まだプログラマーですが何か？~
http://dotnsf.blog.jp/archives/1023357255.html

***... [#mdab325c]

**ソリューション [#j074ed1b]

***... [#bd908082]
画像処理とコンピュータビジョン（AI） の変更点

画像処理とコンピュータビジョン（AI）の変更点