画像処理とコンピュータビジョン(AI)
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
単語検索
|
最終更新
|
ヘルプ
]
開始行:
「[[.NET 開発基盤部会 Wiki>http://dotnetdevelopmentinfras...
-[[戻る>画像処理とコンピュータビジョン]]([[要素技術 > 非...
--[[言語処理(AI)]]
--[[音声処理(AI)]]
--画像処理(AI)
---[[物体識別>画像処理とコンピュータビジョン(物体識別)]]
---[[物体検出>画像処理とコンピュータビジョン(物体検出)]]
---[[領域検出>画像処理とコンピュータビジョン(領域検出)]]
---[[特定領域検出>画像処理とコンピュータビジョン(特定領...
*目次 [#v642ed92]
#contents
*概要 [#p0d9d890]
-画像データを解析して特定のパターンを検出・抽出
-画像認識技術の進化
--従来は[[特徴量>機械学習(machine learning)#t209d0ea]]...
--[[深層学習の画像認識(CNN)>ニューラルネットワーク#fb78...
--様々な[[アルゴリズム>#e780581a]]がある。
---[[物体識別>#c30857f1]]
---[[シーン識別>#f8c95ac4]]
---[[物体検出>#j5d31a6f]]
---[[領域検出>#o768dc51]]
---[[特定領域検出>#d53f797d]]
*詳細 [#jca4fc0a]
**体系 [#a7d55b7a]
***目的軸 [#s40fdf65]
ステップがある
-デジタル定量化
-認識 → 判断
***時間軸 [#jdc16de8]
-画像
-映像("系列"の一貫性を保つ
***次元軸 [#u8acf79c]
-2D:画角の影響を受ける。
-3D:画角の影響を受けず汎用的だが、難易度が高い。
--[[姿勢推定>#lf3ddb61]]
--[[トラッキング(物体追跡)>#t261aee4]]
**手順 [#mca417b9]
***前処理 [#e24070e7]
-ノイズ除去
-輪郭抽出
***対象認識 [#c323c2d2]
対象領域を切り出す。
***情報抽出 [#f948a948]
対象が何かを認識する。
***事前学習 [#w90b62e0]
対象にラベル付けして学習する。
***事例適用 [#x2c87755]
人画像に対して適用する。
**アルゴリズム [#e780581a]
***[[物体識別>画像処理とコンピュータビジョン(物体識別)]...
***シーン識別 [#f8c95ac4]
[[画像認識中のシーンに関する画像認識(≒ 分類)>ニューラル...
-2015、[[CNN>ニューラルネットワーク#fb7864bd]]を用い「シ...
-例えば、「この写真は、公園 / 夜景 / 遊園地」など。
***[[物体検出>画像処理とコンピュータビジョン(物体検出)]...
***[[領域検出>画像処理とコンピュータビジョン(領域検出)]...
***[[特定領域検出>画像処理とコンピュータビジョン(特定領...
***姿勢推定 [#lf3ddb61]
人や関節位置を検出し姿勢位置を出力
-2D
--2Dで出力
--ボトムアップ:関節点から人を構成
--トップダウン:人を検出してから関節点を推定し人を構成
-3D
--3Dで出力
--画角の影響を受けない。
--速度と精度が課題。
***トラッキング(物体追跡) [#t261aee4]
[[深層学習の画像認識(CNN)>深層学習(deep learning)#y39...
***ロボット・ビジョン [#qde2b94f]
-[[3D DNN>ニューラルネットワーク#lb526a13]]
**活用例 [#la3aa875]
***パターン認識 [#l5485c45]
[[物体識別>#c30857f1]]、[[物体検出>#j5d31a6f]]、[[領域検...
-[[顔認識・検出>#a141dbf4]]
--表情認識(2D, 3D顔特徴点抽出)
--顔向き推定、視線推定(2D)
--瞬き検知(動画、眠気・集中力の検知・測定)
--顔認証(顔特徴点抽出と高速マッチング)
--感情推定(学習させるので、プロが見ても解らない事は解ら...
--性別・年齢推定(あくまで見た目でしかない、人種の差もあ...
-[[医療診断>AIの活用例#m0dbf4e0]]
--がん診断
--CTやMRIの診断
--グラム染色による細菌の分類や同定
-異常・不正の検出
--製造:不良品検知
--社会:メンテナンス(異常検知)
-自動運転
--[[自動車の自動運転>#ibb37950]]
--[[ゴミ識別AI搭載自動運転クレーン>AIプロジェクトのマネジ...
-, etc.
***OCR・文書構造化 [#u30ea1b6]
-言語識別
-テキスト抽出
-文字起こし
-OCR文字校正
***エンリッチメント系 [#b80d75b8]
画像・映像アノテーション
-[[セグメンテーション>#o768dc51]]
-[[テキスト抽出>#u30ea1b6]]
-分類(分類もアノテーション)
※ Googleフォトの機能など。
***姿勢推定 [#k6cde46b]
Kinect等を使用した動作計測、解析
-産業:危険行動検知(事故防止
-医療:[[ロコモのスクリーニング>AIの活用例#m0dbf4e0]]
***人物行動分析 [#ifbd1032]
-行動不審者監視
-禁止危険行動検知
-店舗来場者管理
***自動車の自動運転 [#ibb37950]
-カメラやレーダー、LIDAR、超音波センサー、GPS等で周囲の環...
-磁気マーカー(磁気ネイル)を埋込方式はコストや、積雪や除...
-一般人が公道で走行できる(自動運転レベル4・5の)自動運転...
-SAE J3016(自動運転レベルの定義
--レベル0:自動運転なし~
ドライバーが常にすべての主制御系統(加速、操舵、制動)の...
--レベル1:運転支援~
加速、操舵、制動のいずれか一つをシステムが支援的に行う状...
--レベル2:部分運転自動化~
同時に複数の操作をシステムが行う状態。
--レベル3:条件付き運転自動化~
限定的な環境・状況で自動運転(機能限界時は、ドライバーに...
--レベル4:高度自動運転~
レベル3は権限移譲に備える必要があるが、レベル4では不要
--レベル5:完全自動運転~
考え得る全ての状況下及び、極限環境で無人運転。
-実用化に向けての2つのアプローチ
--段階的発展のアプローチ
--挑戦的アプローチ(レベル3以上を目指す
-自動運転の盛んな都市
--欧州の都市:ヘルシンキ、Easymile EZ10、Whim
--アメリカにおける「3大州」は隣り合っている
---カリフォルニア州:有料での無人による自動運転車配車サー...
---アリゾナ州:自動運転タクシーの商用サービスをスタート
---ネバダ州:米国初のレベル3自動運転車
*参考 [#qbfe7ad1]
-深層学習についてのレポート(CNN編)~
https://www.osscons.jp/joy1y64w3-537/#_537
-[[O'Reilly Japan - ゼロから作るDeep Learning >ニューラル...
(Pythonで学ぶディープラーニングの理論と実装)
**Wikipedia [#ba7d60b7]
-物体検出~
https://ja.wikipedia.org/wiki/%E7%89%A9%E4%BD%93%E6%A4%9C...
-顔認識システム~
https://ja.wikipedia.org/wiki/%E9%A1%94%E8%AA%8D%E8%AD%98...
-自動運転車~
https://ja.wikipedia.org/wiki/%E8%87%AA%E5%8B%95%E9%81%8B...
**ライブラリ [#re450249]
***オープンソース [#h303eec0]
***プロダクト [#jeb44b24]
**サービス [#u743d5fc]
***顔認識・検出 [#a141dbf4]
まだまだ、精度は低いもよう。
-スマホネイティブ組込~
まだ、笑顔情報程度しか取得できないもよう。
--Google Face API~
正確な名称が不明だが、Google Play servicesの、~
Face Detection とか、Face API などと呼ばれている。
>画像内の顔が笑顔であるかどうかを0から1の数値で取得できる...
---Google Developers Japan: Google Play サービスでの顔検出~
https://googledevjp.blogspot.jp/2015/09/google-play_28.ht...
・Face Detection in Google Play services | Android Develo...
http://android-developers.blogspot.jp/2015/08/face-dete...
---Face APIで顔検出を試してみる - Qiita~
http://qiita.com/droibit/items/ec0ce34a0ad5e34593e5
---Androidの 顔検出API 笑顔判定 は「笑いながら怒る人」を...
https://android.benigumo.com/20150928/android%E3%81%AE-%E...
---APIとしてはこちら。~
・Face | Google APIs for Android | Google Developers~
https://developers.google.com/android/reference/com/goo...
--Swift Core Image(iOS)~
hasSmileプロパティで true or false のデータとして取得する...
---Swiftで笑顔認識をやってみた - Qiita~
http://qiita.com/ken0nek/items/4504a13bf58eb78c2538
---APIとしてはこちら。~
・CIFaceFeature - Core Image | Apple Developer Documentat...
https://developer.apple.com/reference/coreimage/cifacef...
・【iOS9】Core Image の新機能:文字認識 /追加フィルタ47...
http://d.hatena.ne.jp/shu223/20150622/1434924215
--Windows.Media.FaceAnalysis(Windows)
---Windows.Media.FaceAnalysis Namespace - UWP app develop...
https://docs.microsoft.com/en-us/uwp/api/Windows.Media.Fa...
-クラウドサービス型~
AIと連動しており、もう少々、高度なことができるもよう(年...
--Microsoft Cognitive Services - Face API and Emotion API
---Microsoft Cognitive Services(マイクロソフト認知サービ...
http://sonic.blue/it/633~
・Microsoft Cognitive Services~
・Face API~
https://www.microsoft.com/cognitive-services/en-us/fa...
・Emotion API~
https://www.microsoft.com/cognitive-services/en-us/em...
---【LINE Bot】 bluemixとFaceAPIを使った年齢性別推定Bot -...
http://qiita.com/shuheilocale@github/items/da6ecdeced3c00...
---マイクロソフトの顔写真から年齢と性別を当てるサイトが話...
http://www.tamura.tottori.jp/2015/05/02/microsoft-azure-b...
--IBM Bluemix の AlchemyAPI Face Detection~
IBM に統合された AlchemyAPI 社の人工知能 API が IBM Bluem...
---Bluemix の AlchemyAPI Face Detection(顔認識) API を...
http://dotnsf.blog.jp/archives/1023357255.html
***... [#mdab325c]
**ソリューション [#j074ed1b]
***... [#bd908082]
終了行:
「[[.NET 開発基盤部会 Wiki>http://dotnetdevelopmentinfras...
-[[戻る>画像処理とコンピュータビジョン]]([[要素技術 > 非...
--[[言語処理(AI)]]
--[[音声処理(AI)]]
--画像処理(AI)
---[[物体識別>画像処理とコンピュータビジョン(物体識別)]]
---[[物体検出>画像処理とコンピュータビジョン(物体検出)]]
---[[領域検出>画像処理とコンピュータビジョン(領域検出)]]
---[[特定領域検出>画像処理とコンピュータビジョン(特定領...
*目次 [#v642ed92]
#contents
*概要 [#p0d9d890]
-画像データを解析して特定のパターンを検出・抽出
-画像認識技術の進化
--従来は[[特徴量>機械学習(machine learning)#t209d0ea]]...
--[[深層学習の画像認識(CNN)>ニューラルネットワーク#fb78...
--様々な[[アルゴリズム>#e780581a]]がある。
---[[物体識別>#c30857f1]]
---[[シーン識別>#f8c95ac4]]
---[[物体検出>#j5d31a6f]]
---[[領域検出>#o768dc51]]
---[[特定領域検出>#d53f797d]]
*詳細 [#jca4fc0a]
**体系 [#a7d55b7a]
***目的軸 [#s40fdf65]
ステップがある
-デジタル定量化
-認識 → 判断
***時間軸 [#jdc16de8]
-画像
-映像("系列"の一貫性を保つ
***次元軸 [#u8acf79c]
-2D:画角の影響を受ける。
-3D:画角の影響を受けず汎用的だが、難易度が高い。
--[[姿勢推定>#lf3ddb61]]
--[[トラッキング(物体追跡)>#t261aee4]]
**手順 [#mca417b9]
***前処理 [#e24070e7]
-ノイズ除去
-輪郭抽出
***対象認識 [#c323c2d2]
対象領域を切り出す。
***情報抽出 [#f948a948]
対象が何かを認識する。
***事前学習 [#w90b62e0]
対象にラベル付けして学習する。
***事例適用 [#x2c87755]
人画像に対して適用する。
**アルゴリズム [#e780581a]
***[[物体識別>画像処理とコンピュータビジョン(物体識別)]...
***シーン識別 [#f8c95ac4]
[[画像認識中のシーンに関する画像認識(≒ 分類)>ニューラル...
-2015、[[CNN>ニューラルネットワーク#fb7864bd]]を用い「シ...
-例えば、「この写真は、公園 / 夜景 / 遊園地」など。
***[[物体検出>画像処理とコンピュータビジョン(物体検出)]...
***[[領域検出>画像処理とコンピュータビジョン(領域検出)]...
***[[特定領域検出>画像処理とコンピュータビジョン(特定領...
***姿勢推定 [#lf3ddb61]
人や関節位置を検出し姿勢位置を出力
-2D
--2Dで出力
--ボトムアップ:関節点から人を構成
--トップダウン:人を検出してから関節点を推定し人を構成
-3D
--3Dで出力
--画角の影響を受けない。
--速度と精度が課題。
***トラッキング(物体追跡) [#t261aee4]
[[深層学習の画像認識(CNN)>深層学習(deep learning)#y39...
***ロボット・ビジョン [#qde2b94f]
-[[3D DNN>ニューラルネットワーク#lb526a13]]
**活用例 [#la3aa875]
***パターン認識 [#l5485c45]
[[物体識別>#c30857f1]]、[[物体検出>#j5d31a6f]]、[[領域検...
-[[顔認識・検出>#a141dbf4]]
--表情認識(2D, 3D顔特徴点抽出)
--顔向き推定、視線推定(2D)
--瞬き検知(動画、眠気・集中力の検知・測定)
--顔認証(顔特徴点抽出と高速マッチング)
--感情推定(学習させるので、プロが見ても解らない事は解ら...
--性別・年齢推定(あくまで見た目でしかない、人種の差もあ...
-[[医療診断>AIの活用例#m0dbf4e0]]
--がん診断
--CTやMRIの診断
--グラム染色による細菌の分類や同定
-異常・不正の検出
--製造:不良品検知
--社会:メンテナンス(異常検知)
-自動運転
--[[自動車の自動運転>#ibb37950]]
--[[ゴミ識別AI搭載自動運転クレーン>AIプロジェクトのマネジ...
-, etc.
***OCR・文書構造化 [#u30ea1b6]
-言語識別
-テキスト抽出
-文字起こし
-OCR文字校正
***エンリッチメント系 [#b80d75b8]
画像・映像アノテーション
-[[セグメンテーション>#o768dc51]]
-[[テキスト抽出>#u30ea1b6]]
-分類(分類もアノテーション)
※ Googleフォトの機能など。
***姿勢推定 [#k6cde46b]
Kinect等を使用した動作計測、解析
-産業:危険行動検知(事故防止
-医療:[[ロコモのスクリーニング>AIの活用例#m0dbf4e0]]
***人物行動分析 [#ifbd1032]
-行動不審者監視
-禁止危険行動検知
-店舗来場者管理
***自動車の自動運転 [#ibb37950]
-カメラやレーダー、LIDAR、超音波センサー、GPS等で周囲の環...
-磁気マーカー(磁気ネイル)を埋込方式はコストや、積雪や除...
-一般人が公道で走行できる(自動運転レベル4・5の)自動運転...
-SAE J3016(自動運転レベルの定義
--レベル0:自動運転なし~
ドライバーが常にすべての主制御系統(加速、操舵、制動)の...
--レベル1:運転支援~
加速、操舵、制動のいずれか一つをシステムが支援的に行う状...
--レベル2:部分運転自動化~
同時に複数の操作をシステムが行う状態。
--レベル3:条件付き運転自動化~
限定的な環境・状況で自動運転(機能限界時は、ドライバーに...
--レベル4:高度自動運転~
レベル3は権限移譲に備える必要があるが、レベル4では不要
--レベル5:完全自動運転~
考え得る全ての状況下及び、極限環境で無人運転。
-実用化に向けての2つのアプローチ
--段階的発展のアプローチ
--挑戦的アプローチ(レベル3以上を目指す
-自動運転の盛んな都市
--欧州の都市:ヘルシンキ、Easymile EZ10、Whim
--アメリカにおける「3大州」は隣り合っている
---カリフォルニア州:有料での無人による自動運転車配車サー...
---アリゾナ州:自動運転タクシーの商用サービスをスタート
---ネバダ州:米国初のレベル3自動運転車
*参考 [#qbfe7ad1]
-深層学習についてのレポート(CNN編)~
https://www.osscons.jp/joy1y64w3-537/#_537
-[[O'Reilly Japan - ゼロから作るDeep Learning >ニューラル...
(Pythonで学ぶディープラーニングの理論と実装)
**Wikipedia [#ba7d60b7]
-物体検出~
https://ja.wikipedia.org/wiki/%E7%89%A9%E4%BD%93%E6%A4%9C...
-顔認識システム~
https://ja.wikipedia.org/wiki/%E9%A1%94%E8%AA%8D%E8%AD%98...
-自動運転車~
https://ja.wikipedia.org/wiki/%E8%87%AA%E5%8B%95%E9%81%8B...
**ライブラリ [#re450249]
***オープンソース [#h303eec0]
***プロダクト [#jeb44b24]
**サービス [#u743d5fc]
***顔認識・検出 [#a141dbf4]
まだまだ、精度は低いもよう。
-スマホネイティブ組込~
まだ、笑顔情報程度しか取得できないもよう。
--Google Face API~
正確な名称が不明だが、Google Play servicesの、~
Face Detection とか、Face API などと呼ばれている。
>画像内の顔が笑顔であるかどうかを0から1の数値で取得できる...
---Google Developers Japan: Google Play サービスでの顔検出~
https://googledevjp.blogspot.jp/2015/09/google-play_28.ht...
・Face Detection in Google Play services | Android Develo...
http://android-developers.blogspot.jp/2015/08/face-dete...
---Face APIで顔検出を試してみる - Qiita~
http://qiita.com/droibit/items/ec0ce34a0ad5e34593e5
---Androidの 顔検出API 笑顔判定 は「笑いながら怒る人」を...
https://android.benigumo.com/20150928/android%E3%81%AE-%E...
---APIとしてはこちら。~
・Face | Google APIs for Android | Google Developers~
https://developers.google.com/android/reference/com/goo...
--Swift Core Image(iOS)~
hasSmileプロパティで true or false のデータとして取得する...
---Swiftで笑顔認識をやってみた - Qiita~
http://qiita.com/ken0nek/items/4504a13bf58eb78c2538
---APIとしてはこちら。~
・CIFaceFeature - Core Image | Apple Developer Documentat...
https://developer.apple.com/reference/coreimage/cifacef...
・【iOS9】Core Image の新機能:文字認識 /追加フィルタ47...
http://d.hatena.ne.jp/shu223/20150622/1434924215
--Windows.Media.FaceAnalysis(Windows)
---Windows.Media.FaceAnalysis Namespace - UWP app develop...
https://docs.microsoft.com/en-us/uwp/api/Windows.Media.Fa...
-クラウドサービス型~
AIと連動しており、もう少々、高度なことができるもよう(年...
--Microsoft Cognitive Services - Face API and Emotion API
---Microsoft Cognitive Services(マイクロソフト認知サービ...
http://sonic.blue/it/633~
・Microsoft Cognitive Services~
・Face API~
https://www.microsoft.com/cognitive-services/en-us/fa...
・Emotion API~
https://www.microsoft.com/cognitive-services/en-us/em...
---【LINE Bot】 bluemixとFaceAPIを使った年齢性別推定Bot -...
http://qiita.com/shuheilocale@github/items/da6ecdeced3c00...
---マイクロソフトの顔写真から年齢と性別を当てるサイトが話...
http://www.tamura.tottori.jp/2015/05/02/microsoft-azure-b...
--IBM Bluemix の AlchemyAPI Face Detection~
IBM に統合された AlchemyAPI 社の人工知能 API が IBM Bluem...
---Bluemix の AlchemyAPI Face Detection(顔認識) API を...
http://dotnsf.blog.jp/archives/1023357255.html
***... [#mdab325c]
**ソリューション [#j074ed1b]
***... [#bd908082]
ページ名: