「[[.NET 開発基盤部会 Wiki>http://dotnetdevelopmentinfrastructure.osscons.jp]]」は、「[[Open棟梁Project>https://github.com/OpenTouryoProject/]]」,「[[OSSコンソーシアム .NET開発基盤部会>https://www.osscons.jp/dotNetDevelopmentInfrastructure/]]」によって運営されています。 -[[戻る>画像処理とコンピュータビジョン]]([[要素技術 > 非構造化データ処理 / 人工知能(AI)>要素技術]]、[[データ分析 > 非構造化データ処理>データ分析#p79a1ae5]]、[[深層学習(deep learning)]]、[[畳み込みニューラルネットワーク(CNN)]]) --[[言語処理(AI)]] --[[音声処理(AI)]] --画像処理(AI) ---[[物体識別>画像処理とコンピュータビジョン(物体識別)]] ---[[物体検出>画像処理とコンピュータビジョン(物体検出)]] ---[[領域検出>画像処理とコンピュータビジョン(領域検出)]] ---[[特定領域検出>画像処理とコンピュータビジョン(特定領域検出)]] *目次 [#v642ed92] #contents *概要 [#p0d9d890] -画像データを解析して特定のパターンを検出・抽出 -画像認識技術の進化 --従来は[[特徴量>機械学習(machine learning)#t209d0ea]]を設計する必要があった(特徴抽出+分類器)。 --[[深層学習の画像認識(CNN)>ニューラルネットワーク#fb7864bd]]では[[特徴量>機械学習(machine learning)#t209d0ea]]の設計が不要になった。 --様々な[[アルゴリズム>#e780581a]]がある。 ---[[物体識別>#c30857f1]] ---[[シーン識別>#f8c95ac4]] ---[[物体検出>#j5d31a6f]] ---[[領域検出>#o768dc51]] ---[[特定領域検出>#d53f797d]] *詳細 [#jca4fc0a] **体系 [#a7d55b7a] ***目的軸 [#s40fdf65] ステップがある -デジタル定量化 -認識 → 判断 ***時間軸 [#jdc16de8] -画像 -映像("系列"の一貫性を保つ ***次元軸 [#u8acf79c] -2D:画角の影響を受ける。 -3D:画角の影響を受けず汎用的だが、難易度が高い。 --[[姿勢推定>#lf3ddb61]] --[[トラッキング(物体追跡)>#t261aee4]] **手順 [#mca417b9] ***前処理 [#e24070e7] -ノイズ除去 -輪郭抽出 ***対象認識 [#c323c2d2] 対象領域を切り出す。 ***情報抽出 [#f948a948] 対象が何かを認識する。 ***事前学習 [#w90b62e0] 対象にラベル付けして学習する。 ***事例適用 [#x2c87755] 人画像に対して適用する。 **アルゴリズム [#e780581a] ***[[物体識別>画像処理とコンピュータビジョン(物体識別)]] [#c30857f1] ***シーン識別 [#f8c95ac4] [[画像認識中のシーンに関する画像認識(≒ 分類)>ニューラルネットワーク#fb7864bd]]、シーン認識とも。 -2015、[[CNN>ニューラルネットワーク#fb7864bd]]を用い「シーン」(つまり映像の意味)を認識させることに成功。 -例えば、「この写真は、公園 / 夜景 / 遊園地」など。 ***[[物体検出>画像処理とコンピュータビジョン(物体検出)]] [#j5d31a6f] ***[[領域検出>画像処理とコンピュータビジョン(領域検出)]] [#o768dc51] ***[[特定領域検出>画像処理とコンピュータビジョン(特定領域検出)]] [#d53f797d] ***姿勢推定 [#lf3ddb61] 人や関節位置を検出し姿勢位置を出力 -2D --2Dで出力 --ボトムアップ:関節点から人を構成 --トップダウン:人を検出してから関節点を推定し人を構成 -3D --3Dで出力 --画角の影響を受けない。 --速度と精度が課題。 ***トラッキング(物体追跡) [#t261aee4] [[深層学習の画像認識(CNN)>深層学習(deep learning)#y3991151]]で交差時も見失わなくなる。 ***ロボット・ビジョン [#qde2b94f] -[[3D DNN>ニューラルネットワーク#lb526a13]] **活用例 [#la3aa875] ***パターン認識 [#l5485c45] [[物体識別>#c30857f1]]、[[物体検出>#j5d31a6f]]、[[領域検出>#o768dc51]]を専門的に(部位に特化して)行う系 -[[顔認識・検出>#a141dbf4]] --表情認識(2D, 3D顔特徴点抽出) --顔向き推定、視線推定(2D) --瞬き検知(動画、眠気・集中力の検知・測定) --顔認証(顔特徴点抽出と高速マッチング) --感情推定(学習させるので、プロが見ても解らない事は解らない) --性別・年齢推定(あくまで見た目でしかない、人種の差もある) -[[医療診断>AIの活用例#m0dbf4e0]] --がん診断 --CTやMRIの診断 --グラム染色による細菌の分類や同定 -異常・不正の検出 --製造:不良品検知 --社会:メンテナンス(異常検知) -自動運転 --[[自動車の自動運転>#ibb37950]] --[[ゴミ識別AI搭載自動運転クレーン>AIプロジェクトのマネジメント#b4c89dd3]] -, etc. ***OCR・文書構造化 [#u30ea1b6] -言語識別 -テキスト抽出 -文字起こし -OCR文字校正 ***エンリッチメント系 [#b80d75b8] 画像・映像アノテーション -[[セグメンテーション>#o768dc51]] -[[テキスト抽出>#u30ea1b6]] -分類(分類もアノテーション) ※ Googleフォトの機能など。 ***姿勢推定 [#k6cde46b] Kinect等を使用した動作計測、解析 -産業:危険行動検知(事故防止 -医療:[[ロコモのスクリーニング>AIの活用例#m0dbf4e0]] ***人物行動分析 [#ifbd1032] -行動不審者監視 -禁止危険行動検知 -店舗来場者管理 ***自動車の自動運転 [#ibb37950] -カメラやレーダー、LIDAR、超音波センサー、GPS等で周囲の環境を認識し、行き先を指定するだけで自律的に走行する。 -磁気マーカー(磁気ネイル)を埋込方式はコストや、積雪や除雪の問題から普及していない。 -一般人が公道で走行できる(自動運転レベル4・5の)自動運転車は、現在の段階では市販されていない。 -SAE J3016(自動運転レベルの定義 --レベル0:自動運転なし~ ドライバーが常にすべての主制御系統(加速、操舵、制動)の操作を行う。 --レベル1:運転支援~ 加速、操舵、制動のいずれか一つをシステムが支援的に行う状態。 --レベル2:部分運転自動化~ 同時に複数の操作をシステムが行う状態。 --レベル3:条件付き運転自動化~ 限定的な環境・状況で自動運転(機能限界時は、ドライバーに権限移譲)。 --レベル4:高度自動運転~ レベル3は権限移譲に備える必要があるが、レベル4では不要 --レベル5:完全自動運転~ 考え得る全ての状況下及び、極限環境で無人運転。 -実用化に向けての2つのアプローチ --段階的発展のアプローチ --挑戦的アプローチ(レベル3以上を目指す -自動運転の盛んな都市 --欧州の都市:ヘルシンキ、Easymile EZ10、Whim --アメリカにおける「3大州」は隣り合っている ---カリフォルニア州:有料での無人による自動運転車配車サービスを許可 ---アリゾナ州:自動運転タクシーの商用サービスをスタート ---ネバダ州:米国初のレベル3自動運転車 *参考 [#qbfe7ad1] -深層学習についてのレポート(CNN編)~ https://www.osscons.jp/joy1y64w3-537/#_537 -[[O'Reilly Japan - ゼロから作るDeep Learning >ニューラルネットワーク#w79e9c10]]~ (Pythonで学ぶディープラーニングの理論と実装) **Wikipedia [#ba7d60b7] -物体検出~ https://ja.wikipedia.org/wiki/%E7%89%A9%E4%BD%93%E6%A4%9C%E5%87%BA -顔認識システム~ https://ja.wikipedia.org/wiki/%E9%A1%94%E8%AA%8D%E8%AD%98%E3%82%B7%E3%82%B9%E3%83%86%E3%83%A0 -自動運転車~ https://ja.wikipedia.org/wiki/%E8%87%AA%E5%8B%95%E9%81%8B%E8%BB%A2%E8%BB%8A **ライブラリ [#re450249] ***オープンソース [#h303eec0] ***プロダクト [#jeb44b24] **サービス [#u743d5fc] ***顔認識・検出 [#a141dbf4] まだまだ、精度は低いもよう。 -スマホネイティブ組込~ まだ、笑顔情報程度しか取得できないもよう。 --Google Face API~ 正確な名称が不明だが、Google Play servicesの、~ Face Detection とか、Face API などと呼ばれている。 >画像内の顔が笑顔であるかどうかを0から1の数値で取得できるもよう。 ---Google Developers Japan: Google Play サービスでの顔検出~ https://googledevjp.blogspot.jp/2015/09/google-play_28.html~ ・Face Detection in Google Play services | Android Developers Blog~ http://android-developers.blogspot.jp/2015/08/face-detection-in-google-play-services.html ---Face APIで顔検出を試してみる - Qiita~ http://qiita.com/droibit/items/ec0ce34a0ad5e34593e5 ---Androidの 顔検出API 笑顔判定 は「笑いながら怒る人」をどう認識するか~ https://android.benigumo.com/20150928/android%E3%81%AE-%E9%A1%94%E6%A4%9C%E5%87%BAapi-%E7%AC%91%E9%A1%94%E5%88%A4%E5%AE%9A-%E3%81%AF%E3%80%8C%E7%AC%91%E3%81%84%E3%81%AA%E3%81%8C%E3%82%89%E6%80%92%E3%82%8B%E4%BA%BA%E3%80%8D%E3%82%92/ ---APIとしてはこちら。~ ・Face | Google APIs for Android | Google Developers~ https://developers.google.com/android/reference/com/google/android/gms/vision/face/Face --Swift Core Image(iOS)~ hasSmileプロパティで true or false のデータとして取得するもよう。 ---Swiftで笑顔認識をやってみた - Qiita~ http://qiita.com/ken0nek/items/4504a13bf58eb78c2538 ---APIとしてはこちら。~ ・CIFaceFeature - Core Image | Apple Developer Documentation~ https://developer.apple.com/reference/coreimage/cifacefeature~ ・【iOS9】Core Image の新機能:文字認識 /追加フィルタ47種 - Over&Out その後~ http://d.hatena.ne.jp/shu223/20150622/1434924215 --Windows.Media.FaceAnalysis(Windows) ---Windows.Media.FaceAnalysis Namespace - UWP app developer | Microsoft Docs~ https://docs.microsoft.com/en-us/uwp/api/Windows.Media.FaceAnalysis -クラウドサービス型~ AIと連動しており、もう少々、高度なことができるもよう(年齢・性別の推定など)。 --Microsoft Cognitive Services - Face API and Emotion API ---Microsoft Cognitive Services(マイクロソフト認知サービスAPI)まとめ | 蒼いねずみのお仕事~ http://sonic.blue/it/633~ ・Microsoft Cognitive Services~ ・Face API~ https://www.microsoft.com/cognitive-services/en-us/face-api~ ・Emotion API~ https://www.microsoft.com/cognitive-services/en-us/emotion-api ---【LINE Bot】 bluemixとFaceAPIを使った年齢性別推定Bot - Qiita~ http://qiita.com/shuheilocale@github/items/da6ecdeced3c00acc6f8 ---マイクロソフトの顔写真から年齢と性別を当てるサイトが話題!その精度は!? | たむらんち~ http://www.tamura.tottori.jp/2015/05/02/microsoft-azure-beta-test-face-api/ --IBM Bluemix の AlchemyAPI Face Detection~ IBM に統合された AlchemyAPI 社の人工知能 API が IBM Bluemix で公開されている。 ---Bluemix の AlchemyAPI Face Detection(顔認識) API を使ってみた : まだプログラマーですが何か?~ http://dotnsf.blog.jp/archives/1023357255.html ***... [#mdab325c] **ソリューション [#j074ed1b] ***... [#bd908082]