.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。

目次

概要

画像処理とコンピュータビジョンについて纏める。

により、コンピュータビジョン(CV)開発を、
より生産的に行うことができるようになってきた。

画像処理

与えられた画像に対して何らかの処理を行い出力する。

コンピュータビジョン

OpenCV

基礎

画像入力

デジカメ

CCDやCMOSのイメージセンサを受光素子の平面上に配列した
エリアイメージセンサで受けた光(光子)を電気信号に変換して被写体の画像を生成。

イメージスキャナ

イメージセンサを受光素子の線状に配列したエリアイメージセンサで、
被写体上を走査し受けた光(光子)を電気信号に変換して被写体の画像を生成。

RDG-Dカメラ

画像形式

compへの入力

画像のデジタル化

空間のデジタル化

画素値のデジタル化

カラー画像、グレースケール画像

フォーマット

内容¥形式BMPPNGJPEGGIF
色数モノクロ2階調
24bitフルカラー
24bitフルカラー
48bitカラー
24bitフルカラーモノクロ2階調
8bitカラー
色空間RGBRGB
グレースケール
RGB
CMYK
YCbCr?
グレースケール
RGB
透過
アニメーション
画質劣化なしなしあり(式数変更が無いなら)なし
データサイズ非常に大きい非常に小さい非常に小さい

可逆的な形式(loss less)と、非可逆な形式(lossy)がある。

BMPファイル・フォーマット

PICTファイル・フォーマット

TIFFファイル・フォーマット

PNGファイル・フォーマット

JPEGファイル・フォーマット

GIFファイル・フォーマット

bit深度

1 bit 画像

白と黒の2階調画像

8 bit 画像

インデックス・カラー画像

16 bit (ハイ)カラー画像

R(5bit), G(5bit), B(6bit) の16bit

24 bit カラー画像

R(8bit), G(8bit), B(8bit) の24bit = 16,777,216色

色空間

RGB色空間

YUV(YCbCr?)色空間

HSV色空間

色空間の変換

画像処理

RBGからグレースケール変換

トーンカーブ

        /
      /
    /
  /
/

折れ線トーンカーブ

コントラスト調整

      ─
     /
    /
   /
  /
─

ガンマ変換

コントラスト調整により、自然な輝度、色彩に調整される。

             ┌  x  ┐1/γ
f(x) = 255 * │── │
             └ 255 ┘

ネガポジ反転

濃淡値が反転する。

f(x) = 255-x

ソラリゼーション

ネガ画像、ポジ画像混在のような画像が生成される。

ポスタリゼーション

出力画素値が数段回に制限される。

        ┌─
      ┌┘
    ┌┘
  ┌┘
─┘

疑似カラー処理

グレースケールに色付けする。

幾何変換

拡大・縮小、回転、並進などの処理を行う。

線形変換

x' = ax + by y' = cx + dy

┌x'┐   ┌a b┐┌x┐
└y'┘ = └c d┘└y┘
  x'    =    A x

拡大・縮小

回転

ライブラリ

オープンソース

OpenCV

BSDライセンス

LTI-Lib

LGPLライセンス

VXL

BSDライセンス

プロダクト

PPI(Integrated Performance Primitives)

Intel社、商用。

HALCON

MVTec社、商用、産業用

PatMax?

Cognex社、商用、産業用

MIL(Matrox Imaging Library)

Matrox社、商用、産業用

メディアドライブ

アプリケーション

CamDictionary?

カメラで撮影した文字をリアルタイム認識・翻訳する。

Zaim

レシートを撮影すると店舗、品目、価格を自動認識する。

Corel Paint it! Now

写真を風景画に変換する。

ゾンビブース2

撮影した顔をゾンビ風に変換する。

顔認識

まだまだ、精度は低いもよう。

スマホネイティブ組込

まだ、笑顔情報程度しか取得できないもよう。

Google Face API

正確な名称が不明だが、Google Play servicesの、
Face Detection とか、Face API などと呼ばれている。

画像内の顔が笑顔であるかどうかを0から1の数値で取得できるもよう。

APIとしてはこちら。

Swift Core Image(iOS)

hasSmileプロパティで true or false のデータとして取得するもよう。

APIとしてはこちら。

Windows.Media.FaceAnalysis?(Windows)

クラウドサービス型

AIと連動しており、もう少々、高度なことができるもよう(年齢・性別の推定など)。

Microsoft Cognitive Services - Face API and Emotion API

IBM Bluemix の AlchemyAPI Face Detection

IBM に統合された AlchemyAPI 社の人工知能 API が IBM Bluemix で公開されている。


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS