.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。

目次

概要

タスク

歴史

Sliding window approach時代

Region proposal method + CNN時代

End-to-end時代

詳細

アルゴリズム・モデル

R-CNN(Regional CNN)

(CVPR 2014)

手続き

問題点

計算が多く、学習がEnd-to-endで無い点

SPPnet

(ECCV 2014)

手続き

問題点

Fast R-CNN

(ICCV 2015)

中間の時代(クラス分類とBBox回帰の学習をEnd-to-end)

手続き

問題点

候補領域の検出は別途学習

Faster R-CNN

(NIPS 2015)

手続き

問題点

YOLO(You Only Look Once)

(CVPR 2016)

End-to-end時代、物体検出タスクと物体識別タスクを同時並行で行う。

手続き

図1

#ref(): File not found: "yolo1.png" at page "画像処理とコンピュータビジョン(物体検出)"

入力画像
図2図3図4

#ref(): File not found: "yolo2.png" at page "画像処理とコンピュータビジョン(物体検出)"

#ref(): File not found: "yolo3.png" at page "画像処理とコンピュータビジョン(物体検出)"

#ref(): File not found: "yolo4.png" at page "画像処理とコンピュータビジョン(物体検出)"

グリッドセルに分割それぞれのグリッドセルでクラス予測グリッドセルのクラス
図5図6図7

#ref(): File not found: "yolo5.png" at page "画像処理とコンピュータビジョン(物体検出)"

#ref(): File not found: "yolo6.png" at page "画像処理とコンピュータビジョン(物体検出)"

#ref(): File not found: "yolo7.png" at page "画像処理とコンピュータビジョン(物体検出)"

BBoxとConfidenceを推測図4, 5を合わせ信頼度スコアを得る信頼度スコアに基づいて判断

問題点

制約で、グリッド内に大量のオブジェクトが映ってしまうような場合に弱い。

SSD(Single Shot Multibox Detector)

End-to-end時代、物体検出タスクと物体識別タスクを一度の演算にまとめ(Single Shot)て行う。

手続き

色々な説明のパターン

#ref(): File not found: "SSD2.png" at page "画像処理とコンピュータビジョン(物体検出)"

#ref(): File not found: "SSD3.png" at page "画像処理とコンピュータビジョン(物体検出)"

#ref(): File not found: "SSD5.png" at page "画像処理とコンピュータビジョン(物体検出)"

損失関数

問題点

...

参考


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS