.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。

目次

概要

制約を置かない実世界の画像に対する認識タスク

タスク

歴史

Sliding window approach時代

Region proposal method + CNN時代

End-to-end時代

詳細

アルゴリズム・モデル

R-CNN(Regional CNN)

Region proposal method + CNN時代、物体検出タスクと物体識別タスクを順次行う。

Fast R-CNN

中間の時代(クラス分類とBBox回帰だけEnd-to-end)

Faster R-CNN

End-to-end時代、物体検出タスクと物体識別タスクを順次行う。

YOLO(You Only Look Once)

End-to-end時代、物体検出タスクと物体識別タスクを同時並行で行う。

図1

#ref(): File not found: "yolo1.png" at page "画像処理とコンピュータビジョン(物体検出)"

入力画像
図2図3図4

#ref(): File not found: "yolo2.png" at page "画像処理とコンピュータビジョン(物体検出)"

#ref(): File not found: "yolo3.png" at page "画像処理とコンピュータビジョン(物体検出)"

#ref(): File not found: "yolo4.png" at page "画像処理とコンピュータビジョン(物体検出)"

グリッドセルに分割それぞれのグリッドセルでクラス予測グリッドセルのクラス
図5図6図7

#ref(): File not found: "yolo5.png" at page "画像処理とコンピュータビジョン(物体検出)"

#ref(): File not found: "yolo6.png" at page "画像処理とコンピュータビジョン(物体検出)"

#ref(): File not found: "yolo7.png" at page "画像処理とコンピュータビジョン(物体検出)"

BBoxとConfidenceを推測図4, 5を合わせ信頼度スコアを得る信頼度スコアに基づいて判断

SSD(Single Shot Detector)

End-to-end時代、物体検出タスクと物体識別タスクを一度の演算にまとめて行う。

参考


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS