「.NET 開発基盤部会 Wiki」は、「Open棟梁Project」,「OSSコンソーシアム .NET開発基盤部会」によって運営されています。
制約を置かない実世界の画像に対する認識タスク
アルゴリズム・モデル
Region proposal method + CNN時代、物体検出タスクと物体識別タスクを順次行う。
#ref(): File not found: "R-CNN.png" at page "画像処理とコンピュータビジョン(物体検出)"
※ 問題点は、計算が多く、学習がEnd-to-endで無い点中間の時代(クラス分類とBBox回帰だけEnd-to-end)
#ref(): File not found: "FastR-CNN.png" at page "画像処理とコンピュータビジョン(物体検出)"
※ CNNの演算回数を大幅に減らすことができ、Fast R-CNNはR-CNNの約10倍の学習速度を実現End-to-end時代、物体検出タスクと物体識別タスクを順次行う。
#ref(): File not found: "FasterR-CNN.png" at page "画像処理とコンピュータビジョン(物体検出)" | #ref(): File not found: "FasterR-CNN2.png" at page "画像処理とコンピュータビジョン(物体検出)" |
End-to-end時代、物体検出タスクと物体識別タスクを同時並行で行う。
図1 | ||
#ref(): File not found: "yolo1.png" at page "画像処理とコンピュータビジョン(物体検出)" | ||
入力画像 | ||
図2 | 図3 | 図4 |
#ref(): File not found: "yolo2.png" at page "画像処理とコンピュータビジョン(物体検出)" | #ref(): File not found: "yolo3.png" at page "画像処理とコンピュータビジョン(物体検出)" | #ref(): File not found: "yolo4.png" at page "画像処理とコンピュータビジョン(物体検出)" |
グリッドセルに分割 | それぞれのグリッドセルでクラス予測 | グリッドセルのクラス |
図5 | 図6 | 図7 |
#ref(): File not found: "yolo5.png" at page "画像処理とコンピュータビジョン(物体検出)" | #ref(): File not found: "yolo6.png" at page "画像処理とコンピュータビジョン(物体検出)" | #ref(): File not found: "yolo7.png" at page "画像処理とコンピュータビジョン(物体検出)" |
BBoxとConfidenceを推測 | 図4, 5を合わせ信頼度スコアを得る | 信頼度スコアに基づいて判断 |
End-to-end時代、物体検出タスクと物体識別タスクを一度の演算にまとめて行う。