Mask R-CNNを用いて作成した動画Mask R-CNN は Microsoft の研究グループが開発したディープラーニングのモデルであり,入力された画像に対して,決められた種類の物体を認識してその位置とクラス名を特定し,なおかつ画像中のピクセル単位で物体の写っている領域を特定するマルチタスクモデルです. 2つ目の動画は位置を指定する長方形のボックスと物体のクラス名のみを表示させた動画です. 3つ目の動画は認識された物体の写っている領域のみをカラーで残し,残りの部分は白黒に変換した動画です. |