Mask R-CNNを用いて作成した動画


Mask R-CNN は Microsoft の研究グループが開発したディープラーニングのモデルであり,入力された画像に対して,決められた種類の物体を認識してその位置とクラス名を特定し,なおかつ画像中のピクセル単位で物体の写っている領域を特定するマルチタスクモデルです.

一つ目の動画は処理前の動画でロサンゼルスのダウンタウンを映したフリー素材です.


2つ目の動画は位置を指定する長方形のボックスと物体のクラス名のみを表示させた動画です.


3つ目の動画は認識された物体の写っている領域のみをカラーで残し,残りの部分は白黒に変換した動画です.