MoTメンバーの内田祐介が第76回(令和元年度)電子情報通信学会論文賞を受賞しました。本論文は中部大学の山下准教授との共著のCNNモデルに関するサーベイ論文です。
物体認識のための畳み込みニューラルネットワークの研究動向 [1]
(こちらから論文がダウンロードできます)
2012年の画像認識コンペティションILSVRCにおけるAlexNetの登場以降、画像認識においては畳み込みニューラルネットワーク (CNN) を用いることがデファクトスタンダードとなりました。ILSVRCでは毎年のように新たなCNNモデルが提案され、認識精度の改善がなされてきました。これらのCNNモデルは画像分類だけではなく、セグメンテーションや物体検出など様々なタスクを解くためのベースネットワークとしても広く利用されてきています。本論文では、AlexNet以降の代表的なCNNの変遷を振り返るとともに、近年提案されている様々なCNNの改良手法についてサーベイを行い、それらを幾つかのアプローチに分類し、解説しました。更に、代表的なモデルについて複数のデータセットを用いて学習および網羅的な精度評価を行い、各モデルの精度および学習時間の傾向について議論を行いました。
ResNet以降に提案された手法を、residualモジュールの改良、モジュールを積み重ねるマクロなアーキテクチャの改善、汎化性能改善、推論高速化等の観点から独自に体系化した点、また代表的なモデルに対して、複数のデータセットにおける学習の再現を行った結果を考察している点が評価されました。
現在、クラス分類タスクやその他のタスクのバックボーンモデルとしては、ResNet、ResNeXt、SENet、これらを組み合わせたSE-ResNeXt、軽量モデルであるMobileNet、本論文では紹介できなかったEfficientNet [2] といったモデルがデファクトスタンダードとなっており、今後もこれらのモデルが活躍することが予想されます。このため、これらを俯瞰できる本サーベイが参考になれば幸いです。本論文で紹介できなかったEfficientNetや他のタスクならではのモデルについての最新の情報については、日本ロボット学会のロボット工学セミナーにて、本論文の著者の内田が講演した際の資料がありますので、合わせて参考にして頂ければ幸いです。
Mobility Technologiesでは、AI技術の実活用を行っていくエンジニアを募集しています。 現在募集中のポジションはこちらです。話だけでも聞いてみようと思われた方はまずは面談からでもウェルカムですのでよろしくお願いいたします!
[1] 内田, 山下, "物体認識のための畳み込みニューラルネットワークの研究動向," 信学論D, Vol. J102-D, No. 3, pp. 203-225, 2019.
[2] M. Tan and Q. V. Le, "EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks," in Proc. of ICML, 2019.