2016/02/10
Deep Learning 専用ワークステーションを導入頂きました。
中部大学 工学部情報工学科 山下隆義 先生にお話を伺いました。
山下隆義研究室は藤吉弘亘研究室と共に “機械知覚とロボティクス” に関する研究をする為、所属の制約にとらわれず自由に最適なメンバーで研究に取り組むことができるグループ “Machine Perception and Robotics Group (MPRG)” を設立し活動をされています。
MPRG では “感覚 → 認識 → 決定” のプロセスとなる視覚機能をロボットで実現することを目標とし、特に機械学習を用いた物体検出、人物画像解析等を中心とした画像認識全般の研究にも取り組まれています。
▶Deep Convolutional Neural Networkを用いた顔画像の理解
顔画像解析は,デジタルカメラやスマートフォンの顔検出やセキュリティシステムの顔認識、顧客分析やマーケティングにおける性別年齢推定など様々な場面で用いられています。顔画像解析の研究は古くから行われていますが、表情や顔向きの変化などが課題としてあります。このような課題に対して、特徴量の改良や識別器の高精度化が取り組まれていますが、特徴量や識別器の設計は研究者の知識に基づいており、問題に応じた設計が必要となります。そこで,我々は特徴量を自動的に設計して学習するConvolutional Neural Networkを用いることで,様々な変化に対して頑健な顔画像解析を実現します。
▶Deep Convolutional Neural Networkを用いた歩行者検出の高精度化
従来の歩行者検出法では、Histogram of Oriented Gradients (HOG) 特徴量をベースとした Support Vector Machine や Deformable Part Models が一般的に用いられてきました。しかし、2012年に行われた 1,000クラスの物体認識コンテストで Hinton らのグループが提案した CNN を用いた手法が高い性能を出しました。その後、CNN を用いた手法が様々な認識問題において用いられています。歩行者検出においても、CNN をベースとした手法が2013年の歩行者検出のベンチマークにおいてトップの性能を出しています。しかし、ベンチマークでトップの性能を出している CNN ベースの手法は、構造が複雑になっており識別処理において計算コストが高いデメリットがあります。そこで、我々はシンプルな構造のCNNを用いて歩行者検出をすることで高精度な歩行者検出を実現しました。
Machine Perception and Robotics Group ホームページ
http://mprg.jp/
今回導入した計算機は機械学習を用いた物体検出や人物画像の解析用に導入しました。 今まで使用していた計算機でもシンプルな構造の Deep Convolutional Neural Network を用いているため、高速で顔画像を検出する事ができましたが、最新のアクセラレータ NVIDIA GeForce GTX TITAN X を2基搭載した計算機を使い、更なる高速化と Deep Convolutional Neural Network の研究を進めることが導入の目的です。また、導入した計算機にはアクセラレータを最大4基搭載することができ、今後の増設にも対応できるようにしています。さらに最新の高クロックCPUと大容量メモリ 128GBを搭載しバランスの良いワークステーションにしました。
本格的な研究はこれからですが、高精度な顔器官点検出の実現を目指し、Convolutional Neural Network の性能を十分に引き出せるよう研究を更に進めて行きたいと思います。