2015/09/01
Deep Learning Entry ワークステーションの導入とDIGITS等の設定を行いました。
東京大学情報理工学系研究科 中山英樹先生にお話しを伺いました。
現在行っている主な研究は、画像・映像を中心とするさまざまなマルチメディアの認識・理解を自動的に行うための基礎技術の開発です。 これには、各種メディアを扱うための素性(特徴量)抽出や、大規模なデータを有効に利用するための機械学習・データマイニング手法の開発などが含まれ、Webサービスや実世界システムへの応用についても力を入れて取り組みたいと考えています。
また、創造情報学専攻 中山研究室では優れた創造的アイデアを産み出すと共に、これを実践的なプロダクトへと昇華できる人材の育成を目指し、下記キーワードを重視していきたいと考えています。
●世の中にないものを “ 創る ”
●創ったものは “ 実践する ”
●やったことは “ 魅せる ”
▶超多クラスパターン認識
数千・数万クラスに及ぶ物体・シーン認識を実現するために、機械学習の手法開発や並列分散処理
およびGPU実装など、ソフトウェア・ハードウェアの両面から研究を進めています。
▶転移学習
Webに溢れる大量の画像は認識システム構築のための有力な手がかりですが、実世界の画像とは性
質が異なるためそのままでは使えません。これを解決するため、マルチモーダル情報を用いた教師な
し知識転移手法の研究に注目しています。
▶深層学習 (deep learning)
深層学習とは、大規模なニューラルネットワークを生のセンサデータに直接適用し、識別のために
最適な構造を学習する方法論です。さまざまな分野で驚異的な性能を発揮することが分かり注目を浴
びていますが、計算コストが非常に大きいことや、チューニングが難しいことが課題となっています。
研究室では、独自の定式化によるシンプルかつ高速高精度なネットワーク学習手法の開発を行ってい
ます。
▲クリックすると拡大します。
▶ウェアラブルインタフェース
ヒューマンインタフェース・ロボティクスなどを軸に、コンピュータと実世界をより強力に結びつ
ける革新的な実世界アプリケーションの実現を目指しています。
▶詳細画像識別
携帯のカメラから数百種類の動植物の種類識別を行うなど、対象に関する詳細な知識を画像から検
索します。
▶Webマルチメディアデータマイニング
Web上の大量のデータから価値のある構造を自動的に発見していきます。現在、動画像からの視聴
者層推定・推薦など、幅広い応用先を見据えて研究を開始しています。
▶その他
高速類似検索、 リコメンデーション、 感性情報処理、音楽音声認識・検索、ライフログ、マルチ
モーダルなど。
東京大学 中山英樹研究室 ホームページ
http://www.nlab.ci.i.u-tokyo.ac.jp/
今回は研究成果を高めるために深層学習に定評のある、 NVIDIA社製 GeForce TITAN X 4基搭載仕様を考え導入を検討しました。また、CPU は同じコア数ラインナップの中でも一番高クロックの CPU を選択し、メモリは最大搭載量の 256GB 仕様といたしました。高クロックCPU と大容量メモリは今後の研究にはとても重要であり、この仕様を満たす事ができるのは、HPCテックさんのみであったため、導入を決意しました。導入時には、DIGITS や Caffe などの 深層学習に必要なアプリケーションもインストールされており、すぐに研究を始めることもでき、たいへん満足しています。
最速の GPU を4基搭載した計算機は想像以上に高速でした。今後さらに大きなデータを扱うことになるので、この大容量メモリを搭載した計算機は研究を進めて行く上でとても最適な計算機です。