2015/03/26
GPGPU クラスタを導入頂きました。
東京工業大学情報理工学系研究科 鈴木大慈 先生にお話を伺いました。
鈴木研究室ではデータ科学にまつわる諸問題について研究を進めています。データ科学は現実世界に溢れるデータから意味のある情報を抜き出し人間の意思決定に寄与させるための方法論です。その中でも統計学と機械学習は特に重要な役割を果たしています。
統計学はデータの背後にある構造を推定するための方法論です。長い歴史を持っているだけでなく、近年のビッグデータ時代をむかえてますますその重要性を増しています。また、機械学習はコンピュータが自分自身で学習し賢くなるための方法論ですので人工知能の重要な基幹技術になっています。
鈴木研究室ではこれら統計学・機械学習の中でも「統計理論・学習理論」、「効率的大規模計算手法」、「実データ解析」を三つの軸として研究を進めています。
・『マルチプルカーネル学習とスパース推定の統計的性質。』
日本数学会年会 特別講演。
2014年3月17日 - 学習院大学。
・『機械学習におけるオンライン確率的最適化の理論。』
情報処理学会連続セミナー2013。ビッグデータの深化と真価、
第一回「ビッグデータ活用のための機械学習技術」。
2013年6月26日 - 化学会館7Fホール。
・『統計的学習理論チュートリアル:基礎から応用まで。』
第15回情報論的学習理論ワークショップ (IBIS2012)。
2012年11月7日 - 筑波大学東京キャンパス文京校舎。
・『スパース正則化学習の学習性能、特にスパース性と汎化誤差の関係について。』
第13回情報論的学習理論ワークショップ (IBIS2010)。
2010年11月4日 - 東京大学生産技術研究所。
・東京工業大学挑戦的研究賞・学長特別賞。(2014年)
・2012年度IBISML研究会賞。
Dual Averaging and Proximal Gradient Descent for Online Alternating Direction Multiplier Method.
・情報理工学系研究科長賞 東京大学大学院情報理工学系研究科。(2009年)
・情報理工学系研究科長賞 東京大学大学院情報理工学系研究科。(2006年)
・『統計的学習の基礎:データマイニング・推論・予測』共立出版 2014
Trevor Hastie, Robert Tibshirani, Jerome Friedman (原著)
杉山 将、井手 剛、 神嶌 敏弘、栗田 多喜夫、前田 英作(編)
井尻 善久、井手 剛、岩田 具治、金森 敬文、兼村 厚範、烏山 昌幸、河原 吉伸、木村 昭悟、
小西 嘉典、酒井 智弥、鈴木 大慈、竹内 一郎、玉木 徹、出口 大輔、冨岡 亮太、波部 斉、
前田 新一、持橋 大地、山田 誠(訳)
・Taiji Suzuki, and Masashi Sugiyama: Fast learning rate of multiple kernel learning:
trade-off between sparsity and smoothness. The Annals of Statistics, vol. 41,
number 3, pp. 1381-1405, 2013.
・Taiji Suzuki: Stochastic Dual Coordinate Ascent with Alternating Direction Method of
Multipliers. International Conference on Machine Learning (ICML2014), JMLR Workshop
and Conference Proceedings, 32(1): 736-744, 2014.
・Taiji Suzuki: Dual Averaging and Proximal Gradient Descent for Online Alternating
Direction Multiplier Method. International Conference on Machine Learning (ICML2013),
JMLR Workshop and Conference Proceedings, 28(1): 392-400, 2013.
・Taiji Suzuki: PAC-Bayesian Bound for Gaussian Process Regression and Multiple Kernel
Additive Model. Conference on Learning Theory (COLT2012), JMLR Workshop and
Conference Proceedings, 23: 8.1-8.20, 2012.
・Taiji Suzuki: Unifying Framework for Fast Learning Rate of Non-Sparse Multiple Kernel
Learning. In Proceedings of Advances in Neural Information Processing Systems 24
(NIPS2011), pp.1575-1583, 2011.
・鈴木大慈:統計的学習理論概説『日本応用数理学会論文誌』, 23(3), pp.537-561, 2013.
(サーベイ論文)
東京工業大学情報理工学系研究科 鈴木大慈 先生ホームページ
http://www.is.titech.ac.jp/~s-taiji/
大量データの解析を効率的に実行するためにはどうしても高性能計算機が必要になります。特に様々な方法を比較検証するためにはいくつものジョブを同時に走らせる必要があります。そのような用途には多コア・多ノードのクラスタシステムが非常に重宝します。また、機械学習においては Deep learning に代表されるように GPGPU による計算が必須になってきております。そのため、NVIDIAから発売された最新の TESLA K40、K80 などのアクセラレータをフルに活用できるようなシステムの導入が必要でした。
今回は予算の限り最大限の計算資源を取り入れました。特にコア数の多い計算ノードや高性能GPGPUを載せた計算ノードといったような様々な用途に適用できるようにシステムを構築しました。それらを有効に活用して大規模データ解析手法の研究を効率よく進めていきたいと思います。