ABSTRACT. 自動運転とは、クルマの運転における認知と判断と操作をすべてコンピュータが実行する技術をいう。高速道路に関しては自動車メーカーを中心として、既に 2020年に向けた実用化が規定路線となってる。一方、本丸といえる市街地一般道での実用化に向けては、自動車メーカーのみならず IT 企業や電機メーカーも市場に参入しようとしており、技術開発競争の熾烈さが増している。自動運転は社会と産業のあり方を変えてしまうかもしれない。その命運を握るのは最先端研究であるということ、そしてそのコア技術と勝者のエコシステムについて、是非多くの方々に知ってもらいたい。
Mingi Li (University of Tsukuba, China) Yusuke Tanimura (National Institute of Advanced Industrial Science and Technology, Japan) Hidemoto Nakada (National Institute of Advanced Industrial Science and Technology, Japan)
Yuki Ito (Tokyo Institute of Technology, Japan) Ryo Matsumiya (Tokyo Institute of Technology, Japan) Toshio Endo (Tokyo Institute of Technology, Japan)
メモリ階層の利用によってGPUメモリ容量を超える深層学習手法
SPEAKER: unknown
ABSTRACT. 畳み込みニューラルネットワーク(CNN)による深層学習は計算量が非常に大きく,その計算はGPUを用いることで汎用CPUを用いた場合よりも高速に行われることが示されている.しかし,GPUメモリ容量が小さいために,ネットワークや画像のサイズが大きいCNNをGPUで高速に計算するプログラムを実装することは困難である.GPUメモリ容量を超えるデータを処理するためには,CPUメモリにデータの一部を退避させる必要がある.そのオーバーヘッドは無視できず,またソースコードも複雑になってしまう.本論文ではCPUメモリの容量を活用してGPUメモリ容量を超えるCNNの計算を可能とするout of core cuDNN(ooc_cuDNN)ライブラリの設計と実装を述べる.ooc_cuDNNは,高性能かつ普及した深層学習ライブラリのcuDNNを拡張したものであり,性能モデルに基づいた計算の分割により大規模問題を高速に計算することを可能とする.ooc_cuDNNにより,メモリ容量が6 GBのGPU一台で45 GBのメモリを必要とするCNNの計算が可能となり,その際のオーバーヘッドは7%であった.
Tomoya Tanjo (National Institute of Informatics, Japan) Kento Aida (National Institute of Informatics, Japan) Atsuko Takefusa (National Institute of Informatics, Japan) Yoshinobu Masatani (National Institute of informatics, Japan) Shigetoshi Yokoyama (National Institute of Informatics, Gunma University, Japan)
Ushio Jimbo (The Department of Informatics, School of Multidisciplinary Sciences, SOKENDAI (Graduate University for Advanced Studies), Japan) Junji Yamada (The Graduate School of Information Science and Technology, the University of Tokyo, Japan) Masahiro Goshima (Information Systems Architecture Science Research Division, National Institute of Informatics, Japan)
ABSTRACT. Power-constrained computing is now becoming essential paradigm in both high performance computing and embedded systems. Power budget is dynamically assigned to each computing resource for improving energy efficiency and system throughput. Modern computer systems have accelerator devices, such as GPUs and FPGAs, for higher energy efficiency and performance. Therefore, power management mechanisms of such accelerator devices are required. In this paper, we present a lightweight mechanism of runtime multi-level power capping on FPGA systems.