Program for Wednesday, April 26th

PROGRAM FOR WEDNESDAY, APRIL 26TH

Days:

previous day

all days

View: session overview talk overview

10:00-11:30 Session 8: Invited Talk B

Chair:

Koji Inoue (Kyushu University, Japan)

Location: Hall B 3+4

10:00

真平加藤 (The University of Tokyo, Nagoya University, Tier IV, Inc., Japan)

自動運転システムの全容と大学発ベンチャー挑戦

SPEAKER: 真平加藤

ABSTRACT. 自動運転とは、クルマの運転における認知と判断と操作をすべてコンピュータが実行する技術をいう。高速道路に関しては自動車メーカーを中心として、既に 2020年に向けた実用化が規定路線となってる。一方、本丸といえる市街地一般道での実用化に向けては、自動車メーカーのみならず IT 企業や電機メーカーも市場に参入しようとしており、技術開発競争の熾烈さが増している。自動運転は社会と産業のあり方を変えてしまうかもしれない。その命運を握るのは最先端研究であるということ、そしてそのコア技術と勝者のエコシステムについて、是非多くの方々に知ってもらいたい。

11:30-13:00Lunch Break

13:00-14:30 Session 9A: Machine Learning

Chair:

Takeshi Iwashita (Hokkaido University, Japan)

Location: Hall B 3+4

13:00	Mingi Li (University of Tsukuba, China) Yusuke Tanimura (National Institute of Advanced Industrial Science and Technology, Japan) Hidemoto Nakada (National Institute of Advanced Industrial Science and Technology, Japan) 大規模機械学習向けクラスタにおけるネットワーク構造とパラメータ交換手法 SPEAKER: unknown ABSTRACT. 大規模なデータを対象とする機械学習システムの高速化には並列化が必須である。データ並列機械学習システムにおいては、何らかの方法で機械学習機内のパラメータの値を交換する必要があるが、パラメータ交換手法とネットワーク構造の関係は知られていない。本研究では、ネットワークシミュレータSimGridを用いて、さまざまなネットワークと、パラメータ交換手法を組み合わせて評価を行った。
13:30	Ayae Ichinose (Ochanomizu University, Japan) Atsuko Takefusa (National Institute of Informatics, Japan) Hidemoto Nakada (National Institute of Advanced Industrial Science and Technology, Japan) Masato Oguchi (Ochanomizu University, Japan) ディープラーニングフレームワークCaffeの分散処理における多種クライアントを用いた比較 SPEAKER: unknown ABSTRACT. 近年各種センサの普及とクラウドコンピューティング技術の習熟により，各種センサデータの取得や蓄積が容易になった．その結果監視カメラなどのデータをクラウドで収集して解析するアプリケーションも普及してきている．ここで，センサデータをそのまま送信してクラウドで処理する場合，プライバシや各種センサとクラウド間のネットワーク帯域の問題が生じてしまう．我々は，クラウドへ送るデータのデータ量の削減とプライバシの保護を目的とし，機械学習フレームワークCaffeの処理をクライアント側とクラウド側でパイプライン的に分散処理を行う手法を提案している．その評価として，ニューラルネットワークの分割箇所やパラメータを変化させ処理時間を比較してきた．本稿では，クライアント側として性能の異なる3種類の端末を用いて実験を行い，処理時間を比較した．結果から，端末の性能により全体の処理時間に影響する処理過程が異なり，効率のよい分散方法も異なることも確認できた．
14:00	Yuki Ito (Tokyo Institute of Technology, Japan) Ryo Matsumiya (Tokyo Institute of Technology, Japan) Toshio Endo (Tokyo Institute of Technology, Japan) メモリ階層の利用によってGPUメモリ容量を超える深層学習手法 SPEAKER: unknown ABSTRACT. 畳み込みニューラルネットワーク(CNN)による深層学習は計算量が非常に大きく，その計算はGPUを用いることで汎用CPUを用いた場合よりも高速に行われることが示されている．しかし，GPUメモリ容量が小さいために，ネットワークや画像のサイズが大きいCNNをGPUで高速に計算するプログラムを実装することは困難である．GPUメモリ容量を超えるデータを処理するためには，CPUメモリにデータの一部を退避させる必要がある．そのオーバーヘッドは無視できず，またソースコードも複雑になってしまう．本論文ではCPUメモリの容量を活用してGPUメモリ容量を超えるCNNの計算を可能とするout of core cuDNN(ooc_cuDNN)ライブラリの設計と実装を述べる．ooc_cuDNNは，高性能かつ普及した深層学習ライブラリのcuDNNを拡張したものであり，性能モデルに基づいた計算の分割により大規模問題を高速に計算することを可能とする．ooc_cuDNNにより，メモリ容量が6 GBのGPU一台で45 GBのメモリを必要とするCNNの計算が可能となり，その際のオーバーヘッドは7%であった．

13:00-14:30 Session 9B: Embeded Systems

Chair:

Ryota Shioya (Nagoya University, Japan)

Location: Hall B 1

13:00	Tatsuya Fujii (Kyushu University, Japan) Mihiro Sonoyama (Kyushu University, Japan) Takatsugu Ono (Kyushu University, Japan) Haruichi Kanaya (Kyushu University, Japan) Koji Inoue (Kyushu University, Japan) 電波伝搬特性を用いた組込みシステム向けデバイス認証法の提案 SPEAKER: unknown ABSTRACT. 通信におけるなりすまし攻撃とは，悪意ある送信機が本物のふりをして偽のデータを受信機に送信する脅威である．無線通信では，送信機と受信機が物理的に接続されていないため，有線通信と比べてなりすまし攻撃が容易となる．なりすまし攻撃の検出に用いられる一般的な方法はメッセージ認証符号をそれぞれの通信に適用することであるが，これには暗号に用いる鍵の管理が必要であるという問題が存在する．そこで，鍵管理を必要としない認証手法として受信信号強度など送信者の位置依存である信号の伝搬特性を認証に用いる手法が提案された．これまでに信号の物理的特徴を用いた位置推定に関する研究は多くなされたが，どのように無線通信の環境を構築すれば攻撃を防げるのかという議論はなされてこなかった．そこで本論文では，攻撃者が攻撃を成功させることができる環境を定式化することで，無線通信におけるなりすまし攻撃を防ぐための通信環境を構築する手法を提案する．また，無線送受信機を用いたなりすまし攻撃実験によりその妥当性を確認した．
13:30	Mihiro Sonoyama (Kyushu University, Japan) Tatsuya Fujii (Kyushu University, Japan) Takatsugu Ono (Kyushu University, Japan) Osamu Muta (Kyushu University, Japan) Koji Inoue (Kyushu University, Japan) アンテナ指向性が受信信号強度デバイス認証法に与える影響 SPEAKER: unknown ABSTRACT. 無線通信においては，送受信機が直接接続されていないという性質上，有線通信にはない問題が存在する．その中のひとつとして，我々はなりすまし攻撃に注目した．これは，悪意のある送信機が本物のふりをして偽のデータを受信機に送信する脅威である．先行研究において，藤井らは無線通信におけるなりすまし攻撃を検出する新しい方式として，受信機の受信信号強度を用いたデバイス認証方式を提案した.これは，受信信号強度によって送受信機間の物理的距離を推定することで送信機の認証を行うものであり，暗号技術などの情報処理に依存しないという特徴を持つ．これまで，なりすまし攻撃が可能となる物理空間のモデル化がなされ，二つの受信機を用いることでその空間が有限に限定できることが確認されたが，実際のアンテナパターンを考慮した特性評価は行われていない．そこで本研究では，このモデルに標準アンテナとして一般に用いられる半波長ダイポールアンテナの指向性を導入し，なりすまし攻撃が可能となる物理空間の変化を確認した．その結果，無限遠方からの攻撃可能性，および送信機の設置角度による攻撃可能空間の変化が明らかになった．それらの問題点を解決するために，新たな受信機を追加した攻撃可能条件を検討し，評価を行った．最後に，シミュレーションソフトウェアを用いた攻撃可能空間の検証により，指向性導入後のモデルの妥当性を確認した．
14:00	Shoki Fukuda (Kogakuin University, Japan) Shun Kurihara (Kogakuin University, Japan) Shintaro Hamanaka (Kogakuin University, Japan) Masato Oguchi (Ochanomizu University, Japan) Saneyasu Yamaguchi (Kogakuin University, Japan) カーネルの時刻管理実装の改変によるアプリケーション観察時間の短縮 SPEAKER: unknown ABSTRACT. スマートフォンやタブレットPCなどのモバイル端末が普及し，膨大な数のモバイル端末向けアプリケーションが開発，配布されている．アプリケーションの動作解析は，アプリケーション配布サイト運営者やアプリケーション開発者にとって非常に重要な事項であるが，アプリケーションを実際に動作させて振る舞いを観察する動的解析には非常に長い時間がかかるという課題がある．本稿では，Linux カーネルを使用している Android OS に注目し，カーネルの時刻管理実装を改変し同OSのシステム内の時間の流れを仮想的に速くし観察時間を短縮する手法について考察する．具体的には，Linux カーネルにおける時間管理実装の改変による加速環境の構築手法を紹介し，その評価および課題を示す．

14:30-14:45Coffee Break

14:45-16:15 Session 10A: Cloud Computing and File Systems

Chair:

Ryousei Takano (AIST, Japan)

Location: Hall B 3+4

14:45	Tomoya Tanjo (National Institute of Informatics, Japan) Kento Aida (National Institute of Informatics, Japan) Atsuko Takefusa (National Institute of Informatics, Japan) Yoshinobu Masatani (National Institute of informatics, Japan) Shigetoshi Yokoyama (National Institute of Informatics, Gunma University, Japan) インタークラウド環境における計算資源の動的再構成フレームワークの実現に向けて SPEAKER: unknown ABSTRACT. 近年のクラウド計算機基盤の高性能化に伴い，複数のクラウド基盤を連携して活用するインタークラウドへの関心が高まっている．インタークラウド上の効率的なアプリケーション環境の実行には，実行状況に応じた計算資源の再構成が重要だが，アプリケーションごとに適切な再構成戦略は異なり，また計算資源の選択時に満たすべき制約も多様であるため，これらを単一の再構成システムで取り扱うことが難しいという問題がある．本論文では，再構成に必要な計算資源が満たすべき要求 (資源要求制約) がアプリケーションとは独立に定義できることに着目し，再構成戦略に基づき資源要求制約を求めるアプリケーションスケジューラと，与えられた資源要求制約を満たす計算資源を決定するリソースアロケータからなる動的再構成フレームワークの提案を行う．動的再構成フレームワークをこれらのサブシステムに分割することにより，計算資源の再構成戦略と計算資源の選択戦略の個別最適化が可能となる．また再構成の判断に不可欠な，アプリケーションメトリクスの収集機能についても述べる．
15:15	Kohei Toshimitsu (University of Tokyo, Japan) Kenjiro Taura (University of Tokyo, Japan) Instant Cloud FS : 広域分散環境で即興に構築できる分散ファイルシステム SPEAKER: unknown ABSTRACT. 近年、ビッグデータ処理の需要が高まっている。しかし、処理したいデータが初めから目的のリソース上にあるとは限らない。そこで、分散ファイルシステムを導入して、リモートのデータにネットワーク越しですぐにアクセスできるようにすることを考える。しかし、分散ファイルシステムは、一般的に固定されたノードの集合（LAN内、Grid環境など）で構成されることを前提としている。例えば、NATの影響でリモートからアクセスできない手元のPCを含めることや、ファイアーウォールの影響がある2つのリージョンにまたがるクラウド群で構成することは非常に困難である。また、分散ファイルシステムでは、導入に手間がかかるという欠点もある。そこで、これらの問題を解決するために、Instant Cloud FS (ICFS) という分散ファイルシステムを開発した。ICFSでは、手元のPCを構築ノード群に加える、複数のリージョンにまたがってノード群を構成するという、従来の分散ファイルシステムでは難しかった環境で分散ファイルシステムを構築できる。また、構成ノード群は、非特権ユーザでもICFSの設定ファイルを書き換えるだけですぐに変更ができ、かつ各ノードで必要とされる前作業も少なくなっている。実際に、ICFSは、AWSのクラウド20台 (東京10台、ソウル10台)、東京大学のクラウド10台、手元のMacBook Proという、広域かつNATやファイアーウォールの影響がある環境で構築できるということが確認できている。
15:45	Hiroki Nakazawa (The University of Tokyo, Japan) Kenjiro Taura (The University of Tokyo, Japan) アトミックなデータ永続化を備えた次世代不揮発性メモリ向けファイルシステム(AMFS)の高速化 SPEAKER: unknown ABSTRACT. 　DRAMと同オーダのアクセス性能を持ち，バイトアクセス性を備えた大容量次世代不揮発性メモリ (Persistent Memory, PM)の登場が期待されている．このような特徴を効果的に利用するためには，従来のブロックデバイスを想定した既存のファイルシステムでは不十分である．また，PMの特徴を効果的に用いれば，従来のようなブロックデバイスでは高コストであったデータの耐障害性確保をより低いコストで実現することができる．　アトミックなデータ永続化をサポートするPM向けのファイルシステムの一つにAMFSが挙げられる．AMFSは，動作速度に弱点を抱えており，特に大規模なデータに対する小規模な変更，ファイル中のばらばらな位置への変更といった処理に対してその傾向は顕著である．本研究では，PM上の割り当て済みブロックの管理手法，永続化すべきデータの発見手法について提案，実装を行いAMFSの高速化を図った．マイクロベンチマークによる評価の結果，ファイルの一部のみを変更する場合は最大で85倍，ファイルのばらばらな位置を大きく変更する場合については最大で29倍の高速化を達成した．

14:45-16:15 Session 10B: FPGA and LSI

Chair:

Yohei Hasegawa (Toshiba Corporation, Japan)

Location: Hall B 1

14:45	Ryo Takata (The University of Tokyo, Japan) Jun Ishii (The University of Tokyo, Japan) Ryuichi Sakamoto (The University of Tokyo, Japan) Masaaki Kondo (The University of Tokyo, Japan) Hiroshi Nakamura (The University of Tokyo, Japan) Tetsui Ohkubo (Keio University, Japan) Takuya Kojima (Keio University, Japan) Hideharu Amano (Keio University, Japan) ディープニューラルネットワーク向けアクセラレータチップの設計と性能評価 SPEAKER: unknown ABSTRACT. 近年，ディープニューラルネットワーク(Deep Neural Network: DNN)を組込みシステムに応用することが期待されており，省電力なDNN向けアクセラレータの開発が重要な課題となっている．しかしながら,これまで提案されてきたアクセラレータは2次元畳込み演算などの特定のネットワーク構造向けに最適化されたものや，データアクセス削減のためにネットワーク構造を工夫するものが多い．対象とするネットワーク構成が限定され汎用性に課題がある．そこで我々は,多様なネットワーク構成に柔軟に対応可能で電力効率に優れたアクセラレータのアーキテクチャを検討している．今回，命令による汎用的な動作が可能なマイクロコントローラとSIMD型積和演算器から構成される電力効率の良いコアを設計し，マルチコア構成のアクセラレータに対し消費エネルギーあたりの性能評価を行った．
15:15	Ushio Jimbo (The Department of Informatics, School of Multidisciplinary Sciences, SOKENDAI (Graduate University for Advanced Studies), Japan) Junji Yamada (The Graduate School of Information Science and Technology, the University of Tokyo, Japan) Masahiro Goshima (Information Systems Architecture Science Research Division, National Institute of Informatics, Japan) 動的タイム・ボローイングを可能にするクロッキング方式の適用 SPEAKER: unknown ABSTRACT. 半導体プロセスの微細化に伴うチップ上の素子遅延のランダムなばらつきの増加は，回路設計における大きな問題である．ばらつきが増大していくと，従来のワースト・ケースに基づいた設計手法では性能の向上が見込めなくなる．そのため，ワースト・ケースより平均的ケースにおける遅延に基づいた動作を実現する手法が研究されてきた．そのような手法のひとつとして，我々は動的タイム・ボローイングを可能にするクロッキング方式を提案している．このクロッキング方式は，動的なばらつき対策手法である動的タイミング・フォールト検出と二相ラッチによるクロッキング方式の組み合わせにより実現され，動作時にステージ間で回路遅延を融通することで，平均的ケースに合わせた速度で回路を動作させることが可能になる．FPGA上で動的タイム・ボローイングを可能にするクロッキング方式をリプル・キャリー・アダーを用いたカウンターに適用し評価を行った．
15:45	Keisuke Fujimoto (Nara Institute of Science and Technology, Japan) Takashi Nakada (Nara Institute of Science and Technology, Japan) Shinya Takamaeda-Yamazaki (Hokkaido University, Japan) Yasuhiko Nakashima (Nara Institute of Science and Technology, Japan) A Multi-Level Power-Capping Mechanism for FPGAs SPEAKER: unknown ABSTRACT. Power-constrained computing is now becoming essential paradigm in both high performance computing and embedded systems. Power budget is dynamically assigned to each computing resource for improving energy efficiency and system throughput. Modern computer systems have accelerator devices, such as GPUs and FPGAs, for higher energy efficiency and performance. Therefore, power management mechanisms of such accelerator devices are required. In this paper, we present a lightweight mechanism of runtime multi-level power capping on FPGA systems.

16:15-16:45 Session 11: Award Ceremony & Closing

Chair:

Masahiro Goshima (Information Systems Architecture Science Research Division, National Institute of Informatics, Japan)

Location: Hall B 3+4