XSIG 2018: 2ND CROSS-DISCIPLINARY WORKSHOP ON COMPUTING SYSTEMS, INFRASTRUCTURES, AND PROGRAMMING
PROGRAM FOR MONDAY, MAY 28TH
Days:
next day
all days

View: session overviewtalk overview

14:15-14:30 Session 1: Opening
Location: Hitotsubashi Hall
14:30-16:00 Session 2A: Concurrency Control
Chair:
Location: Hitotsubashi Hall
14:30
トランザクショナルメモリとロックを併用する並行性制御手法
SPEAKER: 昌樹 林

ABSTRACT. トランザクショナルメモリは,トランザクションとして定義された区間を投機的に並行実行するこ とで,粗粒度ロックと同等以上の記述性と,細粒度ロックと同等以上の性能とを両立しうるパラダイムと して期待されている.しかし,共有変数に対するアクセス競合が頻発する場合は,必ずしも高い性能を実 現し得ない.本稿では,プログラム中に定義されたトランザクションのうちのいくつかを,ロックによる 制御同様,排他的に実行した場合,性能にどのような変化があるかを調査・解析する.また,ロックとト ランザクショナルメモリを併用することによって発生する一貫性制御の問題を指摘し,これを解決する並 行性制御手法を提案・評価する.

15:00
並行性制御法 Cicada と並列ログ先行書き込み法 P-WAL の結合
SPEAKER: unknown

ABSTRACT. トランザクション処理は並行性制御法とログ先行書き込み法(WAL)より構成され,並行性制御法の一つとして,Cicadaがある.Cicadaは多版法・楽観法・分散時刻印法を結合させた並行性制御法であり,現時点で世界最速と考えられる.最先端なログ永続化法として並列ログ先行書き込み法P-WALがある. 我々は並行性制御法Cicadaに並列ログ先行書き込み法P-WALを結合させることを提案し,提案手法を実験的に評価した.評価実験の結果,通常のWALはCicadaの性能を劣化させること,P-WALはCicadaへ適切に結合でき,Cicadaの性能を劣化させないことが判明した.次に,並列ログ先行書き込みのパラメータとしてclassical lock release, early lock release, グループコミットの三つから最適手法となりうる組み合わせを実験的に評価した.評価の結果,early lock releaseとグループコミットはCicadaとP-WALの結合において最適なパラメータとなることが判明した.

15:30
InvisibleWriteRule: トランザクションの書込み最適化
SPEAKER: unknown

ABSTRACT. インメモリデータベースにおいて,トランザクション処理はデータベースの主要なボトルネック要因である. トランザクション処理に用いられるロックやラッチなどのクリティカルセクションは,特にメニーコア環境においてスループット劣化の主要因となることが知られている. 先行研究では,読込み処理のクリティカルセクションを短縮した楽観的同時実行制御(OCC)のアプローチが高い処理性能を示しているが,OCCは競合等価性(CSR)を用いたアルゴリズムであることから,書込み時のクリティカルセクション改善には限界があった. 本論文では,OCCにマルチバージョン等価性(MVSR)を用いることで書込み処理を最適化する手法 InvisibleWriteRule(IWR) を提案する. また,先行研究SiloにIWRを適用したSilo+IWRを実装し,比較実験を行ったところ,YCSB Benchmarkにおいて\MaxPerf{}の性能向上が確認された.

14:30-16:00 Session 2B: Highly Efficient Applications
Location: Room 4+3
14:30
LPWA通信を利用するIoTプラットフォーム向けの電力効率を考慮したゲートウェイ配置手法の研究
SPEAKER: unknown

ABSTRACT. IoTにおける根幹技術のひとつであるワイヤレスセンサネットワーク(WSN)においては,センサノードがバッテリ駆動であるという制約からノードの省電力化が重要となる.消費電力の大きな要因はデータの通信であることが知られており,既存手法ではルーティング等を工夫することにより通信回数や距離を制御することで省電力化が図られてきた.一方,IoT 向けLPWAの無線通信規格の一つである LoRaWANでは長距離通信が可能であるため,1ホップでゲートウェイへデータを送信することができる.その際通信距離が大きくなると通信時のセンサノードの消費電力が増大する.この問題に対処するため,本稿では特にLPWA通信規格のひとつであるLoRaWANに着目し,ゲートウェイの配置場所を最適化することで,センサノードの消費電力を平準化し,センサープラットフォームの寿命を向上させる手法を提案する.

15:00
Develpment and Performance Evaluation of Configuration Interaction and Complete Active Space SCF Calculation Program by Ruby Scripting Language
SPEAKER: unknown

ABSTRACT. We are developing a prototyping environmen for learning electronic structure calculations and prototyping new research ideas by using Ruby scripting language. Corresponding to various demands of electronic structure calculations, we implemented Obara's algorithms for various kinds of molecular integral calculations, and Sasaki's tensor-recoupling algorithm based on Configuration State Function (CSF) for generating $N$-electron Hamiltonian matrix element calculations. Utilizing this module for Hamiltonian matrix element calculations, user-customized configuration interaction and complete active space self-consisten-field calculations can be implemented easily. Performance evaluation results show that our program can be utilized for prototyping and studying implementations for general quantum chemistry program at least small size molecules.

15:30
ベクトルプロセッサによるバイラテラルフィルタの高速化
SPEAKER: unknown

ABSTRACT. 本稿では,画像処理などで広く使われるバイラテラルフィルタをベクトルプロセッサを用いて 高速化する手法を提案する.本手法は,バイラテラルフィルタの高速アルゴリズムである Permutohedral Lattice をベースとしている. Permutohedral Lattice は,各画素を高次元に写像 し,リサンプリングすることで,ナイーブなアルゴリズムに比べて演算量を大幅に削減している. しかし,画像は巨大な空間にスパースに写像されるため,スパースデータの物理メモリに入りき る格納方式と大規模スパースデータへのランダムメモリアクセスの高速化が重要となる.従来手 法では,ハッシュを用いた格納方式を用いているが,衝突処理の並列化の影響により,高性能な並 列プロセッサを効率的に利用できない問題がある.提案手法では,衝突の発生しない新しい格納 方式を用いることで,ランダムアクセスが高性能なベクトルプロセッサで実装を可能とし,高速 化を実現する.本方式をベクトルプロセッサを搭載した SX-Aurora TSUBASA で実装した結果, CPU に比べて約 6.5 倍, GPU に比べて約 2.5 倍の高速化ができることが確認できた.

16:00-16:30Coffee Break
16:30-18:00 Session 3: Keynote Talk A
Location: Hitotsubashi Hall
16:30
TBD
SPEAKER: 譲 田中