FPGA 2017: Program

Wednesday February 22 (All Technical Sessions in San Carlos 2-4)

Int'l Workshop on Overlay Architectures for FPGAs (OLAF)
Chair: Hayden So, The University of Hong Kong
Co-Chair: John Wawryznek, UC Berkeley

9:00 - 9:10

Welcome and Opening Remarks
John Wawrzynek (UC Berkeley)

9:10 - 12:00

Paper Presentations (http://olaf.eecs.berkeley.edu/program)

12:00 - 1:30

Lunch (Ferrantes Room, 10th Floor)

Afternoon Special Session: The Role of FPGAs in Machine Learning
Chair: Andrew Ling, Intel

1:30 - 2:30

Deep Learning -- Tutorial and Recent Trends [slides]
Song Han (Stanford and DeePhi)

2:30 - 3:00

Can FPGAs Beat GPUs in Accelerating Next-Generation Deep Neural Networks? [slides]
Eriko Nurvitadhi, Ganesh Venkatesh, Jaewoong Sim, Debbie Marr, Randy Huang, Jason Gee Hock Ong, Yeong Tat Liew, Srivatsan Krishnan, Duncan Moss, Suchit Subhaschandra, Guy Boudoukh
Intel

3:00 - 3:30

Break

3:30 - 3:55

Accelerating Binarized Convolutional Neural Networks with Software-Programmable FPGAs [slides]
Ritchie Zhao¹, Weinan Song¹, Wentao Zhang¹, Tianwei Xing², Jeng-Hau Lin³, Mani Srivastava², Rajesh Gupta³, Zhiru Zhang¹
¹Cornell University, ²UCLA, ³UCSD

3:55 - 4:20

Improving the Performance of OpenCL-based FPGA Accelerator for Convolutional Neural Network [slides]
Jialiang Zhang and Jing Li
UW-Madison

4:20 - 4:45

Frequency Domain Acceleration of Convolutional Neural Networks on CPU-FPGA Shared Memory System [slides]
Chi Zhang and Viktor Prasanna
USC

4:45 - 5:10

Optimizing Loop Operation and Dataflow in FPGA Acceleration of Deep Convolutional Neural Networks [slides]
Yufei Ma, Yu Cao, Sarma Vrudhula, Jae-sun Seo
Arizona State University

7:00	Opening Reception (Ferrantes Room, 10th Floor)

Thursday February 23 (All Technical Sessions in San Carlos 2-4)

8:00	Continental Breakfast

8:45 - 9:00

Welcome and Opening Remarks
Jason Anderson (University of Toronto), Jonathan Greene (Microsemi)

Machine Learning
Chair: Jason Cong, UCLA

9:00 - 9:25

An OpenCL Deep Learning Accelerator on Arria 10 (Best Paper Candidate)
Utku Aydonat, Shane O'Connell, Davor Capalija, Andrew Ling, Gordon Chiu
Intel

9:25 - 9:50

FINN: A Framework for Fast, Scalable Binarized Neural Network Inference [slides]
Yaman Umuroglu^1,2, Nicholas J. Fraser^1,3, Giulio Gambardella¹, Michaela Blott¹, Philip Leong³, Magnus Jahre², Kees Vissers¹
¹Xilinx Research Labs, ²Norwegian University of Science and Technology, ³University of Sydney

9:50 - 10:15

ESE: Efficient Speech Recognition Engine with Sparse LSTM on FPGA (Best Paper Award) [slides]
Song Han¹, Junlong Kang², Huizi Mao¹, Yiming Hu³, Xin Li², Yubin Li², Dongliang Xie², Hong Luo², Song Yao², Yu Wang³, Huazhong Yang³, Bill Dally¹
¹Stanford University, ²DeePhi, ³Tsinghua University

10:15 - 11:15

Poster Session 1 and Break (San Carlos 1)

Interconnect and Routing
Chair: Sinan Kaptanoglu, Microsemi

11:15 - 11:40

Quality-Time Tradeoffs in Component-Specific Mapping [slides]
Hans Giesen¹, Raphael Rubin¹, Benjamin Gojman², Andre DeHon¹
¹University of Pennsylvania, ²Google

11:40 - 12:05

Synchronization Constraints for Interconnect Synthesis [slides]
Alex Rodionov and Jonathan Rose
University of Toronto

12:05 - 12:30

Corolla: GPU-Accelerated FPGA Routing Based on Subgraph Dynamic Expansion [slides]
Minghua Shen and Guojie Luo
Peking University

12:30 - 2:00

Lunch (Ferrantes Room, 10th Floor)

Architecture
Chair: Steve Wilton, University of British Columbia

2:00 - 2:25

Don't Forget the Memory: Automatic Block RAM Modelling, Optimization, and Architecture Exploration (Best Paper Candidate) [slides]
Sadegh Yazdanshenas, Kosuke Tatsumura, Vaughn Betz
University of Toronto

2:25 - 2:50

Automatic Construction of Program-Optimized FPGA Memory Networks [slides]
Hsin-Jung Yang¹, Kermin Fleming², Felix Winterstein³, Annie Chen¹, Michael Adler⁴, Joel Emer¹
¹MIT, ²Intel, ³Imperial College London, ⁴Intel Corporation

2:50 - 2:55

NAND-NOR: A Compact, Fast, and Delay Balanced FPGA Logic Element [slides]
Zhihong Huang¹, Xing Wei¹, Grace Zgheib², Wei Li¹, Yu Lin¹, Zhenghong Jiang¹, Kaihui Tu¹, Paolo Ienne², Haigang Yang¹
¹Chinese Academy of Sciences, ²EPFL

2:55 - 3:00

120-core microAptiv MIPS Overlay for the Terasic DE5-NET FPGA board [slides]
Nachiket Kapre¹, Prashanth Ravi², Gourav Modi², Chethan Kumar H B²
¹University of Waterloo, ²Nanyang Technological University

3:00 - 4:00

Poster Session 2 and Break (San Carlos 1)

CAD Tools
Chair: Lesley Shannon, Simon Fraser University

4:00 - 4:25

A Parallelized Iterative Improvement Approach to Area Optimization for LUT-Based Technology Mapping (Best Paper Candidate) [slides]
Gai Liu and Zhiru Zhang
Cornell University

4:25 - 4:50

A Parallel Bandit-Based Approach for Autotuning FPGA Compilation [slides]
Chang Xu¹, Gai Liu², Ritchie Zhao², Stephen Yang³, Guojie Luo¹, Zhiru Zhang²
¹Peking University, ²Cornell University, ³Xilinx

6:30 - 9:30

Banquet (San Carlos 2-4)

7:45 - 9:00

Panel: FPGAs in the Cloud
Chair: George Constantinides, Imperial College London
Panelists: Andrew Putnam (Microsoft, USA), Wei Qi (Baidu, China), Gaurav Singh (Xilinx, USA), Mark Shand (Waymo, USA), Ling Shao (IBM Research, China), Richard Veitch (Maxeler, USA)

Friday February 24 (All Technical Sessions in San Carlos 2-4)

8:00	Continental Breakfast

High-Level Synthesis -- Tools and Applications
Chair: Stephen Neuendorffer, Xilinx

9:00 - 9:25

Hardware Synthesis of Weakly Consistent C Concurrency
Nadesh Ramanathan, Shane Fleming, John Wickerson, George Constantinides
Imperial College London

9:25 - 9:50

A New Approach to Automatic Memory Banking using Trace-Based Address Mining [slides]
Yuan Zhou, Khalid Al-Hawaj, Zhiru Zhang
Cornell University

9:50 - 9:55

Dynamic Hazard Resolution for Pipelining Irregular Loops in High-Level Synthesis [slides]
Steve Dai¹, Ritchie Zhao¹, Gai Liu¹, Shreesha Srinath¹, Udit Gupta², Christopher Batten¹, Zhiru Zhang¹
¹Cornell University, ²Harvard University

9:55 - 10:00

Accelerating Face Detection on Programmable SoC Using C-Based Synthesis [slides]
Nitish Srivastava¹, Steve Dai¹, Rajit Manohar², Zhiru Zhang¹
¹Cornell University, ²Cornell NYC Tech

10:00 - 10:05

Packet Matching on FPGAs Using HMC Memory: Towards One Million Rules [slides]
Daniel Rozhko, Geoffrey Elliott, Daniel Ly-Ma, Paul Chow, Hans-Arno Jacobsen
University of Toronto

10:05 - 11:00

Poster Session 3 and Break (San Carlos 1)

Graph Processing Applications
Chair: Nachiket Kapre, University of Waterloo

11:00 - 11:25

Boosting the Performance of FPGA-based Graph Processor using Hybrid using Hybrid Memory Cube: A Case for Breadth First Search [slides]
Jialiang Zhang, Soroosh Khoram, Jing Li
UW-Madison

11:25 - 11:50

ForeGraph: Exploring Large-scale Graph Processing on Multi-FPGA Architecture [slides]
Guohao Dai¹, Tianhao Huang¹, Yuze Chi², Ningyi Xu³, Yu Wang¹, Huazhong Yang¹
¹Tsinghua University, ²UCLA, ³Microsoft Research Asia

11:50 - 12:15

FPGA-Accelerated Transactional Execution of Graph Workloads [slides]
Xiaoyu Ma¹, Dan Zhang¹, Derek Chiou^1,2
¹University of Texas at Austin, ²Microsoft

12:15 - 2:00

Lunch (Ferrantes Room, 10th Floor)

Virtualization and Applications
Chair: John Lockwood, Algo-Logic Systems

2:00 - 2:25

Enabling Flexible Network FPGA Clusters in a Heterogenous Cloud Data Center [slides]
Naif Tarafdar, Thomas Lin, Eric Fukuda, Hadi Bannazadeh, Alberto Leon-Garcia, Paul Chow
University of Toronto

2:25 - 2:50

Energy Efficient Scientific Computing on FPGAs using OpenCL
Dennis Weller¹, Fabian Oboril¹, Dimitar Lukarski², Juergen Becker¹, Mehdi Tahoori¹
¹Karlsruhe Instistute of Technology, ²PARALUTION Labs

2:50 - 3:15

Secure Function Evaluation using an FPGA Overlay Architecture [slides]
Xin Fang, Stratis Ioannidis, Miriam Leeser
Northeastern University

3:15 - 3:45

Break

Applications
Chair: Miriam Leeser, Northeastern University

3:45 - 4:10

FPGA Acceleration for Computational Glass-Free Displays [slides]
Zhuolun He and Guojie Luo
Peking University

4:10 - 4:35

Hardware Acceleration of the Pair-HMM Algorithm for DNA Variant Calling [slides]
Sitao Huang¹, Gowthami Jayashri Manikandan¹, Anand Ramachandran¹, Kyle Rupnow², Wen-mei W. Hwu¹, Deming Chen¹
¹University of Illinois at Urbana-Champaign, ²Advanced Digital Sciences Center

4:35 - 4:45

Conference Closing and Best Paper Award
Jason Anderson (University of Toronto), Jonathan Greene (Microsemi)

Poster Session 1

Measuring the Power-Constrained Performance and Energy Gap between FPGAs and Processors
Andy Ye¹ and Karthik Ganesan²
¹Ryerson University, ²University of Toronto

A Mixed-Signal Data-Centric Reconfigurable Architecture enabled by RRAM Technology
Yue Zha¹, Jialiang Zhang¹, Zhiqiang Wei², Jing Li¹
¹UW-Madison, ²Panasonic

A Framework for Iterative Stencil Algorithm Synthesis on FPGAs from OpenCL Programming Model
Shuo Wang and Yun Liang
Peking University

Scala Based FPGA Design Flow
Yanqiang Liu¹, Yao Li¹, Weilun Xiong¹, Meng Lai¹, Cheng Chen², Zhengwei Qi¹, Haibing Guan¹
¹Shanghai JiaoTong University, ²Morgan Stanley

Thermal Flattening in 3D FPGAs using Embedded Cooling
Girish Deshpande and Dinesh Bhatia
UT-Dallas

A Machine Learning Framework for FPGA Placement
Gary Grewal, Shawki Areibi, Matthew Westrik, Ziad Abuowaimer, Betty Zhao
University of Guelph

Precise Coincidence Detection on FPGAs: Three Case Studies
Ralf Salomon and Ralf Joost
University of Rostock

DTP: Enabling Exhaustive Exploration of FPGA Temporal Partitions for Streaming HPC Applications
Mostafa Koraei¹, Magnus Jahre², S.Omid Fatemi¹
¹University of Tehran, ²Norwegian University of Science and Technology

Accurate and Efficient Hyperbolic Tangent Activation Function on FPGA using the DCT Interpolation Filter
Ahmed Abdelsalam, Pierre Langlois, Farida Cheriet
École Polytechnique de Montréal

An FPGA Overlay Architecture for Cost Effective Regular Expression Search
Thomas Luinaud, J.M. Pierre Langlois, Yvon Savaria
École Polytechnique de Montréal

Storage-Efficient Batching for Minimizing Bandwidth of Fully-Connected Neural Network Layers
Yongming Shen, Michael Ferdman, Peter Milder
Stony Brook University

Poster Session 2

Using Vivado-HLS for Structural Design: a NoC Case Study
Zhipeng Zhao and James C. Hoe
CMU

Automatic Generation of Hardware Sandboxes for Trojan Mitigation in Systems on Chip
Christophe Bobda¹, Taylor Whitaker¹, Charles Kamhoua², Kevin Kwiat², Laurent Njilla²
¹University of Arkansas, ²Air Force Research Lab

Accelerating Financial Market Server through Hybrid List Design
Haohuan Fu¹, Conghui He¹, Huabin Ruan¹, Itay Greenspon², Wayne Luk³, Yongkang Zheng⁴, Junfeng Liao¹, Qing Zhang⁴, Guangwen Yang¹
¹Tsinghua University, ²Maxeler Technologies, ³Imperial College London, ⁴China Financial Futures Exchange

Joint Modulo Scheduling and Memory Partitioning with Multi-Bank Memory for High-Level Synthesis
Tianyi Lu, Shouyi Yin, Xianqing Yao, Zhicong Xie, Leibo Liu, Shaojun Wei
Tsinghua University

A Batch Normalization Free Binarized Convolutional Deep Neural Network on an FPGA
hiroki nakahara¹, Haruyoshi Yonekawa¹, Hisashi Iwamoto², Masato Motomura³
¹Tokyo Institute of Technology, ²Poco a Poco Networks, ³Hokkaido University

A 7.663-TOPS 8.2-W Energy-efficient FPGA Accelerator for Binary Convolutional Neural Networks
Yixing Li¹, Zichuan Liu², Kai Xu¹, Fengbo Ren¹, Hao Yu²
¹Arizona State University, ²Nanyang Technological University

CPU-FPGA Co-Optimization for Big Data Applications: A Case Study of In-Memory Samtool Sorting
Jason Cong¹, Zhenman Fang¹, Muhuan Huang², Libo Wang¹, Di Wu¹
¹UCLA, ²University of California, Los Angeles

Stochastic-Based Multi-stage Streaming Realization of a Deep Convolutional Neural Network
Mingjie Lin¹ and Mohammed Alawad²
¹University of Central Florida, ²UCF

fpgaConvNet: Automated Mapping of Convolutional Neural Networks on FPGAs
Stylianos Venieris and Christos Bouganis
Imperial College London

Poster Session 3

FPGA-based Hardware Accelerator for Image Reconstruction in Magnetic Resonance Imaging
Emanuele Pezzotti¹, Alex Iacobucci¹, Gregory Nash², Umer Cheema¹, Paolo Vinella¹, Rashid Ansari¹
¹University of Illinois at Chicago, ²University of Illinois at Chicago, Altera

ASAP: Accelerated Short Read Alignment on Programmable Hardware
Subho Banerjee, Mohamed El Hadedy, Jong Bin Lim, Daniel Chen, Zbigniew T. Kalbarczyk, Deming Chen, Ravishankar K. Iyer
UIUC

RxRE: Throughput Optimization for High-Level Synthesis using Resource-Aware Regularity Extraction
Atieh Lotfi and Rajesh Gupta
UCSD

GRT 2.0: An FPGA-based SDR Platform for Cognitive Radio Networks
Haoyang Wu¹, Tao Wang¹, Zhiwei Li¹, Boyan Ding¹, Xiaoguang Li¹, Tianfu Jiang¹, Jun Liu¹, Songwu Lu²
¹Peking University, ²UCLA

FPGA Implementation of Non-Uniform DFT for Accelerating Wireless Channel Simulations
Srinivas Siripurapu¹, Aman Gayasen², Nitin Chandrachoodan¹, Padmini Gopalakrishnan²
¹IIT Madras, ²Xilinx

Learning Convolutional Neural Networks for Data-Flow Graph Mapping on Spatial Programmable Architectures
Shouyi Yin, Dajiang Liu, Lifeng Sun, Xinhan Lin, Leibo Liu, Shaojun Wei
Tsinghua University

Cache Timing Attacks from The SoCFPGA Coherency Port
Sumanta Chaudhuri
Telecom ParisTech

Dynamic Partitioning for Library based Placement on Heterogeneous FPGAs
Fubing Mao¹, Wei Zhang², Bingsheng He³, Siew Kei Lam¹
¹Nanyang Technological University, ²Hong Kong University of Science and Technology, ³National University of Singapore

An Energy-Efﬁcient Design-Time Scheduler for FPGAs Leveraging Dynamic Frequency Scaling Emulation
Wei Ting Loke¹ and Chin Yang Koay²
¹National University of Singapore, ²Xilinx Asia Pacific