Torben Bietendüvel
Ressourceneffizientes Training von Convolutional Neural Networks auf FPGAs
Abstract
Diese Ausarbeitung vergleicht vier Ansätze für Convolutional Layer. Die Ansätze sind
definiert als ein intuitiver Standard Ansatz, einer mit Matrixmultiplikationen, einer
mit Toeplitzmatrizen und ein Ansatz mit Winograd. Die Umsetzungen werden auf
dem FPGA Ultra96 miteinander verglichen. Dabei dient das Netz LeNet-5 als Beispiel
eines Convolutional Neural Network. Anschließend werden die Ansätze in Bezug auf
Ressourcenverbrauch, Geschwindigkeit und Stromverbrauch miteinander verglichen.