Torben Bietendüvel
Ressourceneffizientes Training von Convolutional Neural Networks auf FPGAs

Abstract
Diese Ausarbeitung vergleicht vier Ansätze für Convolutional Layer. Die Ansätze sind definiert als ein intuitiver Standard Ansatz, einer mit Matrixmultiplikationen, einer mit Toeplitzmatrizen und ein Ansatz mit Winograd. Die Umsetzungen werden auf dem FPGA Ultra96 miteinander verglichen. Dabei dient das Netz LeNet-5 als Beispiel eines Convolutional Neural Network. Anschließend werden die Ansätze in Bezug auf Ressourcenverbrauch, Geschwindigkeit und Stromverbrauch miteinander verglichen.