RISC-V Technical Session | Vectorization & Matrix Multiplication Extensions to Speed-up Convolution

  Переглядів 572

RISC-V International

RISC-V International

2 місяці тому

Convolution is one of the most computationally intensive operations in CNN. A traditional approach to computing convolutions is known as the Im2col + BLAS method. This presentation talks about SConv: a direct-convolution algorithm based on an MLIR/LLVM code-generation toolchain that uses Vectorization and Matrix Multiplication ISA extensions to improve convolution performance, surpassing Img2col + BLAS on Intel x86 and IBM POWER10. We also describe a vector-based convolution packing routine that reduces total packing time, on full model inference, of 2.0x -- 3.9x on Intel x86 and 3.6x -- 7.2x on IBM POWER10. SConv convolution speedup, over an Im2col + BLAS method based on current BLAS implementations, is 12% -- 27% on Intel x86 and 26% -- 46% on IBM POWER10. The final speed-up for end-to-end machine-learning model inference ranges from 9% -- 25% for Intel x86 and 10% -- 42% for IBM POWER10 architectures. At the end of the talk, we lay out a plan to port SConv for RISC-V architectures.
Presenter: Guido Araújo, Full Professor of Computer Science and Engineering with University of Campinas, Brazil.

КОМЕНТАРІ
How I'd Learn AI in 2024 (if I could start over)
17:55
Dave Ebbelaar
Переглядів 711 тис.
Повістки у Києві: «Яке право вони мають забирати всіх мужиків?» #війна #мобілізація #військові
00:41
Слідство.Інфо | Розслідування, репортажі, викриття
Переглядів 1,7 млн
Teenagers Show Kindness by Repairing Grandmother's Old Fence #shorts
00:37
Fabiosa Best Lifehacks
Переглядів 25 млн
What is Convolutional Neural Network (CNN) | CNN Intution
27:10
CampusX
Переглядів 58 тис.
Building High-Performance RISC-V Cores for Everything
19:01
TechTechPotato
Переглядів 97 тис.
Inside a Neural Network - Computerphile
15:42
Computerphile
Переглядів 424 тис.
Convolutional Neural Networks from Scratch | In Depth
12:56
far1din
Переглядів 49 тис.
The ARM chip race is getting wild… Apple M4 unveiled
4:07
Fireship
Переглядів 526 тис.
Verifying A RISC-V Processor
15:10
Semiconductor Engineering
Переглядів 2,4 тис.
Опасная флешка 🤯
0:22
FATA MORGANA
Переглядів 769 тис.
НЕ ПОКУПАЙТЕ НОВЫЙ СМАРТФОН, ПОКА НЕ ВЫШЕЛ ЭТОТ [2024]
13:25
Thebox - о технике и гаджетах
Переглядів 80 тис.
The ARM chip race is getting wild… Apple M4 unveiled
4:07
Fireship
Переглядів 503 тис.
Лучший Смартфон До 149 Баксов!!!??? itel s24
20:25
РасПаковка ДваПаковка
Переглядів 45 тис.