Software Design 2021年4月号掲載の「ディープラーニングではじめるソフトウェア高速化入門 第6回」のサンプルコードです。
- Ubuntu 18.04 LTS
- CUDA Toolkit 10.0
各サブディレクトリ中で make
コマンドを実行することで対応するプログラムがビルドされます。
- 愚直に実装されたGPU版行列積です。
- 行列サイズはコマンドライン引数として指定します。
./matmul 2048
- レジスタブロッキングを行ったGPU版行列積です。
- 行列サイズはコマンドライン引数として指定します。
./matmul 2048
- cuBLASを利用したGPU版行列積です。
- 行列サイズはコマンドライン引数として指定します。
./matmul 2048
- 平櫛 貴章 (株式会社フィックスターズ)
- Apache License 2.0