软件 + compiler + 硬件配置比较全,适合作为一个全流程设计参考
bash run.sh
- performance model running simulation ... 时CPU几乎没有占用,等了非常久
- 在compiler.py中官方提到了NPU前端没有MFU(数学函数单元)中非线性激活函数的软件实现等一系列架构的问题
用于存放demo , 实现的顺序如下:
- compiler + function simulator
- performance simulator
- sv + verilator / dc
- add transformer