SOPHON-DEMO基于SOPHONSDK接口进行开发,提供一系列主流算法的移植例程。包括基于TPU-NNTC和TPU-MLIR的模型编译与量化,基于BMRuntime的推理引擎移植,以及基于BMCV/OpenCV的前后处理算法移植。
SOPHONSDK是算能科技基于其自主研发的深度学习处理器所定制的深度学习SDK,涵盖了神经网络推理阶段所需的模型优化、高效运行时支持等能力,为深度学习应用开发和部署提供易用、高效的全栈式解决方案。目前可兼容BM1684/BM1684X/BM1688(CV186X)。
SOPHON-DEMO提供的例子从易到难分为tutorial
、sample
、application
三个模块,tutorial
模块存放一些基础接口的使用示例,sample
模块存放一些经典算法在SOPHONSDK上的串行示例,application
模块存放一些典型场景的典型应用。
tutorial | 说明 |
---|---|
resize | resize接口。针对图像做缩放操作 |
crop | crop接口,从输入图片中抠出需要用的图片区域 |
crop_and_resize_padding | 将图片指定位置指定大小部分图片抠出,缩放后填充到大图中,空余部分填充指定像素数值 |
ocv_jpgbasic | 使用sophon-opencv硬件加速实现图片编解码 |
ocv_vidbasic | 使用sophon-opencv硬件加速实现视频解码,并将视频记录为png或jpg格式 |
blend | 融合拼接两张图 |
stitch | 拼接两张图片 |
avframe_ocv | avframe到cv::mat的转换例程 |
ocv_avframe | bgr mat到yuv420p avframe的转换例程 |
bm1688_2core2task_yolov5 | 使用bm1688的双核双任务推理部署的yolov5 |
sample | 算法类别 | 编程语言 | BModel |
---|---|---|---|
LPRNet | 车牌识别 | C++/Python | FP32/FP16/INT8 |
ResNet | 图像分类 | C++/Python | FP32/FP16/INT8 |
RetinaFace | 人脸检测 | C++/Python | FP32/FP16/INT8 |
SCRFD | 人脸检测 | C++/Python | FP32/FP16/INT8 |
segformer | 语义分割 | C++/Python | FP32/FP16 |
SAM | 语义分割 | Python | FP32/FP16 |
yolact | 实例分割 | C++/Python | FP32/FP16/INT8 |
YOLOv8_seg | 实例分割 | C++/Python | FP32/FP16/INT8 |
YOLOv9_seg | 实例分割 | C++/Python | FP32/FP16/INT8 |
PP-OCR | OCR | C++/Python | FP32/FP16 |
OpenPose | 人体关键点检测 | C++/Python | FP32/FP16/INT8 |
C3D | 视频动作识别 | C++/Python | FP32/FP16/INT8 |
DeepSORT | 多目标跟踪 | C++/Python | FP32/FP16/INT8 |
ByteTrack | 多目标跟踪 | C++/Python | FP32/FP16/INT8 |
CenterNet | 目标检测、姿态识别 | C++/Python | FP32/FP16/INT8 |
YOLOv5 | 目标检测 | C++/Python | FP32/FP16/INT8 |
YOLOv34 | 目标检测 | C++/Python | FP32/INT8 |
YOLOX | 目标检测 | C++/Python | FP32/INT8 |
SSD | 目标检测 | C++/Python | FP32/INT8 |
YOLOv7 | 目标检测 | C++/Python | FP32/FP16/INT8 |
YOLOv8_det | 目标检测 | C++/Python | FP32/FP16/INT8 |
YOLOv5_opt | 目标检测 | C++/Python | FP32/FP16/INT8 |
YOLOv5_fuse | 目标检测 | C++/Python | FP32/FP16/INT8 |
YOLOv9_det | 目标检测 | C++/Python | FP32/FP16/INT8 |
ppYOLOv3 | 目标检测 | C++/Python | FP32/FP16/INT8 |
ppYoloe | 目标检测 | C++/Python | FP32/FP16 |
WeNet | 语音识别 | C++/Python | FP32/FP16 |
Whisper | 语音识别 | Python | FP16 |
BERT | 语言模型 | C++/Python | FP32/FP16 |
ChatGLM2 | 语言模型 | C++/Python | FP16/INT8/INT4 |
Llama2 | 语言模型 | C++/Python | FP16/INT8/INT4 |
ChatGLM3 | 语言模型 | Python | FP16/INT8/INT4 |
Qwen | 语言模型 | Python | FP16/INT8/INT4 |
Qwen1_5 | 语言模型 | Python | FP16/INT8/INT4 |
MiniCPM | 语言模型 | C++ | INT8/INT4 |
Baichuan2 | 语言模型 | Python | INT8/INT4 |
StableDiffusionV1.5 | 图像生成 | Python | FP32/FP16 |
GroundingDINO | 多模态目标检测 | Python | FP16 |
Real-ESRGAN | 超分辨 | C++/Python | FP32/FP16/INT8 |
P2PNet | 人群计数 | C++/Python | FP32/FP16/INT8 |
CLIP | 图文生成 | Python | FP16 |
SuperGlue | 特征匹配 | C++ | FP32/FP16 |
application | 应用场景 | 编程语言 |
---|---|---|
VLPR | 多路车牌检测+识别 | C++/Python |
YOLOv5_multi | 多路目标检测 | C++ |
YOLOv5_multi_QT | 多路目标检测+QT_HDMI显示 | C++ |
版本 | 说明 |
---|---|
0.2.2 | 完善和修复文档、代码问题,部分例程补充CV186X支持,sample模块新增例程Whisper、Real-ESRGAN、SCRFD、P2PNet、MiniCPM、CLIP、SuperGlue、YOLOv5_fuse、YOLOv8_seg、YOLOv9_seg、Baichuan2等例程,tutorial模块新增avframe_ocv、ocv_avframe、bm1688_2core2task_yolov5例程。 |
0.2.1 | 完善和修复文档、代码问题,部分例程补充CV186X支持,YOLOv5适配SG2042,sample模块新增例程GroundingDINO、Qwen1_5,StableDiffusionV1_5新支持多种分辨率,Qwen、Llama2、ChatGLM3添加web和多会话模式。tutorial模块新增blend和stitch例程 |
0.2.0 | 完善和修复文档、代码问题,新增application和tutorial模块,新增例程ChatGLM3和Qwen,SAM添加web ui,BERT、ByteTrack、C3D适配BM1688,原YOLOv8更名为YOLOv8_det并且添加cpp后处理加速方法,优化常用例程的auto_test,更新TPU-MLIR安装方式为pip |
0.1.10 | 修复文档、代码问题,新增ppYoloe、YOLOv8_seg、StableDiffusionV1.5、SAM,重构yolact,CenterNet、YOLOX、YOLOv8适配BM1688,YOLOv5、ResNet、PP-OCR、DeepSORT补充BM1688性能数据,WeNet提供C++交叉编译方法 |
0.1.9 | 修复文档、代码问题,新增segformer、YOLOv7、Llama2例程,重构YOLOv34,YOLOv5、ResNet、PP-OCR、DeepSORT、LPRNet、RetinaFace、YOLOv34、WeNet适配BM1688,OpenPose后处理加速,chatglm2添加编译方法和int8/int4量化。 |
0.1.8 | 完善修复文档、代码问题,新增BERT、ppYOLOv3、ChatGLM2,重构YOLOX,PP-OCR添加beam search,OpenPose添加tpu-kernel后处理加速,更新SFTP下载方式。 |
0.1.7 | 修复文档等问题,一些例程支持BM1684 mlir,重构PP-OCR、CenterNet例程,YOLOv5添加sail支持 |
0.1.6 | 修复文档等问题,新增ByteTrack、YOLOv5_opt、WeNet例程 |
0.1.5 | 修复文档等问题,新增DeepSORT例程,重构ResNet、LPRNet例程 |
0.1.4 | 修复文档等问题,新增C3D、YOLOv8例程 |
0.1.3 | 新增OpenPose例程,重构YOLOv5例程(包括适配arm PCIe、支持TPU-MLIR编译BM1684X模型、使用ffmpeg组件替换opencv解码等) |
0.1.2 | 修复文档等问题,重构SSD相关例程,LPRNet/cpp/lprnet_bmcv使用ffmpeg组件替换opencv解码 |
0.1.1 | 修复文档等问题,使用BMNN相关类重构LPRNet/cpp/lprnet_bmcv |
0.1.0 | 提供LPRNet等10个例程,适配BM1684X(x86 PCIe、SoC),BM1684(x86 PCIe、SoC) |
SOPHON-DEMO主要依赖TPU-MLIR、TPU-NNTC、LIBSOPHON、SOPHON-FFMPEG、SOPHON-OPENCV、SOPHON-SAIL,其版本要求如下:
SOPHON-DEMO | TPU-MLIR | TPU-NNTC | LIBSOPHON | SOPHON-FFMPEG | SOPHON-OPENCV | SOPHON-SAIL | 发布日期 |
---|---|---|---|---|---|---|---|
0.2.2 | >=1.8 | >=3.1.7 | >=0.5.0 | >=0.7.3 | >=0.7.3 | >=3.7.0 | >=23.10.01 |
0.2.1 | >=1.7 | >=3.1.7 | >=0.5.0 | >=0.7.3 | >=0.7.3 | >=3.7.0 | >=23.10.01 |
0.2.0 | >=1.6 | >=3.1.7 | >=0.5.0 | >=0.7.3 | >=0.7.3 | >=3.7.0 | >=23.10.01 |
0.1.10 | >=1.2.2 | >=3.1.7 | >=0.4.6 | >=0.6.0 | >=0.6.0 | >=3.7.0 | >=23.07.01 |
0.1.9 | >=1.2.2 | >=3.1.7 | >=0.4.6 | >=0.6.0 | >=0.6.0 | >=3.7.0 | >=23.07.01 |
0.1.8 | >=1.2.2 | >=3.1.7 | >=0.4.6 | >=0.6.0 | >=0.6.0 | >=3.6.0 | >=23.07.01 |
0.1.7 | >=1.2.2 | >=3.1.7 | >=0.4.6 | >=0.6.0 | >=0.6.0 | >=3.6.0 | >=23.07.01 |
0.1.6 | >=0.9.9 | >=3.1.7 | >=0.4.6 | >=0.6.0 | >=0.6.0 | >=3.4.0 | >=23.05.01 |
0.1.5 | >=0.9.9 | >=3.1.7 | >=0.4.6 | >=0.6.0 | >=0.6.0 | >=3.4.0 | >=23.03.01 |
0.1.4 | >=0.7.1 | >=3.1.5 | >=0.4.4 | >=0.5.1 | >=0.5.1 | >=3.3.0 | >=22.12.01 |
0.1.3 | >=0.7.1 | >=3.1.5 | >=0.4.4 | >=0.5.1 | >=0.5.1 | >=3.3.0 | - |
0.1.2 | Not support | >=3.1.4 | >=0.4.3 | >=0.5.0 | >=0.5.0 | >=3.2.0 | - |
0.1.1 | Not support | >=3.1.3 | >=0.4.2 | >=0.4.0 | >=0.4.0 | >=3.1.0 | - |
0.1.0 | Not support | >=3.1.3 | >=0.3.0 | >=0.2.4 | >=0.2.4 | >=3.1.0 | - |
注意:
- 不同例程对版本的要求可能存在差异,具体以例程的README为准,可能需要安装其他第三方库。
- BM1688/CV186X与BM1684X/BM1684对应的sdk不是同一套,在官网上已作区分,请注意。
请通过算能官网技术资料获取相关文档、资料及视频教程。
算能社区鼓励开发者多交流,共学习。开发者可以通过以下渠道进行交流和学习。
算能社区网站:https://www.sophgo.com/
算能开发者论坛:https://developer.sophgo.com/forum/index.html
欢迎参与贡献。更多详情,请参阅我们的贡献者Wiki。