-
我们默认使用分布式训练。
-
所有 pytorch 类型的预训练骨干网络都是来自 Pytorch 的模型库。
-
为了与其他代码库进行公平比较,我们以全部 8 个 GPU 的
torch.cuda.max_memory_allocated()
的最大值作为 GPU 显存使用量。请注意,此值通常小于nvidia-smi
显示的值。 -
该推理时间不包含数据加载时间,推理时间结果是通过脚本
tools/analysis/benchmark.py
获得的,该脚本计算处理 2000 张图像的平均时间。 -
速度基准测试的环境如下:
硬件环境:
- 8 NVIDIA Tesla V100 (32G) GPUs
- Intel(R) Xeon(R) Gold 6148 CPU @ 2.40GHz
软件环境:
- Python 3.7
- PyTorch 1.5
- CUDA 10.1
- CUDNN 7.6.03
- NCCL 2.4.08
详情请参考 DFF。
详情请参考 FGFA。
详情请参考 SELSA。
详情请参考 Temporal RoI Align。
详情请参考 SORT/DeepSORT。
详情请参考 Tracktor。
详情请参考 QDTrack。
详情请参考 ByteTrack。
详情请参考 OC-SORT。
详情请参考 SiameseRPN++。
详情请参考 STARK。
详情请参考 MixFormer。
详情请参考 MaskTrack R-CNN。