Skip to content

hpc 教程,包含集合通信(mpi、nccl)、cuda 编程、向量化 SIMD、RDMA 通信等

License

Notifications You must be signed in to change notification settings

jinbooooom/ai-infra-hpc

Repository files navigation

AI-Infra HPC 学习与总结

本仓库用于记录 AI-Infra 与 HPC 技术:

  • AI System 的底层技术
  • 集群多机多卡互联技术
  • 并行计算与高性能计算
  • 训练与推理

文件夹说明

各文件夹的内容如下:

├── 01 chip		# 芯片硬件
├── 02 hpc		# 高性能计算
│   ├── 01 openmp	
│   ├── 02 simd
│   └── 05 cuda		# GPU 编程
├── 03 link		# 多机多卡互联底层通信
│   ├── 01 noc		# 片上网络
│   ├── 02 pcie		# PCI-Express(peripheral component interconnect express)
│   ├── 03 topo		# 多机多卡互联以及拓扑相关
│   ├── 05 gpuDirect 	# GPU 与 Host、GPU、IB 网卡、NVMe SSD 的底层通信
│   └── 08 infiniband 	# IB 网卡与 RDMA 通信
├── 04 storage		# 存储
├── 05 ccl 		# 集合通信
│   ├── mpi 		# MPI 的使用与教程
│   └── nccl 		# NCCL 的使用、设计
├── 06 trainAndInfer 	# 训练与推理
├── 99 industryReport 	# 行业前沿报告

互联总结

GPUDirect 总结

RDMA 总结

NCCL 总结

CUDA 总结

训练与推理总结

About

hpc 教程,包含集合通信(mpi、nccl)、cuda 编程、向量化 SIMD、RDMA 通信等

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published