kelixier
CUDA
CUDA软件架构
1.CUDA软件基础架构2.模型训练/推理场景下的CUDA软件架构3.CUDA线程模型3.1 线程模型图3.2 如何组织线程层级组成关系核心功能线程最小执行单元执行单一指令线程束32线程 = 1线程束GPU调度单位线程块N线程束 = 1块共享内存,块内线程协作网格M线程块 = 1网格管理全部计算任务4.CUDA内存模型4.1 内存模型图GPU内存使用内存类型物理位置作用域生命周期使用场景使用方式访问速度容量寄存器GPU核心单个线程线程生命周期线程私有变量、循环索引、临时计算结果自动分配(声明局部变量)例:int local_var = 0;★★★★★ (最快)每线程约256个本地内存显存...

最近评论