kelixier
CUDA
并行计算的理解与分析
特征循环分解 (Loop)派生汇聚 (Fork-Join)分条/分块 (Data Slicing/Tiling)分治 (Divide and Conquer)核心划分对象循环迭代任务(Task)数据(数组/矩阵)问题实例并行粒度迭代/迭代块任务数据块上的计算子问题依赖关系严格限制:要求迭代间数据独立可管理:支持任务间依赖(通过DAG)需处理:数据块边界访问需通信严格要求:子问题必须相互独立负载均衡均匀负载时好;不均时需动态调度优秀(工作窃取)均匀数据/计算时好;不均时挑战大依赖子问题规模均匀性;工作窃取有帮助动态性通常静态或半静态调度高度动态:任务可运行时生成通常静态分配递归结构,运行时...
最近评论