CANN/pyasc矩阵乘法迭代方法

CANN/pyasc矩阵乘法迭代方法 asc.language.adv.Matmul.iterate【免费下载链接】pyasc本项目为Python用户提供算子编程接口支持在昇腾AI处理器上加速计算接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyascMatmul.iterate(en_partial_sum: bool False, sync: bool True, local_c_matrix: BaseTensor | None None) → MatmulIterator每调用一次Iterate会计算出一块baseM * baseN的C矩阵。对应的Ascend C函数原型template bool sync true __aicore__ inline bool Iterate(bool enPartialSum false)template bool sync true, typename T __aicore__ inline bool Iterate(bool enPartialSum, const LocalTensorT localCmatrix)参数说明en_partial_sum: 是否将矩阵乘的结果累加于现有的CO1数据默认值为false。sync: 设置同步或者异步模式。local_c_matrix: 由用户申请的CO1上的LocalTensor内存用于存放矩阵乘的计算结果。约束说明当使能MixDualMaster双主模式场景时即模板参数enableMixDualMaster设置为true不支持使用该接口。对于用户自主管理CO1的iterate函数创建Matmul对象时必须定义C矩阵的内存逻辑位置为TPosition::CO1、数据排布格式为CubeFormat::NZ、数据类型为float或int32_t。调用示例# 同步模式样例 while mm.iterate() as count: mm.get_tensor_c(tensorub_cmatrix) # 异步模式样例 mm.iterate(syncFalse) # 其他操作 for i in range(single_m // base_m * single_n // base_n): mm.get_tensor_c(tensorub_cmatrix, syncFalse)【免费下载链接】pyasc本项目为Python用户提供算子编程接口支持在昇腾AI处理器上加速计算接口与Ascend C一一对应并遵守Python原生语法。项目地址: https://gitcode.com/cann/pyasc创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考