ROCr 测试集 (rocrtst) 全流程实战系列专栏目录

ROCr 测试集 (rocrtst) 全流程实战系列专栏目录 面向新人的 rocrtst 学习与实践指南。文档目录第一部分入门基础01-概述与架构ROCr Runtime 简介与 rocrtst 的定位测试集整体架构目录结构、模块划分与 HSA 规范的关系核心概念Agent、Queue、Signal、Memory02-环境搭建硬件要求支持的 AMD GPU 型号软件依赖安装ROCm、hwloc、libnuma、yaml-cpp 等环境变量配置ROCM_DEV_PREFIX、LD_LIBRARY_PATH验证环境是否就绪03-构建指南快速构建build_test.sh 一键构建手动构建详解cmake 参数逐项说明GPU Kernel 编译.cl → .hsaco 流程调试版本构建ROCRTST_BLD_TYPEdebug常见构建错误与排查04-运行第一个测试运行前检查清单运行全部测试使用 gtest_filter 筛选运行查看测试结果与日志输出rocrtst 专用参数详解-i, -v, -m第二部分测试套件详解05-功能测试详解功能测试概览functional/ 目录内存管理类测试memory_basic / memory_allocation / memory_access / memory_alignmentmemory_atomics / metadata_prefetchsvm_memory / virtual_memory队列与信号类测试counted_queues / aql_barrier_bitsignal_kernel / signal_concurrentAgent 与设备类测试agent_props / filter_devices / cu_masking / cuid生命周期类测试concurrent_init / concurrent_shutdown / reference_count其他功能测试ipc / debug_basic / gpu_coredump / deallocation_notifier06-性能测试详解性能测试概览performance/ 目录dispatch_time分发延迟测量方法enqueueLatency入队延迟分析memory_async_copy 系列异步拷贝带宽测试性能数据解读与基线对比07-负面测试与压力测试详解负面测试negative/异常输入与边界条件压力测试stress/并发与长时间运行场景如何判断测试是否符合预期失败第三部分开发实践08-新增测试用例指南测试用例代码结构.h .cc 模式继承 BaseRocR 测试类注册测试到 test_common编写 GPU Kernel.cl 文件添加到 CMakeLists.txt完整示例从零新增一个测试09-调试技巧GDB 调试 rocrtstsudo-gdb 方式使用 gdbserver 远程调试日志与 verbosity 级别活用GPU hang 时的排查方法常用环境变量HSA_DEBUG, HSA_ENABLE_SDMA 等10-Samples 独立示例samples/ 目录各示例介绍rocm_async异步内存拷贝工具rocrinfo系统信息查询ipc进程间通信示例各示例的构建与运行附录A-术语表HSA / ROCr / Agent / Queue / Signal / AQL / SVM / CU 等术语解释B-常见问题 FAQ构建失败排查运行时权限问题Kernel 找不到的解决方法特定 GPU 不支持某些测试测试超时处理C-参考资料HSA Runtime 规范链接ROCm 官方文档rocrtst 源码中的 README相关内核驱动文档