CANN oam-tools运维工具集

CANN oam-tools运维工具集 AGENTS.md【免费下载链接】oam-tools本项目为开发者提供故障定位工具包含故障信息收集软硬件信息展示AI core error报错分析等能力提升故障问题定位效率文档可在昇腾社区搜索“故障处理简介”选择社区版。项目地址: https://gitcode.com/cann/oam-tools本文件为 agent 在此代码仓库中工作时提供指导。项目概述oam-toolsOperations, Administration, and Maintenance是华为 CANN 的运维工具集为开发者提供故障定位工具和性能测试调优工具。主要功能故障信息收集asys故障信息收集、软硬件信息展示、健康检查、综合检测等AI Core Error 分析msaicerrAI Core Error 问题分析、Dump 文件解析、环境检查等性能调优msprof采集和分析运行在昇腾 AI 处理器上的 AI 任务各个运行阶段的关键性能指标HCCL 性能测试hccl_test分布式训练或推理场景下测试集合通信的功能与性能构建命令基础构建# 构建项目 bash build.sh # 指定第三方库路径构建 bash build.sh --cann_3rd_lib_path${third_party_path} # 查看构建选项 bash build.sh -h执行测试# 执行所有测试用例 bash build.sh -u # 执行指定组件测试 bash build.sh -u --component msprof安装依赖# 安装 Python 依赖 pip3 install -r requirements.txt # 下载第三方库和子仓仅在网络不通时使用 python3 cmake/download_libs.py目录结构目录用途src/asys/asys 故障信息收集模块src/msaicerr/AI Core Error 分析模块src/msprof/性能调优模块src/hccl_test/HCCL 性能测试模块src/third_party/依赖的第三方库头文件cmake/构建配置scripts/辅助构建相关文件test/UT/ST 用例docs/项目文档bundle/打包相关文件.clang-format代码格式化配置开发规范gitcode pr/issue 操作.claude/skills/default-skills/SKILL.md代码风格使用 .clang-format 格式化代码遵循项目既有的代码风格Python 代码遵循 PEP 8 规范pre-commit项目已配置 pre-commit请参考 CANN 社区的 pre-commit 配置指导书安装和使用短语使用中文【免费下载链接】oam-tools本项目为开发者提供故障定位工具包含故障信息收集软硬件信息展示AI core error报错分析等能力提升故障问题定位效率文档可在昇腾社区搜索“故障处理简介”选择社区版。项目地址: https://gitcode.com/cann/oam-tools创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考