再升级!沐曦股份 GPU 接入华佗开源生态!

再升级!沐曦股份 GPU 接入华佗开源生态! 沐曦股份开源生态介绍沐曦深度融入全球开源社区成为vLLM官方支持的中国GPU厂商与红帽联合推出MXAIE优化方案实现对龙蜥、OpenCloudOS、麒麟、RHEL等主流OS的适配并深度参与vLLM、PaddlePaddle、OpenXLA、BigDL等上游项目确保主流框架和大模型的“Day 0”级支持。截至2025年底已发布30余个开源项目MXMACA用户超25万支持超4500个模型“即插即用”。通过技术赛事、高校推广及算力服务平台建设沐曦正加速构建覆盖开发者、产业与科研的开放生态目标是铸就AI时代的“Android式”开放共赢算力基础。HUATUO 华佗HUATUO华佗是由滴滴开源并依托 CCF 中国计算机学会孵化的操作系统深度观测项目专注为云原生通用计算AI 计算云服务基础服务等提供操作系统内核级深度观测能力《滴滴操作系统可观测 HUATUO 项目正式入驻 CCF》。适配介绍HUATUO 通过调用 MetaX libmxsml 获取实时的 GPU 数据在开启了 MetaX GPU 监控后可以在华佗中查询到 GPU 相关的数据如1. GPU 基础信息如 GPU 型号、GPU 标识、驱动版本等 2. GPU 状态如 GPU 功耗、温度、利用率、时钟频率等 3. GPU 通信如 PCIe 速度、带宽MetaXLink 速度、带宽等这些数据可以帮助我们更加清晰地定位生产环境中的各种问题。有关指标的详细说明请见后续的指标介绍章节。如果想要启用 MetaX GPU 的监控需要将以下内容挂载到容器中的对应位置1. /opt/maca:/opt/maca 2. /opt/mxdriver:/opt/mxdriver 3. /dev/dri:/dev/driDocker 容器的启动命令为docker run --privileged --cgroupnshost --networkhost -v /sys:/sys -v /proc:/proc -v /run:/run -v /opt/maca:/opt/maca -v /opt/mxdriver:/opt/mxdriver -v /dev/dri:/dev/dri huatuo/huatuo-bamai:latest如果是在 K8s 中使用则创建相应的 PV 与 PVC 即可。在容器启动完毕后访问其服务地址的/metricsendpoint如果输出中包含带有 metax 字样的指标则成功采集了 GPU 数据。指标介绍说明1. GPU indexGPU 的索引根据 GPU 模式的不同有所区分 - Native 模式和 VF 模式的 GPU 索引从 0 开始。 - PF 模式的 GPU 索引从 100 开始。 2. CECorrectable Errors, 可纠正错误 3. UEUncorrectable Errors, 不可纠正错误 4. MetaXLinkMetaXLink 是用于 GPU 间通信的专有互联技术。每块 GPU 可拥有多条 MetaXLink 连接 索引从 1 开始。结语开源正成为连接技术创新与产业升级的关键纽带。在政策引领、产业协同与生态共建的合力推动下开源创新高地正加速构筑。面向未来沐曦股份将持续以开源为桥梁与产业各方同心共策、聚力共建、携手共赢夯实AI时代的算力底座与软件基础设施为中国数字经济的高质量发展注入澎湃动能。Pull request:https://github.com/ccfos/huatuo/pull/133