2026-07-01 15:36:08
2026“众智”大模型开放智算生态协同高级别研讨会日前在沪举办。中国信通院副院长魏亮发布AISHPerf人工智能软硬件基准体系3.0版本,包含两项AI Infra领域核心评测基准——AISHPerf-智算运维智能体评测基准以及AISHPerf-算子生成智能体评测基准,两大基准由国内AI原生基础设施服务商无问芯穹及清华大学团队作为重点技术支持方参与建设。
记者了解到,AISHPerf-智算运维智能体评测基准是首个面向AI Infra的运维智能体评测基准,依托百亿级真实运维数据构建,核心考核智算运维智能体在真实生产场景中解决实际问题的落地能力。AISHPerf-算子生成智能体评测基准则跳出“模型能否生成可运行GPU算子”的基础维度,将评测重心锚定在“模型生成的算子能否在真实量化推理部署中替代现有算子”的工程可部署性上,更贴合产业实际落地需求。二者从底层算力优化到上层集群运维,共同为智算产业的标准化升级与高质量发展提供了统一的能力参照框架。
AISHPerf(Performance Benchmarks of Artificial Intelligence Software and Hardware)是中国信通院与人工智能大模型及软硬件评测工业和信息化部重点实验室,依托人工智能软硬件协同创新与适配验证中心(位于国家信创园)联合构建的人工智能软硬件基准体系,旨在设置多维度指标,考察端到端方案对模型及应用场景的真实承载能力,系统评估软硬件各层级间的协同优化水平、兼容适配能力及整体交付效能。
在此次发布的两项基准中,AISHPerf-智算运维智能体评测基准尤为引人注目,它不仅标志着我国在智算集群运维智能体领域拥有了首个权威评测体系,更率先将国产芯片集群运维场景纳入评测体系、填补了国产智算运维智能体评测领域的空白,为构建自主自治的新一代“Token工厂”提供了运维领域的技术方向与标准指引。
AISHPerf-智算运维智能体评测基准正是一套锚定真实生产场景的实操型评测体系。它以无问芯穹沉淀的近百亿条真实运维数据为底座,经资深运维专家脱敏并精细标注和严格筛选,最终抽象提炼出103条高保真、高质量的典型评测用例;同时打通从底层硬件故障到用户侧软件Bug的全链路问题,构建起覆盖5大技术栈、44种问题现象、22个细分故障领域、3种难度层级、6种国内外芯片(其中5种为国产芯片)的立体化科学评测体系。
未来,中国信通院与无问芯穹、清华大学将深化产学研协同,迭代优化AISHPerf-智算运维智能体评测基准,不断扩充场景覆盖维度、丰富数据集规模、提升评测结果的可靠性与权威性,推动其成为行业公认的AI集群运维智能体能力评估公共基线,牵引全行业优质运维智能体的技术迭代与规模化落地。