2026-05-01 12:28:59
DeepSeek V4-Pro和DeepSeek V4-Flash日前正式发布并开源,模型上下文处理长度由原有的128K显著扩展至1M,实现近10倍的容量提升,首次增加了KV Cache滑窗和压缩算法,大幅减少Attention计算和访存开销,并通过模型架构创新更好地支持了Agent和Coding场景。
华为同期宣布,昇腾一直同步支持DeepSeek系列模型,此次通过双方芯模技术紧密协同,实现昇腾超节点全系列产品支持DeepSeek-V4系列模型。昇腾950通过融合kernel和多流并行技术降低Attention计算和访存开销,大幅提升推理性能。昇腾A3超节点系列产品也全面适配,同时为便于用户快速微调,提供了基于昇腾A3集群的训练参考实现。
2026年,人工智能领域迎来多重变革浪潮。OpenClaw开源Agent(智能体)框架引爆了全民“养龙虾”的热潮,让A不再局限于简单的对话交流,逐步走进实际生产场景,发挥实用价值。随着Token(词元)经营成为行业趋势,市场对推理算力的需求呈现出指数级增长态势。同时,AI也在不断升级,从只能完成单一任务,逐步向能够自主应对复杂场景、做出自主决策的方向发展。
华为昇腾计算业务副总裁张良表示,为此,CANN开源社区明确了自身定位——做开发者可以长期信赖的坚实基础。坚持开源开放的理念,不断优化使用体验,既要把底层技术做扎实、做深厚,又要让开发者用起来更轻松、更便捷,助力每一位开发者安心成长、长期发展。
数据显示,目前,昇腾生态已经与Triton、PyTorch、vLLM等90多个主流开源社区达成深度合作。昇腾还将自身的新功能、新特性持续分享给开源社区,针对DeepSeek系列、Qwen系列等70多个全球及国产主流大模型,实现当天发布、当天适配,并完成全流程优化,真正做到开源模型“发布即能用”,让开发者能第一时间掌握最新技术,快速推进训练与推理相关的创新落地。
据了解,CANN的软硬件架构已经完成升级,整体能力大幅提升,组件实现了分层拆分,能支持上层模型、应用像插件一样灵活调用,不用受限于固定模式。同时,开发体验也同步升级,贴合行业常用习惯,其开源系统的昇腾算子编程语言,能全面兼容行业主流的算子编程框架,还配备了完整的调试、优化工具。不管是追求极致性能的资深技术专家,还是刚入门、想快速上手的开发者,都能找到适合自己的开发方式。此外,CANN社区资源也进行了升级,为开发者提供便捷的开发环境,从开发环境部署到训练、推理的全流程,都简化了操作步骤,降低了上手难度。还提供一站式开发平台,开发者可以免费使用算力,不用花费大量时间部署环境。
“昇腾也持续保障算力供应,助力开发者开展实践和持续集成工作,全年提供4000卡算力资源,确保开发者有充足的体验空间,能第一时间体验到最新技术。”张良说。