让国产TPU从“可用”走向“好用”

李治国 2026-06-02 21:55:43

在人工智能大模型高速发展的今天,算力已然成为制约产业爆发的核心瓶颈。随着全球科技巨头纷纷加码TPU(张量处理单元)技术路线,国产算力芯片如何突围?记者日前在采访中昊芯英(杭州)科技有限公司时了解到,面向未来,中昊芯英将从性能迭代、软件生态升级以及“芯模联动”三个方向推进TPU算力生态的完善。

业内人士表示,当前谷歌等全球巨头加码TPU释放了两个重要信号,一是AI已从研发期进入产业落地期,企业更关注算力的经济效率;二是定制化芯片(如TPU、DSA)将成为主流。

中昊芯英创始人、董事长杨龚轶凡认为,未来市场将分化为三类,不可编程ASIC占30%到40%,领域专用架构(DSA)占40%,通用GPU占20%。若不在未来3到5年掌握核心技术,TPU可能成为新的“卡脖子”领域,因此必须加快自主可控算力体系的建设。

记者了解到,中昊芯英创始人杨龚轶凡拥有十余年硅谷高端芯片研发设计经验。深耕行业多年,杨龚轶凡注意到到两大行业趋势:一方面,AI已然成为全球科技竞争的核心赛道,行业发展离不开专为AI计算量身打造的专用芯片;另一方面,他们预判2024至2026年将迎来AI产业全面爆发,高性能AI芯片会成为行业刚需。基于这样的判断,团队选择归国创业,正式踏上国产AI训练芯片的攻坚之路。

历时近五年,中昊芯英从零起步,完成了指令集、编译器到芯片架构的全栈自研,成功推出首款TPU架构高性能AI专用算力芯片“刹那®”。该芯片拥有完全自主可控的IP核与全自研指令集及计算平台,AI算力性能相较于海外著名GPU产品提升近1.5倍,同时能耗降低30%,单位计算成本降低近50%。2023年,“刹那®”完成流片并实现产业化落地。在软件生态方面,中昊芯英已支持DeepSeek、智谱、千问等主流大模型以及PyTorch、PaddlePaddle等开源框架。

杨龚轶凡介绍,未来,在软件生态方面,其团队将聚焦2026至2027年的大语言模型,并逐步拓展至2027至2028年的多模态领域。在先进封装领域,中昊芯英同样是积极的推动者,第一代芯片就实现了包括计算、存储、IO在内的6块不同芯片的合封,未来团队将继续探索COWOS-L及3D封装技术,以进一步提升芯片的集成度与能效。

“下一步,团队将聚焦‘好用’,通过软硬协同优化,筑牢坚实、易用的国产专用算力底座。” 杨龚轶凡表示,目前,中昊芯英已跑完“0到1”的阶段,正在进入“1到1000”的规模化发展期。未来3到5年是黄金窗口期,一方面需要完善芯片设计与Know-how积累,另一方面要推动2.5D/3D封装等生产工艺升级。AI产业的发展将反向带动我国整个半导体产业链的跃迁,预计5到10年内有望逐步缩小与国际先进水平的差距。

对于在全行业推动TPU技术发展方面,杨龚轶凡表示,首先要将TPU列为独立于GPU的算力品类;其次,TPU是资金密集型产业,需要更开放的金融环境支持其发展;第三要推动“芯模联动”,鼓励芯片与模型厂商协同创新,实现降本增效;最后,TPU作为新兴技术,更需要年轻、具创新精神的工程师,企业愿与高校合作培养复合型人才,推动产业持续发展。

从“可用”到“好用”,从“单点突破”到“生态构建”,中昊芯英正以TPU为支点,撬动国产算力的自主化进程。在AI浪潮下,通过软硬协同、产业联动,更有助于实现从“追随”到“引领”的跨越。