让国产TPU从“可用”走向“好用”

李治国 2026-06-02 21:55:43

在人工智能大模型高速发展的今天，算力已然成为制约产业爆发的核心瓶颈。随着全球科技巨头纷纷加码TPU（张量处理单元）技术路线，国产算力芯片如何突围？记者日前在采访中昊芯英（杭州）科技有限公司时了解到，面向未来，中昊芯英将从性能迭代、软件生态升级以及“芯模联动”三个方向推进TPU算力生态的完善。

业内人士表示，当前谷歌等全球巨头加码TPU释放了两个重要信号，一是AI已从研发期进入产业落地期，企业更关注算力的经济效率；二是定制化芯片（如TPU、DSA）将成为主流。

中昊芯英创始人、董事长杨龚轶凡认为，未来市场将分化为三类，不可编程ASIC占30%到40%，领域专用架构（DSA）占40%，通用GPU占20%。若不在未来3到5年掌握核心技术，TPU可能成为新的“卡脖子”领域，因此必须加快自主可控算力体系的建设。

记者了解到，中昊芯英创始人杨龚轶凡拥有十余年硅谷高端芯片研发设计经验。深耕行业多年，杨龚轶凡注意到到两大行业趋势：一方面，AI已然成为全球科技竞争的核心赛道，行业发展离不开专为AI计算量身打造的专用芯片；另一方面，他们预判2024至2026年将迎来AI产业全面爆发，高性能AI芯片会成为行业刚需。基于这样的判断，团队选择归国创业，正式踏上国产AI训练芯片的攻坚之路。

历时近五年，中昊芯英从零起步，完成了指令集、编译器到芯片架构的全栈自研，成功推出首款TPU架构高性能AI专用算力芯片“刹那®”。该芯片拥有完全自主可控的IP核与全自研指令集及计算平台，AI算力性能相较于海外著名GPU产品提升近1.5倍，同时能耗降低30%，单位计算成本降低近50%。2023年，“刹那®”完成流片并实现产业化落地。在软件生态方面，中昊芯英已支持DeepSeek、智谱、千问等主流大模型以及PyTorch、PaddlePaddle等开源框架。

杨龚轶凡介绍，未来，在软件生态方面，其团队将聚焦2026至2027年的大语言模型，并逐步拓展至2027至2028年的多模态领域。在先进封装领域，中昊芯英同样是积极的推动者，第一代芯片就实现了包括计算、存储、IO在内的6块不同芯片的合封，未来团队将继续探索COWOS-L及3D封装技术，以进一步提升芯片的集成度与能效。

“下一步，团队将聚焦‘好用’，通过软硬协同优化，筑牢坚实、易用的国产专用算力底座。” 杨龚轶凡表示，目前，中昊芯英已跑完“0到1”的阶段，正在进入“1到1000”的规模化发展期。未来3到5年是黄金窗口期，一方面需要完善芯片设计与Know-how积累，另一方面要推动2.5D/3D封装等生产工艺升级。AI产业的发展将反向带动我国整个半导体产业链的跃迁，预计5到10年内有望逐步缩小与国际先进水平的差距。

对于在全行业推动TPU技术发展方面，杨龚轶凡表示，首先要将TPU列为独立于GPU的算力品类；其次，TPU是资金密集型产业，需要更开放的金融环境支持其发展；第三要推动“芯模联动”，鼓励芯片与模型厂商协同创新，实现降本增效；最后，TPU作为新兴技术，更需要年轻、具创新精神的工程师，企业愿与高校合作培养复合型人才，推动产业持续发展。

从“可用”到“好用”，从“单点突破”到“生态构建”，中昊芯英正以TPU为支点，撬动国产算力的自主化进程。在AI浪潮下，通过软硬协同、产业联动，更有助于实现从“追随”到“引领”的跨越。