商汤科技升级“日日新5.0”大模型

李治国 2024-04-24 17:55:27

商汤科技日前发布行业首个“云、端、边”全栈大模型产品矩阵,以满足不同规模场景的应用需求,并且全新升级“日日新SenseNova 5.0”(以下简称:“日日新5.0”)大模型体系。推动自身大模型研发的同时,商汤科技也为行业伙伴提供大模型训练、微调、部署和各类生成式AI的能力及服务。

商汤科技董事长兼CEO徐立表示:“商汤会持续探索大模型能力的KRE三层架构(知识—推理—执行),不断突破大模型能力边界。”

据介绍,“日日新SenseNova”大模型体系已正式推出5个大版本迭代。基于超过10TB tokens训练、覆盖大量合成数据,“日日新5.0”采用混合专家架构,推理时上下文窗口可以有效到200K左右。在文科能力方面,“日日新5.0”的创意写作能力、推理能力以及总结能力均大幅提升,相同的中文知识注入后,可以获得更好的理解总结及问答,为教育、内容产业等垂直应用场景提供有力辅助。在理科能力方面,“日日新5.0”数理能力、代码能力及推理能力达到业内领先水平,为金融、数据分析等场景落地提供坚实基础。

徐立表示,商汤科技在文生视频平台方面也取得了技术突破,未来,通过输入一段文字或一个完整的描述,就可以生成一段视频,而且人物的服饰、发型、场景都可以根据预先设定,保持视频内容的连贯性和一致性。他说,商汤科技将一直坚定向通用人工智能的目标前行,突破数据与算力的限制,引领大模型的创新与落地。(经济日报记者 李治国)