火山引擎:助企打通从业务到智能体的应用链路

唐一路 2025-05-15 13:50:43

5月13日,火山引擎发布豆包·视频生成模型Seedance 1.0 lite、豆包1.5·视觉深度思考模型,并升级豆包·音乐模型,以更全面的模型矩阵、更丰富的智能体工具,帮助企业打通从业务到智能体的应用链路。

此次全新发布的豆包视频生成模型Seedance 1.0 lite,支持文生视频、图生视频,视频生成时长支持5s、10s,分辨率提供480P、720P。企业用户可在火山方舟平台使用该模型API,个人用户也可在豆包APP、即梦平台体验。    

作为豆包视频生成模型系列的小参数量版本,Seedance 1.0 lite模型实现了两大突破:影视级的视频生成质量、视频生成速度大幅提升,兼顾效果、速度、性价比。据悉,该模型通过强大的语义理解,可精细控制人物外貌气质、衣着风格、表情动作等,并在多主体动作解析、嵌入式文本响应、程度副词和镜头切换响应方面具有优势。同时,支持360度环绕、航拍、变焦、平移、跟随、手持等多种镜头语言,具备细腻高清的基础画质和影视级美感。

此外,新发布的豆包1.5·视觉深度思考模型(Doubao-1.5-thinking-vision-pro),具备强大的多模态理解和推理能力,在视频理解、视觉推理、GUI Agent能力等方面表现突出。目前,该模型已在火山方舟上线。    

在视频理解方面,支持动态帧率采样,视频时序定位能力显著增强,结合向量搜索,可精准定位视频中与文本描述相对应的片段。同时,新增视频深度思考能力。模型学习了数万亿多模态标记数据,掌握广泛视觉知识,结合强化学习,视觉推理能力大幅提升。

目前,豆包大模型已在汽车、智能终端、互联网、金融、教育科研、零售消费等行业广泛落地。(经济日报记者 唐一路)