引领智能金融高质量发展 2025金融大模型评测体系在沪发布

李治国 2025-12-27 22:10:42

记者日前在“2025金融大模型评测体系发布会”上获悉，“2025金融大模型评测体系暨金融评测基准”正式发布。该体系在标准引领、数据驱动、安全可信与生态共建四大维度实现全面升级，首次构建覆盖金融全场景的评测基线，为行业提供统一、权威、可操作的技术评估框架，标志着“人工智能+金融”进入高质量发展的新阶段。

《金融大模型应用评测报告（2025）》与《金融大模型评测数据集（2025）》同期发布。该报告基于真实金融业务场景构建评测任务，探索金融垂直领域大模型应用的新理念、新机制与新手段，将有效支撑金融机构科学选型、降本增效，加速大模型在投研、风控、客服等核心环节的规模化落地。

上海市委金融办副主任、一级巡视员葛平表示，人工智能正在深刻重塑金融行业发展格局，大模型技术在应用场景深化、‌关键要素强化‌和应用生态协同推进三方面加速赋能‌。他强调，去年由库帕思、上海人工智能实验室等机构发布的全国首个“以金融业务为中心”的金融大模型评测体系，为行业提供了科学选型与能力对标的重要“标尺”。今年评测体系的全面升级，将助力上海建设具有全球影响力的金融科技中心。

库帕思COO施佳樑表示，该评测体系汇聚了4个公开数据集与22个自建数据集，约3.6万条评测数据，坚持科学与鲁棒的评测过程，采用循环选项打乱机制和多样化提示词，并研发金融裁判大模型，实现评测全流程自动化、标准化，为上海金融领域银行、券商、基金、投资等企业或者机构人员提供权威、精准的大模型能力评估，助力机构选型、优化及风险把控。

本次发布会由上海市委金融办、上海市委网信办、上海市经信委及上海徐汇区人民政府指导，由上海人工智能实验室与上海库帕思科技有限公司联合主办，汇聚来自金融机构、行业协会、高校、科研院所等百余位代表。