广东省高质量数据集创新大赛在东莞启动

郑杨 2025-12-03 19:33:40

12月2日,广东省首届高质量数据集创新大赛启动仪式在东莞举行,全省21个地级以上市政务和数据局主要负责人、数据产业集聚建设试点区负责人以及企业代表、行业机构代表、基金机构代表、高校代表等汇聚一堂见证大赛启动,共同探索数据价值转化新路径。

活动现场。(资料图片

当前,数据已成为驱动产业变革的核心生产要素,而高质量数据集则是释放数据价值的“源头活水”。广东立足实际,全力打造数智化发展新高地。据介绍,本次高质量数据集创新大赛在全国属于“从0到1”的探索跨越,以“真实需求、真实数据、真实方案、真实应用”为原则,通过“揭榜挂帅”赛事机制,创新性采用“分期发榜、全年办赛”模式,聚焦工业制造、医疗健康、科技创新、城市治理、交通运输等重点领域发展需求,先找场景、再找数据,以赛事为载体和抓手,探索建设一批高质量、可复用的数据集,为人工智能模型训练和行业应用提供“燃料”。

启动仪式上,来自能源、生物医药、金融、交通、低空、教育等重点领域的首批高质数据集赛题正式“发榜”,中国南方电网有限责任公司、广州(国家)实验室、广东省人民医院、中国平安财产保险公司、佳都科技集团股份有限公司、广州金域医学检验集团、东莞市人工智能与数字经济有限公司等单位发出首批高质量数据集需求“发榜单”。

大赛启动仪式现场,东莞数标园及六大赋能平台集中发布,22家企业同步签约入驻。

据了解,作为科创制造强市,东莞规上工业企业数量稳居全国前三,兼具丰富的AI应用场景与海量的工业数据两大优势,是国家人工智能应用中试基地。当前,东莞正以建设“湾区数谷”为抓手,率先布局数据标注等基础环节,着力建设全国首个规模化边端智算网络,实现对工业产线数据的深度挖掘、高效加工。

当日正式揭牌并投入运营的东莞市数据标注产业园(下称“东莞数标园”),正是其中的重要探索。东莞将通过3年努力,形成100个行业级高质量数据集,打造粤港澳大湾区规模最大、智能化程度最高的数据标注基地。东莞数标园总投资3.3亿元打造,携手中国电信、百度智能云两大龙头企业构建“一园两基地六平台”的产业生态体系。

启动仪式的分享环节,多位行业专家分享了对行业的洞察与实践。工业和信息化部电子第五研究所人工智能中心副主任李帅介绍,该所正联合数据标注基地、行业龙头企业及人工智能服务商等多方力量,建设高质量数据集测评服务中心。百度自动驾驶业务运营负责人沈健则聚焦具身智能领域,分享了数据采标室的解决方案。沈健认为,数据是具身智能行业走向通用智能的巨大瓶颈,而获取高质海量训练数据正是人形机器人破局的关键。