点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:一场专业赛推动数据变“资产”
首页> 地方频道> 地方频道-江苏> 当地新闻 > 正文

一场专业赛推动数据变“资产”

来源:新华网2026-04-26 17:01

  原标题:来自产业一线的真题真做,折射高质量数据集建设现状 一场专业赛推动数据变“资产”

  4月24日,“数智未来”高质量数据集开发者创新大赛成果发布会在南京市玄武区落幕。这场历时5个月,吸引全国30余所高校、70余家企事业单位同台竞技的赛事,不仅决出了五大赛道的优胜者,更折射出智能经济底层基础设施高质量数据集建设的真实图景。

  建设高质量数据集面临三大难点

  “你有数据并不代表你有高质量数据集。”国家管网集团西气东输分公司科技数字中心副主任占传熙在圆桌论坛上直言,当前他们在建设高质量数据集时面临三大难点。

  首先是数据稀缺性。以焊缝缺陷数据为例,在管道建设中,有缺陷的焊缝比例可能只有千分之几。“量少且分散,从项目上拿回来、再处理,成本极高。”占传熙说。

  难点还在于数据专业性不够。焊缝底片的判读需要专家具备多年经验,模型难以在短时间内规模化复制。同时,还存在数据的泛化性不足问题。“世界上没有两个一模一样的缺陷。”占传熙说,即便模型学习了上万张样本,到了真实场景仍需持续适配算法。

  徐工集团全球数字化中心部长李忠福同样深有感触。他以挖掘机核心部件液压泵为例,完整寿命约3000小时,但企业通常只关注最后“失效”的1小时。“从0到100%的退化过程,数据分散在生产、服务、研发等不同部门,大家不好意思把‘不好’的数据拿出来,部门之间也存在壁垒。”李忠福说,这种数据孤岛,让建立完整的寿命预测曲线变得极其困难。

  在卫星遥感赛道,自然资源江苏省卫星应用技术中心总工詹雅婷用一组数字说明了难度:280万个样本,其中200万个用于变化检测,标注精度必须达到95%以上才能“好用、管用”。“每天卫星拍下海量影像,人工标注几无可能,必须用AI自动初筛再人工精修。”她说。

  产教融合打通“最后一公里”

  正是这些真实痛点,催生了大赛的“真题真做”模式。5家链主企业把最难的场景、产线上的真实数据、最稀缺的样本,毫无保留地开放给全国青年学子。

  “我们希望通过大赛,把生产中的实际问题贡献出来,与高校结合,获得更多科产融合的机会。”中信数字科技集团战略发展部总经理钱卫说。

  产教融合在赛场内外同时发生。北京传世博润科技有限公司高级副总裁袁立飞分享了一个细节:有个医院团队原本多人组队,为符合大赛人数限制,拆分成3支,临床、信息科、同位素科各一队。他建议三队保持交流,“高质量数据集不是单一科室能完成的,需要多方智慧。”

  更直观的成果是人才对接。袁立飞说,大赛期间已有企业向优秀学生发出实习和参与国家级项目的邀请。“学生拿了实习就业的机会,这是大赛最实在的价值。”

  玄武区委书记闵一峰在致辞中表示,玄武区正全力建设国家级数据产业集聚区核心区,江苏国际数据港一、二期超50万平方米产业空间已投用,人工智能产业母基金落地,青年人才房票和超千套人才公寓为数据工匠“创业无忧、创新有成”提供保障。

  “持久战”已进入攻坚阶段

  什么数据最“值钱”?南京市创新投资集团人工智能部投资总监张苏荣从资本视角给出了判断标准。“私域数据不出场、不出域,别人拿不到的最值钱。其次是场景数据,如电子病历沉淀的诊疗记录对医药研发有极高价值。还有能形成数据飞轮的高质量标注数据,以及刚需领域的科学数据。”

  他用一个形象的比喻解释高质量数据集的价值层次:“从原始数据到可训练的语料,中间经过清洗、标注、校验多道工序。如果数据泛化性好,就能从一次性买卖变成可重复使用的资产。”

  大赛虽已收官,高质量数据集的建设远未结束。“这场大赛的举办,恰逢其时。”国家数据发展研究院副院长袁军透露,国家数据局管理的国家数据集管理服务平台将于4月29日试运行,未来将持续完善标准与评测体系,构建行业基准模型与测试数据集。

  “数据奔涌千帆竞,智创未来万象新。”闵一峰向全国数据英才发出邀约。而李忠福的期待更具体:“我们渴望建立工程机械核心部件从全新到失效的全生命周期数据集,让每一台设备都能‘预知’自己的健康度,让客户从买设备转向买服务。”

  高质量数据集的建设是一场持久战。这场大赛,让产业界、学术界、资本界看到:真正的攻坚,已在产线上、在病房里、在卫星遥感赛道悄然展开。(何玥颐 何钰)

[ 责编:茹行止 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 习近平出席金正恩举行的欢迎宴会

  • 习近平同金正恩举行会谈

独家策划

推荐阅读
6月5日,记者从哈尔滨医科大学获悉,该校周钦、崔飞云教授科研团队融合人工智能、表面增强拉曼光谱检测与血液代谢分析技术,打造出一款全新的血液代谢分子解析检测平台。阿尔茨海默病是高发老年神经退行性疾病,依靠血液样本进行早期微创筛查,即液体活检,是当下临床医学的热点话题。
2026-06-08 09:56
近日,在山东胜利油田油区护卫中心,飞手贾承斌坐到电脑前,轻点鼠标,操纵室外无人机群升空。
2026-06-08 09:57
生态环境部日前发布的《中国履行〈生物多样性公约〉第七次国家报告》显示,截至2025年底,与生物多样性有关的27个国家目标中,我国有21个目标取得显著进展。
2026-06-08 09:57
大国工匠是我们中华民族大厦的基石、栋梁。大国工匠作为各领域的技艺集大成者,是工匠精神的生动代言人和时代典范,他们身上闪耀着执着专注、精益求精、一丝不苟、追求卓越的光彩。
2026-06-08 09:57
“甘肃是我国著名的‘有色金属之乡’,镍、钴、铂族金属等矿产资源储量全国领先,在国家战略资源安全保障中具有不可替代的地位。项目组将充分吸纳专家意见,力争提出务实管用、可落地、能实施的咨询建议,为保障国家资源安全贡献“甘肃方案”。
2026-06-08 09:57
这不仅是航运模式的创新,更是长三角区域协同发展、服务全国统一大市场建设的关键举措。
2026-06-05 10:02
目前,全县253家工业品企业实现常态化开播,2026年以来直播销售额达5.2亿元,线上订单占比提升至45%以上。
2026-06-05 09:59
近日,从中国科学院“公众科学日”到第二十六个全国科技活动周,全国各地广泛开展形式多样的群众性科技活动。
2026-06-05 09:57
我国数字文化出海正告别粗放式流量输出的初级阶段,形成以新质生产力夯实产业根基、以文化影响力提升传播价值的新逻辑。
2026-06-05 09:55
以技术创新为动力,以制度创新为保障,持续深化生态环境监测数智化转型。
2026-06-05 09:54
台风路径预报、渔船出海决策,乃至“厄尔尼诺”预警,离不开一套行之有序的全球海洋观测系统(GOOS)。它由数千个漂流浮标、科考船和锚系浮标共同构成,像神经系统一样监测着海洋的温度、盐度和海流。
2026-06-04 09:47
供销合作社系统紧盯“三夏”生产关键节点,统筹农机力量、强化科技赋能、健全收储保障,护航夏粮抢收、烘干、收储工作。当前正值夏收夏种的关键时节,浙江省杭州市富阳区供销合作社所属供销新桐农业现代化服务中心抢抓农时,开足马力,全力以赴投身“三夏”生产主战场。
2026-06-04 09:35
高校拥有科研力量,但成果难以精准对接产业需求;企业有技术瓶颈,却找不到合适的团队攻关。建设甘肃高等研究院,旨在破解科研、产业“两张皮”,推动科技创新和产业创新一体发展,打通产学研用“最后一公里”。
2026-06-04 09:34
记者闫磊、张文攀从国网宁夏电力调控中心获悉,5月30日,宁夏新型储能装机规模突破1000万千瓦,正式迈入千万千瓦级储能大省行列。宁夏率先构建多元化市场营利模式,构网型储能、百万千瓦级共享储能等标杆项目相继落地投产,实现储能资源建得成、调得动、用得好、效益高。
2026-06-04 09:33
近日,《四川省加快推进“人工智能+”一号创新工程实施方案》正式发布,四川正以全省一号创新工程全力推进人工智能发展。据介绍,四川目前已建成数据中心139个,智算规模约38EFLOPS,为“人工智能+”一号创新工程夯实了算力底座。
2026-06-04 09:31
布局基础研究必须有“功成不必在我”的长远眼光,以持久耐心深耕原理,方能收获未来技术革命的丰硕果实。为此,基础研究布局更加注重从技术瓶颈中提炼低层和深层科学问题,引导科研力量在原理层面下苦功、求突破。
2026-06-04 09:46
5月29日,中央宣传部、中国科协发布“最美科技工作者”,四川大学华西临床医学院副院长,华西医院神经内科主任医师、教授陈蕾入选。
2026-06-03 10:26
瑞士苏黎世联邦理工学院研究团队开发出一种由干细胞和磁电纳米颗粒组成的“细胞机器人”。
2026-06-03 10:24
生态环境部日前印发《海湾清洁指数评价技术方法(试行)》,旨在建立统一规范的海洋垃圾清洁程度量化评估与分级标准,推动沿海地方精准识别问题短板,压实所辖海湾的海洋垃圾治理责任,为“十五五”时期海洋垃圾治理提供重要支撑。
2026-06-03 10:21
近期,国务院印发《加快农业农村现代化“十五五”规划》(以下简称《规划》)。日前,农业农村部、国家发展改革委负责人就《规划》有关情况进行了解读。
2026-06-03 10:20
加载更多