亿电竞-已建高质量数据集超过3.5万个 我国算力总规模位于全球第二

2025-09-06 14:33:38

科技日报记者 吴叶凡

14日,国新办进行新闻发布会,先容“十四五”期间数字中国设置装备摆设成长成绩。国度成长鼎新委党构成员、国度数据局局长刘烈宏先容,截至2025年6月尾,我国算力总范围位在全世界第二,已经经设置装备摆设高质量数据集跨越3.5万个,整体量跨越了400PB。

刘烈宏指出,“十四五”期间,我国紧紧掌握数字化、收集化、智能化成长机缘,周全深化数据要素市场化配置鼎新,鞭策数字中国设置装备摆设取患上显著成绩。最近几年来,我国人工智能的快速成长,就离不建国家对于数据事情的高度器重。

“数据是人工智能成长的三年夜焦点要素之一,于鞭策‘人工智能+’历程中阐扬着要害作用,尤其是高质量数据集的设置装备摆设至关主要。”刘烈宏举例,于医疗康健范畴,经由过程标注的医学影像高质量数据集,模子的疾病诊断正确率可以晋升15%以上。

作为第一个把数据作为出产要素的国度,我国多措并举促成数据资源的开发使用。刘烈宏先容,为鼎力大举鞭策高质量数据的供应,我国出台了高质量数据集设置装备摆设相干文件,多部分结合鞭策相干事情。“咱们引导天下数据尺度化技能委员会研究制订了相干尺度及技能文件,构造了高质量数据集设置装备摆设先行先试事情及典型案例征集勾当,分行业、分范畴树立了一批典型的解决方案。”刘烈宏说。

刘烈宏吐露,颠末一段时间的努力,海内大都模子练习利用的中文数据占比已经经跨越了60%,有的模子已经到达80%。中文高质量数据的开发及供应能力连续加强,鞭策我国人工智能模子机能的快速晋升。

人工智能模子的练习也鞭策了数据生意业务需求的爬升。数据显示,截至本年6月尾,各地高质量数据集累计生意业务额近40亿元,数据生意业务机构挂牌的高质量数据集总范围到达了246PB。“以北京数交所为例,高质量数据集占生意业务总量的比例从去年的10%跃升到今朝的近80%。”刘烈宏说。同时,上海、天津、安徽等地正于试点“数据语料作价入股”等新模式,指导企业将高质量数据集折算为股权投入到相干企业。

刘烈宏暗示,下一步,相干部分将经由过程系统化结构连续推进高质量数据集设置装备摆设,加速打造具身智能、低空经济、生物制造等重点范畴数据高地。“咱们也将鞭策全社会强化数据要素价值认同,加速推进数据要素价值共创,培育‘为优质数据买单’的市场共鸣。”

-亿电竞

分享