筑牢人工智能数据底座
“以5G、人工智能、大模型等为代表的数字技术迅速发展,今年前两个月数字产业业务收入同比增长8.2%。”工业和信息化部总工程师谢少锋介绍,我国已形成了覆盖基础层、框架层、模型层、应用层的完整产业体系,建成钢铁、煤炭等高质量行业数据集,培育出一批竞争力强的通用大模型和行业大模型,国产大模型登顶全球主流开源社区下载量榜单。
人工智能的发展离不开数据资源开发利用。高质量数据作为人工智能应用底座,对通用大模型和行业大模型都具有很强的保障支撑作用。今年的《政府工作报告》提出,加快完善数据基础制度,深化数据资源开发利用,同时也强调支持大模型广泛应用。
作为数据要素市场化价值化的主阵地,企业对于数据资源开发利用具有较强需求。据经济合作与发展组织测算,数据流动对各行业利润增长的平均促进率在10%左右,在数字平台、金融等行业可达32%。“我们鼓励企业在不违反法律法规、不危害国家安全和公共利益前提下,充分开发利用其在生产经营过程中形成或合法获取、持有的数据。”国家数据局副局长陈荣辉说。
近年来,中国电信通过加强企业数据和外部数据汇聚,形成海量多源数据优势,在企业数智化转型应用上取得显著成效。在用户服务方面,利用网络资源数据、网络感知数据和历史投诉数据,主动修复客户感知;在反诈识别方面,通过话务、漫游行为、终端等数据,构建反诈模型,甄别潜在“涉诈”号码并及时处置;在民生服务方面,根据运营商位置数据及政务公共数据,构建应急通知、民生关怀等能力,已为超过300家政企用户提供大数据短信提醒服务。
“数据要素与人工智能技术深度融合是驱动产业数智化转型的关键动能,数据是训练和优化人工智能模型的核心要素。”中国电信集团有限公司副总经理黄智勇介绍,基于50万小时的脱敏音频数据集,中国电信打造了业界首个支持50种方言自由混说的语音大模型。同时,面向教育、交通等领域,联合用户共同建设99个行业数据集,涵盖语义、语音、图像、视频等类型,推出50余款行业大模型。例如,通过知识库和工单数据开发的星辰政务热线大模型,已在上海等地的12345市民服务热线应用,一次性解决率提升30%,派单准确率提升15%。
同样在政务领域深耕多年的科大讯飞,近期再度升级其星火X1大模型。由于融入了更多场景复杂类型数据,模型的泛化性得到进一步提升,在教育、医疗、司法等多个重点行业扩大应用范围。以司法行业为例,大模型根据材料总结案件事实以及判决理由,精准把握用户指令,详细分析争议点,快速定位关键信息,并输出准确内容,为用户提供专业、可靠的智能支持。
讯飞星火X1升级背后,是一系列技术创新与理念突破。首先,提出了基于问题难度的大规模多阶段强化学习方法,在复杂推理、数学、代码、语言理解等场景提升模型效果。其次,统一模型下的快慢思考混合训练方法,能够充分发挥数据相互促进作用,支撑用户更高效便捷地部署使用。
此外,大模型在电子、原材料、消费品等行业也加快落地,在研发设计、中试验证、生产制造、运营管理等环节得到应用。“我们在典型案例征集遴选中发现,北京一家平板显示企业利用大模型一键生成排产计划,产线排产的时间降低了75%。”谢少锋表示,下一步,工信部将加强通用大模型和行业大模型的研发布局,加快建设工业领域高质量数据集,夯实基础底座。(记者李芃达)
您可能感兴趣的文章
- 05-14 低空智慧监管平台落地鄂尔多斯
- 05-14 阿里发布开源模型千问3 通义App第一时间开启体
- 05-14 阿里千问3登顶全球最强开源模型 性能超越Deep
- 05-14 把“未来”端上来!中国移动数字峰会创新科技
- 05-14 阿里AI工程师首获“全国劳动模范”荣誉称号
- 05-13 夸克凭“AI超级框”受华语区用户青睐
- 05-13 推理性能提升13倍!百度智能云发布昆仑芯超节
- 05-13 百度发布文心4.5 Turbo、X1 Turbo两大模型
- 05-13 2025中国数谷·西湖论剑大会发布多项重磅成果
- 05-13 西湖论剑丨范渊:以“AI×数据要素”拥抱智能体


阅读排行
推荐教程
- 01-19 气象智慧服务保障浙江冰雪经济
- 01-03一键清理数据库历史记录脚本
- 12-10为电诈犯罪提供语音中转实施诈骗 二被告人获刑
- 12-09小米YU7要来了!雷军发文:预计明年六七月正式上市
- 07-25我国成功发射四象01星等4颗卫星
- 01-20 运用数字技术提高执法效率
- 01-20 推动算法透明化 共筑向上向善的数字未来
- 01-19 抖音将建立安全与信任中心 推进算法和平台治理
- 01-19 第二批汽车数据处理4项安全要求检测情况发布
- 01-19 数字消费机遇与挑战并存