随着计算范式的改变,盲目堆砌数据规模的时代已然结束。目前,行业正从比拼“数据量”转向比拼“数据质”。9月12日,在由中国人工智能学会、上海交通大学与蚂蚁集团联合主办2025 Inclusion·外滩大会“Data meets AI:智能时代的双引擎”论坛上,产学界的多位权威专家表示,数据驱动了AI发展,AI也让数据迎来了新一轮的进化,双引擎融合驱动才是演进方向。
高质量数据构建成为大模型发展的新突破口
数据作为智能时代的第一引擎,正从辅助角色转变为核心驱动力。
复旦大学教授肖仰华指出,当前大模型发展正面临严峻的"数据墙"困境,无标签语料对模型性能提升的贡献日益减弱,更大规模数据带来的性能提升与所需的训练开销相比性价比显著降低。他认为,大模型数据科学需要从专家经验阶段发展到量化科学、直至自进化阶段。“大模型的数据实践需要屠呦呦式的研究,从海量杂乱的数据中提取出决定模型能力的关键成分”。
本次论坛展示了数据与AI双引擎协同发展的最新成果,为智能时代数据基础设施建设提供了参考和实践路径。与会专家表示,只有实现数据与AI的深度融合,建立完善的数据标准体系和质量评估框架,才能真正释放智能技术的巨大潜力,推动智能时代向更高层次发展。
(《财经》新媒体综编)