阿里云通义千问2.0上线 大模型迈入应用落地“深水区”

2023年10月31日 22:14  

本文1489字,约2分钟

“面向智能时代,阿里云将通过从底层算力到AI平台再到模型服务的全栈技术创新,升级云计算体系,打造一朵AI时代最开放的云。”10月31日,阿里云CTO周靖人在2023云栖大会上宣布,阿里云大模型家族全面升级。其中,通义千问2.0正式上线,参数规模首次升级至千亿级别。与通义千问2.0版本一同登场的,还有8大行业模型组团上线,分别覆盖金融、医疗、法律、编程、个性化创作等领域。

在这背后,折射出当前大模型行业正在步入应用落地的“深水区”。对于大模型企业而言,如何让技术真实落地成为一大考验。

周靖人指出,今年的技术变革表面上是大模型所致,背后是云计算甚至计算机科学的全面升级。

阿里云创始人王坚也持相似判断,他坦言,很少人意识到人工智能和云计算不是科学研究工具的革命,而是会让科学发生一场革命的工具。

在ChatGPT的驱动下,我国大模型正在迎来发展新阶段。数据显示,截至2023年8月,我国已发布的大模型达156个,10亿级参数规模以上大模型已超80个,展现出“百模大战”的竞争态势。

在如此汹涌的浪潮下,大模型应用开始加快落地,从与人顺畅聊天到写合同、剧本,从检测程序安全漏洞到辅助创作游戏甚至电影……从“好玩”到“好用”,大模型开始真正赋能千行百业。

值得关注的是,相比4月发布的1.0版本,通义千问2.0模型参数数量全面提升至千亿级别,不管是在阅读理解还是逻辑思维、数据等方面,都有大幅度提升。在10个权威测评中,通义千问的综合性能已经超过GPT-3.5,加速追赶GPT-4。

为加速大模型应用落地,阿里云推出8大行业大模型。其中,个性化角色创作平台通义星尘、智能投研助手通义点金、AI阅读助手通义智文等组团上线;智能编码助手通义灵码已在阿里云内部大规模采用;工作学习AI助手通义听悟每天处理5万余个音视频,累积用户超100万。

据了解,这些应用模型将通过两种方式开放给开发者,除了web端体验,还将通过API与SDK方式做端口调用。

周靖人表示,众多通义千问产品的发布并不意味着阿里云要去做ToC的产品,而是把模型能力开放出来,让开发者集成模型的能力来解决自身需求。

随着大模型的普及和应用,其也面临着一些挑战和问题,需要进一步研究和探索大模型在行业应用中的可持续发展路径和创新应用模式。

“如果开发者自身有能力,阿里云会提供开放工具帮助其自己来完成模型开发。如果开发者需要能快速使用的模型接口,那么阿里云会提供相应的应用模型,把接口开放出来,支撑他们在云上开发AIGC应用。”在周靖人看来,人工智能的浪潮刚刚开始,其影响是深远的,会改变算力市场和云计算的方方面面,而阿里云希望能把模型推理的门槛进一步降低。

对此,阿里云推出了一站式大模型应用开发平台“阿里云百炼”, 该平台集成了国内外主流大模型,提供模型集成、模型选型、微调训练、安全套件、模型部署等服务。开发者可在5分钟内开发一款大模型应用,几小时训练出一个企业专属模型,把更多精力专注于应用创新。

在业内看来,在经历了上半年的热潮后,“百模大战”来到了一个更加冷静、客观、理性挑选大模型的阶段。从大模型的三个要素——算力、模型和应用角度考虑,关键评价指标如今已经在各方动作中逐渐清晰:更具性价比的算力、更强大的模型能力、更繁荣的开发者生态,才能在激烈的市场竞争中占据一席之地。

(《财经》新媒体综编)