国内知名百家大模型最新盘点,北京第一!大模型普及时代即将来临?(附全表)

来源 | 《财经》新媒体综编  编辑 | 瑾瑜 实习生 冉进颖  

2023年09月03日 19:24  

本文4735字,约7分钟

国内首批大模型面向公众开放!人人用上大模型的时代来了

8月31日,我国首批通过《生成式人工智能服务管理暂行办法》备案的人工智能大模型名单出炉,这意味着这些生成式AI产品可以正式面向公众开放注册、提供服务。

据悉,百度(文心一言)、抖音(云雀大模型)、商汤(日日新大模型)、中科院旗下紫东太初大模型、百川智能(百川大模型)、智谱AI(GLM 大模型)、MiniMax(ABAB 大模型)、上海人工智能实验室(书生通用大模型)8个企业/机构的大模型位列第一批名单。产品获批后,上述企业机构的大模型产品,即可在网站/应用商店下载后直接使用。

另据媒体报道,此前多家研究机构看好的讯飞“星火认知”、华为“盘古”大模型、腾讯“混元”大模型、阿里“通义千问”、360智脑大模型也已完成备案工作,预计在未来陆续由各地方相关管理部门下发通知,还有更多的大模型厂商也正在加紧推进相关备案工作。

 

首批备案大模型产品抢鲜看

  1. 百度——文心一言

百度(Baidu)旗下“文心一言”为国内首个生成式AI产品,于2023年3月16日开启邀测,基础模型文心大模型早在2019年就在国内率先发布,近期升级的文心大模型3.5也在多家权威测评中位居前列。百度除了自研大模型产品,还完成了从芯片到应用的布局,即“昆仑芯+飞桨平台+文心大模型”。

体验网址:https://yiyan.baidu.com/

  1. 抖音(字节跳动)——云雀

字节跳动是一家立足于中国,面向全球的互联网科技公司,在全球推出了多款有影响力的产品,包括今日头条、抖音、西瓜视频、飞书、TikTok、Lark等。8月17日,抖音集团(字节跳动)宣布开始对外测试AI对话产品“豆包”。据悉“豆包”是基于抖音云雀模型开发,提供聊天机器人、写作助手以及英语学习助手等功能。目前支持网页Web平台、iOS 以及安卓平台,用户通过手机号、抖音或者Apple ID登录即可使用。

体验网址:https://www.doubao.com

  1. 商汤——日日新

商汤科技作为人工智能软件公司,业务涵盖智慧商业、智慧城市、智慧生活、智能汽车四大板块。商汤SenseChat大模型拥有提供自然语言、内容生成、自动化数据标注、自定义模型训练等多种能力,最新版大模型“商量SenseChat 2.0版本”已发布,其基模型为商汤联合多家国内顶级科研机构发布的书生·浦语InternLM-123B,拥有1230亿参数。

体验网址:https://www.sensetime.com/

4、中科院自动化研究所——紫东太初

中科院自动化研究所成立于1956年10月,是中国最早成立的国立自动化研究机构。“紫东太初”定位为跨模态通用人工智能平台,于2021年正式发布。“紫东太初”参数已达千亿级别,拥有视觉、文本、语音、视频、传感信号、3D点云等多种模态,基于全栈国产化基础软硬件平台建立。目前,紫东太初已在文本创作、医疗、物流、政务等多个行业实现应用落地。6月16日,紫东太初2.0全模态大模型发布。

体验网址:https://xihe.mindspore.cn

5、百川智能——Baichuan

百川智能成立于2023年4月,是一家研发并提供通用人工智能服务的创新公司。公司由搜狗公司创始人王小川和前搜狗COO茹立云联合成立,旨在打造中国版的OpenAI基础大模型及颠覆性上层应用。百川智能现已与北京大学和清华大学两所顶尖大学展开合作。Baichuan-13B 是由百川智能继 Baichuan-7B 之后开发的包含 130 亿参数的开源可商用的大规模语言模型,在中英文Benchmark上均取得同尺寸模型中最好的效果。

体验网址:https://www.baichuan-ai.com/

6、上海人工智能实验室——书生

上海人工智能实验室(又称浦江实验室)成立于2020年,由上海人工智能创新中心发起设立。2021年,浦江实验室联合商汤、香港中文大学、上海交通大学发布通用视觉技术体系“书生”(INTERN)。“书生·浦语”具有千亿级参数,全面评测结果显示,“书生·浦语”具备很强的综合能力,因而在综合性考试中表现突出,在多项中文考试中取得超越ChatGPT的成绩,其中就包括中国高考各科目的数据集(GaoKao)。

体验网址:https://intern-ai.org.cn

7、智谱AI——AI-GLM

智谱AI成立于2019年,是一家AI知识智能技术开发商,是国内最早一批研发大模型的企业,由清华大学知识工程实验室技术成果转化。智谱已经发布包括双语千亿级超大规模预训练模型GLM-130B,中英双语对话模型ChatGLM、认知大模型平台Bigmodel.ai,包括CodeGeeX和CogView等产品。目前智谱全能AI助手智谱清言已经在各大手机APP应用商店上线,可以通过苹果商店、安卓主流商店进行下载,或在微信小程序中搜索“智谱清言”体验功能。

体验网址:https://chatglm.cn/

8、MiniMax——ABAB

MiniMax成立于2021年12月,专注于开发大规模模型和人工智能技术。他们的目标是实现通用人工智能(AGI)。MiniMax的团队由商汤前科技副总裁兼通用智能技术负责人闫俊杰和中科院的校友杨斌组成。他们的产品包括Glow和Inspo。6月,该公司最近完成了一轮2.5亿美元的融资,使其估值超过12亿美元。Minimax已经发布了包括文本到视觉/语音/文本三个基础模型架构,推出自研通用大模型“ABAB”,以及虚拟聊天软件Glow、生成式对话AI产品Inspo等。

体验网址:https://api.minimax.chat

9、讯飞星火认知大模型

科大讯飞旗下的“讯飞星火”认知大模型突破开放式知识问答,多轮对话、逻辑和数学能力再升级。有着文本生成、语言理解、知识问答、逻辑推理、数学知识等七大核心能力,中文领域它已在文本生成、知识问答、数学能力3个维度超越ChatGPT。在新华研究院《人工智能大模型体验报告》中,以1013的总分排名第一。

体验网址:https://xinghuo.xfyun.cn/

10、阿里通义千问大模型

“阿里通义”千问大模型是阿里云推出的一个超大规模的语言模型,功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持。能够跟人类进行多轮的交互,也融入了多模态的知识理解。据中国证券网报道,“通义千问 ”目前已经完成了备案工作,正在等待正式上线。

体验网址:https://tongyi.aliyun.com/

11、腾讯混元AI大模型

混元AI大模型基于腾讯太极机器学习平台进行研发,借助GPU算力,实现快速的算法迭代和模型训练。基于混元大模型的工作场景,员工可以写邮件、面试大纲、PPT大纲、调研问卷等;在编程场景下,员工可以体验域名推荐、代码生成、代码解释、SQL语句生成等;在生活场景下,员工可以制定旅行计划、健身方案或者美食指南等。中国证券报消息,腾讯将在9月初举行的 2023 年腾讯全球数字生态大会上正式发布混元大模型。

体验网址:https://hunyuan.tencent.com/

12、华为盘古大模型

华为盘古大模型是可以实现一个AI大模型在众多场景通用、泛化和规模化复制,减少对数据标注的依赖,让AI开发由作坊式转变为工业化开发的新模式。7月,华为正式发布盘古大模型3.0,包括5+N+X三层架构,为客户提供100亿参数、380亿参数、710亿参数和1000亿参数的系列化基础大模型,匹配客户不同场景、不同时延、不同响应速度的行业多样化需求。已经初步运用在政务、煤矿、铁路、气象、金融领域。

体验网址:https://www.huaweicloud.com/product/pangu.html

13360智脑大模型

“360智脑”是360自研的认知型通用人工智能大模型,拥有包括生成与创作、阅读理解、多轮对话在内的十大核心能力,可覆盖大模型所有应用场景,是中国首个通过工信部信通院认可的“可信AIGC大模型评测”大模型。据中国经济周刊报道,360智脑大模型已取得近2000万元的相关业务收入。

体验网址:https://ai.360.cn/

 

国内知名大模型最新盘点

大模型发展势不可挡,据《财经》新媒体不完全统计,截至目前国内已发布的大模型超过百个。小编根据公开资料对国内已发布的大模型进行了盘点,并按照时间顺序排序,希望帮助读者更全面地了解国内大模型行业和热门产品。

从统计图表中可以看出,国内大模型发布集中在2023年上半年,从百度文心一言3月16日开启内测开始,大模型开始密集发布的进程。今年3月发布的大模型为7个,此后4——7月每月发布的大模型都在10个以上。从地域上看,在统计的127个大模型中,北京有65个,占比50.3%揽半壁江山,上海17个排名第二,杭州以10个冲进前三强。深圳、广州、南京等城市也发布了多个大模型。此外,蚂蚁集团、同花顺等一批企业也在紧锣密鼓披露各自大模型的最新进展。

 

提高大模型可用性,加速应用商业化落地

经过大半年的发展,大模型正在加速赋能千行百业,走进每个普通人的生活。

微软(中国)CTO兼神州网信总经理韦青先生在接受采访时曾表示,最伟大的技术是那些融入于日常生活中无形的技术,而这样的技术应用,将有可能彻底改变社会的发展的进程。他认为任何一种技术都有社会性、泛在性的趋势。如电力、互联网、基础模型等都是社会中关键的基础架构,都会经历三个发展阶段:第一阶段叫有技术,第二阶段叫用技术,最后是泛在的技术。这一轮的大模型也是一样的。

下一步,百家大模型产品如何实现应用商业化,让AI服务真正落地将成为关注焦点。

据浙商证券预测,预计政策+需求共振下 AI 应用生态将加速形成。一方面,大模型监管政策不断完善,全面商用化的时点渐行渐近。另一方面,浙商证券预计国内软件厂商的大模型应用产品有望在下半年密集发布,大模型有望在下半年进入商业化落地阶段。

国海证券认为,本次“备案清单”是《暂行办法》实施后的首批获批“大模型清单”,标志着AIGC技术、监管与应用模式的阶段性成熟,进入大规模推广阶段。后续《暂行办法》有望持续完善,科技企业将更加积极地拥抱AI,“清单”将进一步扩容。

新华社研究院发布的报告建议,可以通过降低成本、提高易用性、增强可靠性、保护隐私和安全等方面的措施,进一步提高大模型的可用性。

目前,众多企业已抢先布局和拓展大模型应用场景,有业内人士分析,大模型应用在教育、医疗、金融、汽车等领域有望率先落地。

未来,通过政府、企业和社会各方的共同努力和合作,将进一步推动中国大模型技术的应用落地,最终实现人工智能产业的快速发展和跨越式进步。

人人用上大模型的时代就要来啦!你准备好了吗?