OceanBase开源AI数据库seekdb 解决传统架构低效难题

来源 | 《财经》新媒体   

2025年11月18日 17:27  

本文1663字,约2分钟

11月18日,OceanBase推出并开源了其首款AI数据库seekdb。开发者仅需三行代码,就能快速构建知识库、智能体等AI应用,实现对百亿级多模数据的检索。目前,seekdb已在GitHub开源,同步启用全新域名oceanbase.ai,全球开发者均可免费下载使用。

seekdb作为OceanBase“Data×AI”战略的关键组成部分,既可独立部署,也能融入新上线的OceanBase 4.4一体化融合版本。该版本首次将事务处理(TP)、分析处理(AP)与AI能力整合进单一数据库内核,具备分布式扩展、多云部署与金融级高可用特性,能有效帮助企业规避未来架构重构风险。其商用LTS版本计划于2026年2月2日上线。

OceanBase CEO杨冰指出,AI发展的真正瓶颈并非模型,而是数据。尤其在金融、政务等场景中,AI需在毫秒级完成实时推理,同时安全、高效地融合私有数据。然而,传统架构依赖多系统拼接数据链路,不仅复杂低效,还易引发权限混乱与响应延迟等问题。

“seekdb并非对传统数据库进行简单功能叠加,而是为AI时代重构的原生数据库。”杨冰表示,该产品基于OceanBase的代码和设计理念,更加轻量、敏捷,目标是成为大模型与私有数据融合计算的实时入口。

在技术能力上,seekdb可支持向量、全文、标量与空间地理数据的统一混合搜索,深度融合AI推理与数据处理,兼容Hugging Face、LangChain等30余种AI框架,推动数据库从传统的“业务支撑系统”向“AI 原生数据入口”演进。

在部署与集成方面,seekdb最低仅需1核CPU、2GB内存,支持pip install一键安装、秒级启动,兼容嵌入式与客户端、服务器双模式,可轻松集成至智能Agent、开发工具链或本地应用,大幅降低AI应用的工程门槛。

更重要的是,seekdb以Apache 2.0协议全球开源,开发者可自由使用、修改和扩展。产品可兼容HuggingFace、Dify、LangChain等主流AI框架及MCP大模型协议,无缝融入现有AI开发生态;同时提供SQL及PythonSDK,适配不同开发习惯。同期开源的PowerRAG智能文档解析框架与PowerMem分层记忆架构,在LOCOMO Benchmark上以73.70分登顶SOTA,Token消耗降低96%,大幅节省推理成本。

目前,OceanBase的混合搜索能力已在多个行业落地。中国联通基于混合搜索构建统一AI知识库,有效解决了私有文档的权限管理与高效检索难题;蚂蚁百宝箱则借助混合搜索实现了智能体的实时在线搜索,进一步提升了信息获取的精准度与响应效率。

“传统数据库只存数据,而seekdb能理解数据语义,”杨冰指出,混合搜索正是AI原生数据库的关键分水岭。

这一能力背后,是OceanBase在过去十五年历经“双11”等极限场景锤炼出的工程化能力,正转化为AI时代的底层优势,在混合搜索、多模融合、TP/AP/AI一体化、多云原生等方向持续突破。

自2010年由蚂蚁集团自主研发以来,OceanBase已服务全球超过4000家企业,覆盖金融、政企、能源、通信、零售、制造、互联网等关键领域。其云服务OB Cloud是可支持阿里云、华为云、腾讯云、百度智能云、AWS、GCP、Azure等云厂商的数据库产品,业务遍及全球16个国家和地区、60多个地域、240多个可用区。

据Gartner预测,到2028年,支持生成式AI的数据库支出将达2180亿美元,占市场74%。然而,MIT研究显示,超95%的企业AI项目因多模态数据割裂、系统链路冗长、权限管理复杂难以落地。seekdb的推出,正是为了应对这一现实挑战。

杨冰认为,未来的数据库必须同时服务人与智能体,在数据源头支撑事务、分析与AI混合搜索,驱动实时、可信的智能决策。

(《财经》新媒体综编)