OceanBase CEO杨冰:非结构化数据在线实时处理,是AI时代对数据库的最大刚需
5月9日,2026中国经济年度观察大会在浙江德清举办。蚂蚁集团杨冰分享OceanBase发展与技术优势,谈及 AI 时代数据库底座需求,认为软件正向为Agent服务转变,剖析数据底座分久必合趋势及两大驱动因素。
新华财经杭州5月10日电(胡晨曦)5月9日下午,2026中国经济年度观察暨新华财经全球生态伙伴大会在浙江德清举办。蚂蚁集团副总裁、OceanBaseCEO杨冰在大会上表示,非结构化数据能否真正实现在线实时处理,是AI时代最大的刚需;如何搭建开放、实时、多模态、混合式的数据湖,正是AI时代技术底座需要解决的核心问题。

图为蚂蚁集团副总裁、OceanBaseCEO杨冰
杨冰在大会“大家观察”环节,分享了蚂蚁集团自研的分布式数据库OceanBase。截至目前,OceanBase已支撑阿里巴巴集团13届双十一购物节,在此过程中打磨形成原生分布式可扩展数据底座。依托近年自主可控国产化发展浪潮,产品已落地千行百业,服务金融、政企、运营商等行业。近年来,政企政务领域涌现出大量类似双十一的高并发民生业务场景;随着AI和Agent时代到来,市场将产生海量数据与访问请求,OceanBase持续深耕这类场景,市场发展空间进一步拓宽。
在AI和数智化时代,企业究竟需要怎样的数据库与数据底座?杨冰表示,面向AI时代的数据库,需同时承载核心关键业务与AI创新业务两大需求。过去十年,OceanBase依托分布式技术解决企业海量数据处理难题,核心逻辑是通过多数据库承载超大规模数据量;凭借原生分布式能力,让多个同构数据库实现一体化运行,攻克多数据副本间的数据不一致难题,同时依靠分布式特性天然解决系统扩展性与可用性问题。迈入新时代,数据库亟待解决全新痛点:如何整合多模态异构数据,以及Agent同时调用多异构数据库引发的AI幻觉、数据不一致、运行效率低下等问题。行业需通过底层技术,将多模态异构数据整合为统一的大型分布式系统,为Agent提供一致性数据底座,进而提升Agent运行效率、节省Token消耗、减少AI幻觉现象。
杨冰认为,软件行业正经历从“为人服务”到“为Agent服务”的根本性变革,这一变革催生了交互模式与商业模式的多重创新,例如支付宝AI付、Salesforce等厂商推出的无代码Headless交互模式。
杨冰分享了阿里与蚂蚁集团三大AI落地实践:蚂蚁灵光、蚂蚁阿福、淘宝AI购物助手。分别从海量小数据应用爆发带来的系统扩展性挑战、多分支短周期AI应用开发中测试评估环节的效率瓶颈、多模态数据混合存储与检索痛点三大维度,阐述OceanBase如何适配AI时代的数据处理需求。
“搭建一套AllinOne多模态存储底座来适配行业需求,是我们当前探索的新方向。”杨冰表示,“全新技术架构下,我们正在落地这套系统。英伟达CEO黄仁勋在2026GTC大会上提出,非结构化数据是AI的上下文。而深耕数据库行业多年我们深知,结构化数据才是企业业务运行的核心上下文,海量交易系统、业务系统均依托结构化数据搭建运行。”
过往行业普遍采用“先存储、后处理”的模式,数据湖技术已发展成熟。而搭建开放、实时、多模态、混合式的数据湖,仍是AI时代技术底座的核心课题。他介绍,目前OceanBase已着手构建这套全新底座:在检索层面实现多模态数据智能搜索与调取,打通结构化、非结构化、半结构化数据的融合存储能力,为企业提供一体化数据服务。所有技术架构均依托十余年沉淀的分布式底座搭建,保障蚂蚁阿福这类应用具备金融级底层支撑。企业各类数据均可实现安全可靠存储、高效运行调度与低成本存储部署。
对于行业未来趋势,杨冰引用古语“分久必合”作出解读:数据底座已从单一数据库,逐步演进至可支撑数据分析的数仓、可存储非结构化数据的数据湖。当下湖库一体新体系应运而生,融合数据湖与数据库双重特性,这也是OceanBase核心发力方向。同时他指出,两大核心因素正在推动“分久必合”的行业趋势:一是非结构化数据应用大规模爆发,二是非结构化数据实时处理需求持续攀升。
编辑:王晓伟
声明:新华财经(中国金融信息网)为新华社承建的国家金融信息平台。任何情况下,本平台所发布的信息均不构成投资建议。如有问题,请联系客服:400-6123115










