OceanBase首次详解Data×AI战略,关键词:一体化、Data×AI
创始人
2025-05-17 21:48:39
0

升级AI战略后的OceanBase迎来了首次开发者大会。5月17日在OceanBase第三届开发者大会上,OceanBase发布面向AI的应用产品PowerRAG,该产品提供开箱即用的RAG应用开发能力,是OceanBase面向AI时代的探索之一。作为AI战略一号位、CTO杨传辉表示,OceanBase正致力于构建Data×AI能力,面向AI时代推动一体化数据库向一体化数据底座的战略演进。此前,CEO杨冰曾通过全员信宣布公司全面进入AI时代。

蚂蚁集团CTO何征宇在大会现场表示,蚂蚁集团将支持OceanBase在金融、医疗、生活等蚂蚁AI的核心场景的突破,支持OceanBase去实践DataxAI的理念和架构创新。同时继续支持OceanBase开源开放,把在Data×AI上的能力逐渐开放给行业,为AGI的梦想添砖加瓦。

从一体化数据库向一体化数据底座演进

AI时代带来了新的数据难题,已成为行业共识。IDC报告指出,受生成式AI等技术驱动,预计2028年全球新生成数据量规模将达到393.9ZB,其中企业数据规模和增速尤为凸显。于企业而言,数据仓库的容量已实现质的飞跃,结构化数据存储规模“突破PB级迈向EB级”成为新常态,这给数据存储、管理与分析带来严峻挑战。

蚂蚁集团CTO何征宇也在分享中指出,海量的互联网数据成就了今天的大模型,但大模型幻觉问题的源头也是数据问题。数据决定着大模型的能力上限,且依旧有四大挑战:一是数据的获取成本显著增加,二是严谨的行业数据稀缺且流动困难,三是多模态数据需要更强的处理能力,四是数据的质量评估难。

面对行业的真实需求,OceanBase正在大胆探索。杨传辉认为,作为一个一体化分布式数据库,OceanBase已经具备了一定的AI时代数据处理能力,如分布式有效应对海量数据的存储计算、多模融合统一处理不同结构数据、TP/AP一体化实现混合事务和实时分析处理。但大模型落地产生价值的核心在于数据与模型的一体化融合,这也是OceanBase提出的构建Data×AI能力的关键。

基于这一能力,OceanBase致力于从一个一体化数据库向一个一体化数据底座演进,通过一套引擎同时支持TP/AP/AI混合负载,支持向量数据库,实现SQL与AI的混合检索,这背后涉及OceanBase在Data与AI领域的工程与产品能力。

PowerRAG发布,提供开箱即用的RAG应用开发能力

在杨传辉描绘的一体化数据底座版图中,OceanBase期望在未来实现从算力、基础设施,到平台层、应用层、交付形态的全方位布局。

此次大会上,OceanBase首次发布面向AI的应用产品PowerRAG,打造AI驱动的开箱即用的RAG服务。

杨传辉介绍,传统RAG应用常用开发模式包括组件森林开发模式、RAG平台模式等,但存在开发周期长、维护成本高、灰箱调试困难、性能难以优化等问题。

OceanBase PowerRAG提供开箱即用的RAG应用开发能力,打通应用开发数据层、平台层、接口层与应用层的全流程,提供Document(文档)和 Chat(对话)两个核心API接口,帮助用户实现文档知识库、智能对话、图像比对、数据分析等多种AI应用场景的快速开发。

“致力于成为AI时代的一体化数据底座,PowerRAG是OceanBase在应用层面探索的第一步,未来还将在应用层面、平台层面不断突破。”杨传辉表示。

此外,过去十五年OceanBase诞生于双11的海量交易场景并在蚂蚁集团的金融场景中经受磨砺打磨技术,未来,蚂蚁集团也将继续向OceanBase开放核心AI场景,帮助OceanBase进一步攻坚AI关键能力,实现开放开源,为行业提供更多的AI创新服务。

向量性能已达开源向量数据库业内的领先水平

作为原生分布式数据库,OceanBase原本就具有的企业级分布式数据库能力为AI时代的海量数据处理分析打下基础。在支持AI应用落地的核心基础设施——向量性能、混合检索等层面,OceanBase也在持续探索,进一步加强SQL+AI能力。

大会现场,基于基准测试工具VectorDBBench,采用Performamce768D1M测试数据集,OceanBase与业内三款领先的开源向量数据库进行性能跑分测试。结果显示,OceanBase的向量性能已经达到开源向量数据库业内的领先水平。

面对AI时代的海量数据,OceanBase还引入BQ量化算法(HNSW+BQ),大幅降低向量场景的内存需求;引入针对JSON半结构化数据的压缩能力,降低AI场景中的半结构化数据存储成本。根据测试结果,在同等召回率与性能的情况下,引入BQ量化算法能够实现内存成本较引入前降低 95%,而在TPC-H 10G数据集上,OceanBase的JSON压缩比可达 MongoDB 的3倍。

此外,OceanBase已具备面向多种数据模型的混合检索能力。在最新版本中,OceanBase混合检索性能进一步增强,通过丰富的执行策略、自研的向量算法库、内核级多模混合查询等实现更快、更准、更易用的混合检索。

目前,OceanBase已被客户应用于多个AI相关场景的开发,如联通软研院基于OceanBase打造AI助手,in银泰商业则基于OceanBase打造零售业智能问数平台等。

相关内容

热门资讯

汪小菲新婚又刮大风!是历史还是... 头婚有妖风,二婚又遇妖风,网友都在说,汪小菲跟马筱梅,一定要好好守护自己的婚姻,汪小菲千万不要让历史...
豆瓣8.7分!“亚洲顶级恶女”... 还记得栗山千明吗?《杀死比尔》中那位制服美少女杀手,齐刘海、黑长直,长相清纯,眼神凶狠,抡起一记流星...
《人生若如初见》,心中的辫子才... 你们这个剧怎么不按套路出牌?以为是来表白了,结果居然是施暴?以为整天嚷嚷着救天下的人要爬着救人了,结...
17岁女演员戴“230万元高价... 2025.05.17本文字数:1717,阅读时长大约3分钟近日,演员黄杨钿甜佩戴高价奢侈品耳环事件,...
40集古装权谋剧今晚央视首播,... 现在的电视剧市场还有什么能撩动人心?不得不说最近几年好剧不少,单说2024年就有不少真正的大爆款,像...
未播先火的年代剧,央视力挺,这... 方婉之的起点,是个被抛弃在山林里的婴儿。没有金汤匙,没有宠爱呵护,只有养母的寒酸小屋和后来的风风雨雨...
《刑警的日子》大结局:刘子明与... 在大结局之前,刘子明与父亲解开了二十年的心结,终于实现了父子和解。刘子明误解了父亲整整二十年,直到此...
TVB年度巨制即将播出!视后佘... 刑侦12|主席许涛亲赴深圳支持 视后佘诗曼惊喜现身撑林保怡 由腾讯视频及TVB联合製作的重头剧《刑...
《绝密较量》大结局太离谱:杨光... 高圆圆、张鲁一主演的电视剧《绝密较量》大结局了,最后的剧情其实还是相对比较精彩的,特别是詹姆斯的局,...
因尺度争议爆火,这5部成人神作... 今天推荐一张大家喜欢的“尺度”剧单给大家。每一部都值得通宵去看,而且最爽的是不用等更——《斯巴达克斯...
庆幸吧,黄杨钿甜是去了娱乐圈,... 最近,黄杨钿甜在成人礼上戴230万耳环的事引起广泛关注,这瓜和董小姐的瓜无缝衔接,让吃瓜群众目不暇接...
官宣首位星推官,甜啦啦的“产品... 新茶饮品牌甜啦啦官宣接连推出新品“西瓜爽爽桶”“青梅爽爽桶”。此次甜啦啦推出的爽爽桶产品,为提升品牌...
一生一世:延续《周生如故》热度... 文/苏小妹#一生一世2021年,任嘉伦主演的古装剧《周生如故》爆红,为他圈粉不少。因为该剧热度空前,...
《绝密较量》结局:谢小曼一生被... 谢汝君醒过来了,同时也带来了一个惊天秘密。赵亚苧是自己人。赵亚苧和谢汝君是单线联系的上下级。自从谢汝...
《折腰》无对手,只是邓科VS林... 王母仙药+刘宇宁腹肌,直接送《折腰》热度破29000。有先婚后爱有权谋,有笑料还有美色,《折腰》剧情...
有效去“班味”还得看孙俪! 姐妹们!孙俪的新剧《蛮好的人生》大结局都看了吗?作为四月最争气的职场剧,它可是悄咪咪拿下了双台收视冠...
汪小菲今日二婚宴,大风天气复刻... 今天,汪小菲马筱梅在北京四合院举办了婚礼,办得很低调。14年前,头婚斥巨资,在三亚的“世纪婚礼”因台...
《刑警的日子》文君大结局:潜伏... 追完《刑警的日子》,观众纷纷表示大结局太反转,尤其是那个一直被关在档案室、看起来不起眼的女警文君,竟...
好刺激️三大平台“王者剧”擂台... 《时间多心眼小,抄袭洗稿必举报,各大平台都有号》爱奇艺、优酷、腾讯视频推出“王炸”大剧,题材有古装权...
全世界都在偶遇吴彦祖,街头邂逅... 他的祖父当年曾在上海打拼,他自己也希望在家族起源的上海开启新机会。文 |竹里吴彦祖最近非常活跃。三天...