网易首页 > 网易号 > 正文 申请入驻

IBM Db2语义AI集成技术:SQL DI Pro正式发布

0
分享至


企业客户在数据主权、合规性和监管要求方面面临的挑战日益增加,这使得AI系统的集成变得愈发重要。为满足上述需求,IBM SQL Data Insights Pro(SQL DI Pro)于2026年3月正式上线,为z/OS平台上的Db2数据库引入了语义搜索、相似性发现、异常检测以及结构化与非结构化数据的统一分析能力。SQL DI Pro将AI能力直接内嵌至Db2中,从而有效降低客户在将数据迁移至其他分析框架时所面临的隐私泄露、合规违规及数据不一致等风险。从研究角度而言,SQL DI Pro是AI与数据系统融合方向上的一款开创性产品,为后续更深层次的AI系统集成研究打开了大门。

该技术由IBM研究团队负责构思与原型开发,将传统SQL从基于语法的查询方式扩展为AI驱动的模式发现,使开发者和数据分析师能够从结构化与非结构化数据中挖掘出以往难以乃至无法获取的洞察信息。

IBM Db2 for z/OS是一款关键任务级企业关系型数据库管理系统,深受全球众多大型企业机构的信赖。尽管存储在Db2 for z/OS中的数据内容丰富、体量庞大,但随着数据规模与复杂度的持续增长,从中提取有价值的洞察变得愈发困难。

跨业务实体的相似性检测、企业交易中的异常检测以及数据驱动的决策建议等应用场景,均需要超越传统SQL的能力支撑,而仅凭常规关系型查询难以实现这些目标。

通过将先进的语义分析能力直接嵌入Db2 for z/OS,SQL DI Pro可实现以下优势:

更深入、更直观的数据理解

降低对外部数据处理管道的依赖

减少运营成本与复杂度

更便捷地满足数据主权与治理合规要求

SQL DI Pro的技术基础

SQL DI Pro构建于同样由IBM研究团队开发的SQL Data Insights(SQL DI)所奠定的基础之上。SQL DI引入了将结构化关系型数据嵌入高密度向量表示的理念,支持直接在Db2内部执行基于相似性的操作,如聚类分析和实体比较。通过将数据行转化为潜在空间中的向量,SQL DI使关系型数据的分析超越了精确匹配谓词的局限,从而支持对业务数据实体进行近似推理。

SQL DI Pro在此基础上进行了大幅扩展,以充分捕获非结构化数据中的语义内涵。在企业工作负载中,大量有价值的信息存在于自由格式文本字段中,例如客户备注、交易描述、理赔记录和合规文档。这些字段通常篇幅较长、内容稀疏或语言结构复杂,难以通过传统的基于属性的编码方式进行有效建模。SQL DI Pro集成了IBM的现代编码器模型,能够为包含长篇非结构化文本的列生成高质量的嵌入向量,从而实现超越传统结构化数据分析的语义理解能力。

SQL DI Pro通过以下方式将非结构化列嵌入与结构化列嵌入相融合,构建出统一的语义层:

非结构化数据的列级嵌入:长文本列通过基于Transformer的编码器进行处理,生成密集的语义向量,这些嵌入能够捕获文本字段间的上下文信息、主题相似性及隐性关联关系。

结构化数据嵌入:表格属性继续采用专为关系型数据设计的专用模型进行编码,保留数值关系、类别语义及列间依赖关系。

对齐至共享潜在空间:结构化与非结构化嵌入经过归一化处理后,被映射至统一的向量空间,支持跨模态的直接比较与联合推理。

这种统一方案使用户能够在Db2 for z/OS中对多样化数据类型进行端到端的AI驱动发现,同时针对每种数据模态采用最适合的模型。

内置SQL函数与增量重训练

SQL DI Pro引入了四个内置SQL函数以支持语义分析,这些函数可嵌入SQL语句中实现统一的数据处理。

此外,SQL DI Pro还包含一种增量重训练算法,在新数据引入时无需对数据库嵌入进行代价高昂的全量重训练。该方案支持随着新数据的到来或现有数据的变更实时更新嵌入,与全量重训练相比,显著降低了计算与处理开销。这确保了数据库嵌入始终保持最新状态,使SQL DI Pro的高级语义搜索能够持续反映不断演变的数据集中的最新规律。

硬件加速与未来研究方向

SQL DI Pro借助IBM Z Telum处理器的片上AI能力,结合IBM研究团队开发的IBM Z深度学习编译器(zDLC)——一套专为z架构优化深度学习工作负载的编译器框架——来加速嵌入生成与模型推理过程。

这一加速能力是使语义查询处理在Db2 for z/OS内部得以实际运行的核心所在。嵌入生成、相似性评分、聚类分析及异常检测等操作在面对大型企业数据集时计算量极为密集。通过针对IBM Z AI加速能力对上述工作负载进行优化,SQL DI Pro将AI能力引至关键任务数据侧,同时降低了将敏感信息迁移至外部分析环境的需求。

IBM研究团队还在探索将IBM Z与Spyre加速器配合使用,以进一步提升SQL DI Pro工作负载的加速能力。相关研究包括在多卡配置下使用Spyre,使语义处理任务能够跨多个加速器并行执行,从而提高吞吐量与可扩展性。团队还在探索Telum与Spyre的混合集成方案,使工作负载能够根据延迟、规模、数据局部性及系统利用率等因素,自动选用最合适的加速资源。这一混合加速方向有望帮助SQL DI Pro在最大化性能与资源效率的同时,充分发挥IBM Z在安全性、治理能力、高可用性及数字主权方面的固有优势。

Q&A

Q1:SQL DI Pro和原来的SQL DI有什么区别?

A:SQL DI主要将结构化关系型数据嵌入为密集向量,支持相似性聚类和实体比较。SQL DI Pro在此基础上大幅扩展,加入了对非结构化数据(如客户备注、交易描述等长文本字段)的语义嵌入能力,并通过统一向量空间将结构化与非结构化嵌入对齐,实现跨模态联合推理,语义理解能力显著提升。

Q2:SQL DI Pro的增量重训练算法有什么优势?

A:传统方式在引入新数据时需要对所有嵌入进行全量重训练,计算代价极高。SQL DI Pro的增量重训练算法支持在新数据到来或现有数据变更时仅对相关部分进行更新,大幅降低了计算与处理开销,同时保证嵌入始终反映最新的数据规律,确保语义搜索结果的准确性和时效性。

Q3:SQL DI Pro如何利用IBM Z硬件进行加速?

A:SQL DI Pro借助IBM Z Telum处理器内置的片上AI能力,结合IBM Z深度学习编译器(zDLC)对嵌入生成、相似性评分、聚类和异常检测等计算密集型操作进行优化加速。未来还计划引入Spyre加速器,支持多卡并行处理,并探索Telum与Spyre的混合加速方案,以进一步提升吞吐量、可扩展性和资源利用效率。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
阿里最高层终于发飙了:再这么搞下去,阿里的人心就散了

阿里最高层终于发飙了:再这么搞下去,阿里的人心就散了

侃故事的阿庆
2026-06-11 00:27:25
“她还是个孩子”!7岁女儿朝老人竖中指,外国妈妈反手怒怼:她没教养?那是你活该

“她还是个孩子”!7岁女儿朝老人竖中指,外国妈妈反手怒怼:她没教养?那是你活该

北美省钱快报
2026-06-11 05:06:32
高三学生伙同他人冒充警察打人,拘留期涉高考15天改为12天

高三学生伙同他人冒充警察打人,拘留期涉高考15天改为12天

大象新闻
2026-06-11 13:46:04
央视直播乒乓球时间表:6月11日CCTV5直播国乒!国乒战张本美和大藤沙月

央视直播乒乓球时间表:6月11日CCTV5直播国乒!国乒战张本美和大藤沙月

好乒乓
2026-06-11 12:21:28
票房会破3.5亿?看完《火遮眼》我说:谢苗把动作片荣光打回来了

票房会破3.5亿?看完《火遮眼》我说:谢苗把动作片荣光打回来了

知法而形
2026-06-11 21:22:14
革命卫队懵了:仗还没打完,伊朗竟然被以色列代理人包围了

革命卫队懵了:仗还没打完,伊朗竟然被以色列代理人包围了

老黯谈娱
2026-06-09 11:58:43
杭州面馆老板辟谣2188元一碗面:门店菜单最贵一碗598元

杭州面馆老板辟谣2188元一碗面:门店菜单最贵一碗598元

先锋新闻
2026-06-04 21:26:04
15位明星一跑就穿帮?基努里维斯被吐槽多年

15位明星一跑就穿帮?基努里维斯被吐槽多年

生活观察员啊
2026-06-11 00:55:10
明天会不会大跌甚至暴跌?我直接说结论,周五6.12开盘前听我一言

明天会不会大跌甚至暴跌?我直接说结论,周五6.12开盘前听我一言

夜深爱杂谈
2026-06-11 21:58:02
“京东方”,要反转了?

“京东方”,要反转了?

木禾黑猫
2026-04-21 21:43:28
曼城1.2亿英镑报价再遭拒,英格兰国脚争夺战升级

曼城1.2亿英镑报价再遭拒,英格兰国脚争夺战升级

元气满分吖
2026-06-12 02:00:30
董路透露《给阿嬷的情书》团队已找他,中国足球小将的故事或拍成电影,双方暂未公布合作细节与影片筹备时间表

董路透露《给阿嬷的情书》团队已找他,中国足球小将的故事或拍成电影,双方暂未公布合作细节与影片筹备时间表

三湘都市报
2026-06-11 17:34:34
娱评|唱功仅粉丝可见的谢娜们,收手吧

娱评|唱功仅粉丝可见的谢娜们,收手吧

澎湃新闻
2026-06-10 19:34:40
脱亚入欧失败了?除了中国,日本是世界上唯一一个使用汉字的国家

脱亚入欧失败了?除了中国,日本是世界上唯一一个使用汉字的国家

南宗历史
2026-05-13 02:35:44
75岁姜昆近况:与46岁单身爱女相依为命,日子过得让人羡慕

75岁姜昆近况:与46岁单身爱女相依为命,日子过得让人羡慕

娱说瑜悦
2026-04-04 15:38:01
不满出场时间曝光,斯洛特下课救了他

不满出场时间曝光,斯洛特下课救了他

篮坛第一线
2026-06-12 00:12:13
这洋妞长得真不大,就是白胖劲,真符合咱的口味

这洋妞长得真不大,就是白胖劲,真符合咱的口味

飛娱日记
2026-04-14 08:29:26
毛文龙到底该不该杀?他首先是一个军阀,其次是大明的军阀

毛文龙到底该不该杀?他首先是一个军阀,其次是大明的军阀

掠影后有感
2026-06-11 09:26:16
1954年国庆,赫鲁晓夫送了1吨纯金国徽,毛主席:他这是行贿来了

1954年国庆,赫鲁晓夫送了1吨纯金国徽,毛主席:他这是行贿来了

鹤羽说个事
2026-06-10 22:52:59
上海青少年抑郁率全国第一:中产父母的精致育儿,正在毁掉下一代

上海青少年抑郁率全国第一:中产父母的精致育儿,正在毁掉下一代

教师吧
2026-06-11 16:49:53
2026-06-12 02:47:00
至顶科技 incentive-icons
至顶科技
科技产业媒体与 AI 产业服务机构
19265文章数 49711关注度
往期回顾 全部

科技要闻

淘宝、京东、拼多多、抖音、小红书被约谈

头条要闻

中方对菲国防部长特奥多罗及其亲属实施制裁

头条要闻

中方对菲国防部长特奥多罗及其亲属实施制裁

体育要闻

比起总冠军,更大的悬念成了FMVP?

娱乐要闻

《花少8》阵容大揭秘!秒杀前一季

财经要闻

干细胞生意:17万一针的希望

汽车要闻

传祺向往M8 PHEV L/E8 PHEV上市 限时落地价16.84万起

态度原创

本地
亲子
旅游
房产
公开课

本地新闻

世界杯还没开始,苏超已经火到爆梗

亲子要闻

历经两年治疗,无精子症患者家庭在沪迎健康宝宝

旅游要闻

“古建游”出圈走红见证年轻人的文化自觉

房产要闻

科城·美林学筑5月领跑崖州湾:成交价、销售套数、转化率三项第一

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版