网易首页 > 网易号 > 正文 申请入驻

低调霸榜全球最难SQL榜单超两月,国产AI这次选择高调开源!

0
分享至

  • 金磊 发自 凹非寺
  • 量子位 | 公众号 QbitAI

不鸣则已,一鸣惊人。

没想到一个低调霸榜了全球最权威SQL榜单超过两个月的国产AI,这一次选择了高调开源



如此反差剧情的主角正是蚂蚁数科,在第二届CCF中国数据大会上,它正式宣布:

  • 开源旗下数据智能体关键技术——Agentar-SQL系列。

此次开源不仅包含实时文本转SQL(Text-to-SQL)框架的全套论文、代码、模型和使用指南,后期还将陆续开源数据库理解与挖掘、行业知识挖掘、实时多轮交互技术框架,覆盖意图理解、业务理解到数据理解的全链路数据能力。

如果你关注AI数据分析领域,大概率听说过BIRD-Bench。这是目前全球公认最具权威性的NL2SQL评测基准。

就在今年9月,蚂蚁数科的Agentar-Scale-SQL在BIRD榜单上以执行准确率(81.67%)和执行效率(77%),双料第一的成绩登顶一举超越了谷歌、亚马逊等国际科技巨头。



自然语言转SQL(NL2SQL)在实际落地中面临四大严峻挑战:理解模糊多义的人类口语、注入庞大的行业专业知识、解析复杂的数据库结构与关联,以及生成准确无误的复杂SQL语句。这些挑战意味着,简单的模型“套壳”远不足以满足企业级应用的可靠性与准确性要求。

蚂蚁数科的Agentar-SQL核心思想在于,不是追求单一“完美”的SQL生成,而是通过系统化工程方法,真正让AI赋能生产,让数据结果懂需求、懂业务。在某头部城商行试运营期间,蚂蚁数科Agentar SQL多个工具的平均查询准确率超92%,较传统查询方案提升超3倍。

但这样的成绩,还不足以形容蚂蚁数科。

一直以来,蚂蚁数科的AI发展可谓非常“低调”。如果深挖今年的动作会发现,蚂蚁数科的AI版图已经非常成熟与丰富,走出了一条中国AI“非常识”但又价值巨大的新路径。

蚂蚁数科CEO赵闻飙近日在生态伙伴大会上的一番话,道出了蚂蚁数科AI布局上的真实“野心”:

  • AI的真正价值不仅在于技术的先进性,更在于能否深入产业一线、解决实际问题。


△蚂蚁数科CEO赵闻飙

之所以会有这番言论,是因为这个AI诞生的地方,正是在金融行业这个最复杂、数据门槛最高的业务场景,它经受住了比任何公开榜单都严酷的考验——

从登榜到开源,从金融到各行各业,蚂蚁数科正在用一套务实的方法论,回答产业AI如何真正用起来。

从一场非共识的死磕说起

让我们先把时间拨回到2024年初。

那是百模大战打得最凶的时候,市面上的AI公司大多在做两件事:要么在刷各种通用榜单,证明自己的模型智商有多高;要么在做Chatbot,试图让AI变得更像一个陪聊伙伴。

但蚂蚁数科的CEO赵闻飙和他的团队的做法,却显得有些“格格不入”——

一头扎数据门槛最高、合规要求最严的金融领域,这个被普遍认为是AI落地的“深水区”。

这个战略从表面上来看是一点也不性感的,它意味着团队必须要与“两高一长”相伴:高风险、高投入、长回报周期。

因为这里没有“差不多”,只有“百分百”。一个错误的回答不仅仅是用户体验下降这么简单,更可能意味着巨额资金的损失,甚至是监管的红牌罚下。

金融场景的极端复杂性,体现在三个维度:

  • 数据高度敏感且孤岛化:客户资产、交易流水、风控规则等关键数据分散在多个系统,互不打通;
  • 业务逻辑极其严谨:如“重点客户”不是模糊标签,而是“本季度活跃度大于80分”的明确定义;
  • 合规要求近乎苛刻:所有AI推理必须可解释、可审计、可回溯,不允许“黑箱决策”。

每一项对AI来说都是老大难的问题。

换言之,一个AI若是能精准地搞定最难领域的问题,那它再身处别的领域时就会变得从从容容游刃有余。

但蚂蚁数科偏偏选择了死磕,事实证明,这场豪赌,他们赢了。

因为最新的成绩单显示:蚂蚁数科的服务已经覆盖了100%的国有股份制银行,以及超过60%的地方性商业银行。

可以说中国金融体系的毛细血管里,已经流淌着蚂蚁数科的代码。

不仅如此,他们还悄然跻身了IDC《中国智能体开发平台2025年厂商评估》的领导者象限,意味着在市场份额和技术实力上,他们已经站到了第一梯队。

但光有战略定力是不够的,AI发展到现在的阶段,更看重的好不好用。

在宁波银行,双方合作打造的智能化决策系统,便彻底打破了传统金融服务的知识孤岛。

过去,客户经理面对一个复杂的投资咨询,需要在多个系统间来回切换,答案常常是模糊的、滞后的。

新系统通过“规划-检索-推理”的智能机制,实现了从模糊匹配到精准推理的跨越。复杂问题回答准确率从68%跃升至91%,响应速度进入百毫秒级。

更关键的是,系统能清晰呈现推理过程与数据来源,在强监管的金融场景中实现AI黑箱白化。

上海银行推出的AI手机银行,则是另一种维度的革新。

它以对话即服务为核心,用户通过自然语言交互即可办理转账、理财咨询、养老金查询等业务。这不再是简单的功能堆砌,而是体验的重构,从“人找服务”到“服务找人”。

配合千人千面的个性化推荐与适老化设计,它已经成为了行业数智化转型的典型样本。

已经从金融级外溢到了产业级

金融领域的成功实践,为蚂蚁数科积累了可迁移的产业AI方法论,也推动其能力向更多民生领域延伸。

在南京,蚂蚁数科与南京公交联合打造的公交智能体小蓝鲸,便是这一能力外溢的典型案例。



它将金融领域验证过的“规划-检索-推理”逻辑,应用到了城市交通的复杂系统中。

从分析客流到生成线路,再到输出经济可行性报告,小蓝鲸展现的是一种通用的、可迁移的产业AI能力。

210路公交车的开通,可谓是一下子把之前这片区域的公交线网空白给填上了,单日最高客流达2168人次,老年卡使用占比近50%。

不仅如此,类似210路这样在AI建议下开通的公交,在南京已经有30多个,还新增了84个招呼站!



据悉,这是国内首次将AI智能体技术深度应用于公共交通调度系统,根据站点、客流、线路等多维数据分析,实现从经验决策到智能规划的全面升级。

能源领域,这种能力同样锋利。

蚂蚁数科的 EnergyTS 能源电力时序大模型,能够精准预测发电量和市场供需变化。

在投前决策环节,它能将原本需要2–3天的人工投资测算,缩短为十余分钟,决策效率提升超60倍,已助力协鑫能科、霍普等企业实现数智化升级。

由此可见,从最难的场景切入,延伸到更广的场景,用最硬的指标说话,这就是蚂蚁数科在过去一年里上演的非共识剧本。

还敢按效果付费

技术再牛,如果卖不出去,也是白搭。

在To B的软件市场,传统的收费模式无非两种:要么按项目制收费,要么是按订阅制收费。

但这两种模式都有痛点:甲方觉得我花了钱,万一效果不好怎么办?乙方觉得我投入了这么多人力,利润薄如刀片。

蚂蚁数科在付费模式上采取的做法也是一种非共识的打法——按效果付费。

这种模式,极大地降低了中小机构应用AI的门槛和风险。客户不再需要为不确定的技术前景买单,而是为确定的业务结果付费。

这就倒逼了技术提供商必须真正深入业务一线,理解客户的痛点,将技术能力转化为可量化的商业价值。这是一种对自身能力的极度自信,也是一种对产业伙伴的真诚负责。

要规模化地实现这种模式,单打独斗是行不通的,蚂蚁数科深谙这一道理,因此,生态共荣,成为它必然选择。

据了解,截至今年,蚂蚁数科已与300家合作伙伴建立深度合作,共同服务超13000家终端客户。

在这次的大会上,蚂蚁数科正式升级了“星澜计划”,从技术赋能、运营支持、商机共享、资金扶持四个维度,全面提升伙伴能力,推动整个生态的全域升级。



一位合作伙伴在现场分享,今年其30%的营收来自与蚂蚁数科的合作业务。这不仅仅是数字,更是市场对这套“技术+生态+商业化”组合拳的有力投票。伙伴们通过合作,沉淀出了一套AI赋能垂直场景的方法论,共同推动产业AI的规模化落地。

这种生态的视野,甚至延伸到了全球。

蚂蚁数科的技术方案,已服务南洋商业银行、渣打银行等超百家海外金融机构。今年10月,其入选香港金融管理局生成式AI沙盒项目,为沙盒提供AI智能体服务与AI安全产品。

这标志着源自中国严苛金融场景打磨出的AI方案,正获得国际市场的认可,展现出强大的全球竞争力。

在通用AI的喧嚣之后,产业AI的务实革命才刚刚开始;而这场革命的主角,必将是那些敢于用效果说话的实干者。

— 完 —

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
杜海涛瘦80斤后接机沈梦辰,主动求合影被拒:拍一个嘛!

杜海涛瘦80斤后接机沈梦辰,主动求合影被拒:拍一个嘛!

东方不败然多多
2026-04-07 17:08:36
女子赴发小婚礼穿瑜伽裤,打扮过于火辣,网友直呼跟没穿似的

女子赴发小婚礼穿瑜伽裤,打扮过于火辣,网友直呼跟没穿似的

一盅情怀
2026-03-16 17:28:45
太浪漫了!小伙苦寻18次偶遇的短发女孩,成都东站多个大屏被炸锅

太浪漫了!小伙苦寻18次偶遇的短发女孩,成都东站多个大屏被炸锅

火山詩话
2026-04-07 05:20:23
韩国女星怀孕后,每天和丈夫一起洗澡,节目画面公开后惊呆全场

韩国女星怀孕后,每天和丈夫一起洗澡,节目画面公开后惊呆全场

好贤观史记
2026-04-07 11:26:38
美俄曾联手阻挠,如今图160重启生产线,俄对华求购态度仍然未变

美俄曾联手阻挠,如今图160重启生产线,俄对华求购态度仍然未变

小莜读史
2026-04-04 11:03:12
杨振宁去世5个月后,49岁翁帆现状:剪了头发染了色,仍独居国内

杨振宁去世5个月后,49岁翁帆现状:剪了头发染了色,仍独居国内

照见古今
2026-03-26 19:06:28
搜救变“送宝”!美军C130残骸里,竟挖出AH6“小鸟”核心机密

搜救变“送宝”!美军C130残骸里,竟挖出AH6“小鸟”核心机密

安安说
2026-04-06 14:55:17
张雪母亲身份曝光:厦大中文系毕业 曾为生计远赴海南工作

张雪母亲身份曝光:厦大中文系毕业 曾为生计远赴海南工作

快科技
2026-04-07 15:57:06
谷正文晚年直言:台湾落网的中共地下党中,唯有张志忠是真汉子

谷正文晚年直言:台湾落网的中共地下党中,唯有张志忠是真汉子

唠叨说历史
2026-03-02 13:39:46
紧急突发!夺岛大战!还是开始了!

紧急突发!夺岛大战!还是开始了!

大嘴说天下
2026-04-07 21:14:37
男人的生理需求能有多难忍?网友:我对我老公只有动物本能

男人的生理需求能有多难忍?网友:我对我老公只有动物本能

带你感受人间冷暖
2026-02-07 03:58:56
越南的恨,为何唯独留给了中国

越南的恨,为何唯独留给了中国

民间胡扯老哥
2026-04-05 21:51:40
7号收评:三大指数集体收涨!所有人都注意了,大盘后市或这样走!

7号收评:三大指数集体收涨!所有人都注意了,大盘后市或这样走!

春江财富
2026-04-07 15:17:13
特朗普再次推迟对伊朗的最后通牒

特朗普再次推迟对伊朗的最后通牒

参考消息
2026-04-06 10:27:04
本赛季五大联赛球队进球榜:拜仁43场146球第1,巴萨127球第2

本赛季五大联赛球队进球榜:拜仁43场146球第1,巴萨127球第2

懂球帝
2026-04-07 22:10:11
中东传来大消息!伊朗改变决策,俄方宣告参战,法国想中方入局!

中东传来大消息!伊朗改变决策,俄方宣告参战,法国想中方入局!

健身狂人
2026-04-06 15:25:03
高效!阿尔瓦雷斯7次欧冠淘汰赛首发斩6球3助攻

高效!阿尔瓦雷斯7次欧冠淘汰赛首发斩6球3助攻

懂球帝
2026-04-07 07:28:11
60天的胎儿流产出来后的样子,看完让人揪心,网友:不忍心看!

60天的胎儿流产出来后的样子,看完让人揪心,网友:不忍心看!

大果小果妈妈
2026-04-07 20:11:14
重磅:文班亚马因伤退出比赛,或缺席2-4周,马刺的天塌了

重磅:文班亚马因伤退出比赛,或缺席2-4周,马刺的天塌了

姜大叔侃球
2026-04-07 10:22:29
市民吐槽深圳郊野径成越野胜地,城管回应:全域严格禁止

市民吐槽深圳郊野径成越野胜地,城管回应:全域严格禁止

南方都市报
2026-04-07 20:45:14
2026-04-08 00:15:00
量子位 incentive-icons
量子位
追踪人工智能动态
12434文章数 176445关注度
往期回顾 全部

科技要闻

满嘴谎言!OpenAI奥特曼黑料大起底

头条要闻

特朗普恐吓4小时摧毁伊朗 伊朗称"打穿"海法未见拦截

头条要闻

特朗普恐吓4小时摧毁伊朗 伊朗称"打穿"海法未见拦截

体育要闻

官宣签约“AI球员”,这支球队被骂惨了...

娱乐要闻

女首富陈丽华离世 被曝生前已分好遗产

财经要闻

10万亿财政转移支付,被谁拿走了?

汽车要闻

不止是大 极狐首款MPV问道V9静态体验

态度原创

时尚
旅游
房产
游戏
教育

120元和120分钟,哪个更奢侈?

旅游要闻

三天迎客超四万人次,TOP中央公园成清明假期市民“微度假”热门地

房产要闻

重磅!三亚拟出安居房新政!

叫得越凶分越高!Steam"狗叫模拟器"5月1日抢先体验

教育要闻

好的亲子关系,父母只需做好这几点 #家长必读 #孩子教育

无障碍浏览 进入关怀版