网易首页 > 网易号 > 正文 申请入驻

Google把AI塞进DataFrame

0
分享至

数据科学家平均每周花4.7小时写胶水代码——不是分析,是把A格式转成B格式、等API响应、处理超时重试。BigQuery DataFrames(BigFrames)的新功能AI Functions,直接把这段苦差事砍到了3行。

这不是给Jupyter Notebook加了个插件,是把整个LLM调用链塞进了pandas语法。

从"写循环"到"点方法":语法糖还是架构革命?

传统做法里,对DataFrame做情感分析需要:拆行→调API→处理Rate Limit→拼回DataFrame→处理格式错乱。1000行数据跑完,咖啡凉了,上下文也丢了。

BigFrames的解法很产品经理思维:既然用户已经会用df['col'].apply(),那就让AI调用长得一模一样。df['review'].ai.extract_sentiment(),返回值直接是新的DataFrame列。背后 transpiling(转译)成BigQuery SQL,在Google的基础设施上分布式跑完,用户无感知。

Google Cloud开发者布道师在官方博客打了个比方:标准pandas是为"生成式AI时代之前"设计的,而BigFrames承认了一个事实——现代数据工作流里,LLM调用应该和groupby()一样基础。

目前支持的AI Functions包括:文本生成(ai.generate_text)、情感提取(ai.extract_sentiment)、结构化数据解析(ai.parse)、翻译(ai.translate)。全是高频场景,没有凑数的。

规模诅咒:为什么"能跑"和"能投产"是两件事

demo里跑1000行很爽,真实业务里1000万行怎么办?这是大多数"AI+DataFrame"工具的断点——它们解决了语法问题,没解决规模问题。

BigFrames的隐藏设计在这里:同一套代码,小数据时本地pandas执行,数据量上去后自动切到BigQuery分布式引擎。不需要改代码,不需要迁移数据,不需要学习新API。用Google的话说,"future-proof path"——你的数据增长时,代码不用重写。

这个架构选择很Google:不跟用户争"要不要上云",而是让上云变得无感。竞争对手比如PandasAI、LangChain的DataFrame集成,大多停在"本地运行+手动调API"层,规模天花板明显。

开源策略与生态卡位

BigFrames是Apache 2.0协议开源,GitHub仓库公开维护。这个选择有算计:数据科学社区对vendor lock-in(厂商锁定)极度敏感,开源能换信任;同时Gemini API的调用费用是真实收入,开源代码只是获客漏斗的顶部。

技术实现上有个细节值得玩味:transpiling到SQL而不是直接生成执行计划。这意味着BigFrames理论上可以支持其他SQL引擎,虽然目前只优化了BigQuery路径。保留扩展性,是Google Cloud产品的老套路。

社区反馈里,Reddit r/MachineLearning的一条高赞评论很典型:「终于不用在pandas和Vertex AI之间来回搬运数据了,我的笔记本风扇谢谢Google」。另一条则保持警惕:「等它支持其他模型提供商再说,现在绑定Gemini还是太重」。

谁该现在上车,谁该再等等

适合的场景很明确:已经在用Google Cloud、数据量在10GB-10TB之间波动、需要快速原型验证的中小团队。特别是那些"今天跑报表,明天可能要跑全量用户"的不确定性场景,自动扩缩容能省大量重构成本。

需要谨慎的情况:强合规要求数据不出本地、已经在深度使用AWS/Azure生态、或者需要非Google模型(Claude、GPT-4等)的特定能力。虽然BigFrames架构上留了扩展口,但现阶段Gemini是唯一一等公民。

一个容易被忽略的细节:AI Functions的定价除了BigQuery计算费用,还包含Gemini API调用费。高频文本生成场景下,成本可能超预期。建议先用BigFrames的remote function功能接自己的模型端点,跑通后再切官方AI Functions比价。

Google Cloud开发者布道师在博客结尾放了一句:「我们设计BigFrames时,假设2025年的数据科学家会把LLM调用当作基础设施,而不是奢侈品」。这句话的潜台词是——他们赌的不只是这个产品,是整个工作流的范式迁移。

你的DataFrame里,有多少列数据其实该用AI处理、却一直因为"太麻烦"而被搁置?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
70架运输机出动,以色列迅速回血,巴铁大军进驻沙特,伊朗上当?

70架运输机出动,以色列迅速回血,巴铁大军进驻沙特,伊朗上当?

闻识
2026-04-13 10:17:52
姚敏学同志逝世

姚敏学同志逝世

新京报政事儿
2026-04-13 09:24:06
特朗普:将调集更多扫雷艇前往霍尔木兹海峡

特朗普:将调集更多扫雷艇前往霍尔木兹海峡

界面新闻
2026-04-13 07:26:35
意外!蓉城战胜国安队是不是意味着俱乐部已露出冠军相,引发热议

意外!蓉城战胜国安队是不是意味着俱乐部已露出冠军相,引发热议

张丽说足球
2026-04-13 14:23:04
NBA季后赛对阵出炉:湖人vs火箭 掘金vs森林狼 东部不如西部激烈

NBA季后赛对阵出炉:湖人vs火箭 掘金vs森林狼 东部不如西部激烈

醉卧浮生
2026-04-13 11:09:12
我国肝癌高发,茶叶是背后的祸因?医生劝告:3种茶才是帮凶

我国肝癌高发,茶叶是背后的祸因?医生劝告:3种茶才是帮凶

岐黄传人孙大夫
2026-04-12 06:30:03
中国工程院院士、苏州大学原校长,加盟复旦大学

中国工程院院士、苏州大学原校长,加盟复旦大学

双一流高校
2026-04-13 00:10:11
48集烧脑谍战大剧来袭,丁勇岱智斗劲敌,猎杀时刻一触即发!

48集烧脑谍战大剧来袭,丁勇岱智斗劲敌,猎杀时刻一触即发!

乐枫电影
2026-04-13 14:55:29
茶水是心梗“加速器”?医生:不想心脏出问题,这几种茶一定少喝

茶水是心梗“加速器”?医生:不想心脏出问题,这几种茶一定少喝

健康之光
2026-03-28 16:00:09
68岁赵本山现身海南悠闲逛街,打扮很潮流!买好几袋奢侈品好惬意

68岁赵本山现身海南悠闲逛街,打扮很潮流!买好几袋奢侈品好惬意

娱乐团长
2026-04-11 15:28:06
美伊谈崩当天,一架中东专机直飞中国,将待满3日,伊朗戏耍美军

美伊谈崩当天,一架中东专机直飞中国,将待满3日,伊朗戏耍美军

纪中百大事
2026-04-13 14:36:43
荨麻,不要再读 xún má 了!丢不那个人!

荨麻,不要再读 xún má 了!丢不那个人!

未央看点
2026-04-12 00:02:22
在上海生活的毛剑卿,银行负责人妻子很漂亮,如今已是助理教练

在上海生活的毛剑卿,银行负责人妻子很漂亮,如今已是助理教练

米果说识
2026-04-13 14:33:48
国家一级女演员陈丽云被逮捕!

国家一级女演员陈丽云被逮捕!

许三岁
2026-03-28 09:24:30
美媒文章:美国11艘现役航母都在哪里?(四)

美媒文章:美国11艘现役航母都在哪里?(四)

参考消息
2026-04-13 11:23:06
美伊谈判破裂,留下三个新悬念 | 京酿馆

美伊谈判破裂,留下三个新悬念 | 京酿馆

新京报评论
2026-04-13 10:35:44
国乒最新情报:林诗栋连夜返成都,温瑞博赴伦敦,老将王艺迪掉队

国乒最新情报:林诗栋连夜返成都,温瑞博赴伦敦,老将王艺迪掉队

鲸探所长
2026-04-13 14:34:52
48岁舒淇新片杀疯了!腹部比水平尺还平,这状态谁敢信快50了?

48岁舒淇新片杀疯了!腹部比水平尺还平,这状态谁敢信快50了?

动物奇奇怪怪
2026-04-12 12:19:30
真惨!连跌两个月后又一字跌停,股价还有3.21元,3万股东踩雷

真惨!连跌两个月后又一字跌停,股价还有3.21元,3万股东踩雷

财经智多星
2026-04-13 11:59:35
医生再三告知:老人同房时,需要注意5件事,不然可能麻烦就大了

医生再三告知:老人同房时,需要注意5件事,不然可能麻烦就大了

路医生健康科普
2026-04-10 15:35:03
2026-04-13 15:39:00
Ping值焦虑
Ping值焦虑
有态度网友ytd
1252文章数 22关注度
往期回顾 全部

科技要闻

传荣耀与字节跳动接洽“豆包手机”合作

头条要闻

女子名下多出一套上海房产很苦恼:丈夫去世 房子没了

头条要闻

女子名下多出一套上海房产很苦恼:丈夫去世 房子没了

体育要闻

一支球队不够烂,也是一种悲哀

娱乐要闻

贾玲减重后现身冯巩生日宴 身材未反弹

财经要闻

起底AI"造黄"灰产:19.9元"一键脱衣"

汽车要闻

不止命名更纯粹 领克10/10+要做纯电操控新王

态度原创

游戏
数码
亲子
教育
公开课

《生化9》里昂雕像引热议:半裸舔腋下 玩家吵翻天!

数码要闻

高管亲自放风 何刚暗示华为 WATCH FIT 5 Pro即将发布

亲子要闻

郭碧婷传授备孕经验,二胎顺转剖后,整个人废了,尤其是肢体上

教育要闻

2025高考数学第一题,平均数?小学生也会

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版