网易首页 > 网易号 > 正文 申请入驻

一个人搭建AI旅行推荐系统:从模型到上线的完整复盘

0
分享至

旅行规划这件事,本质上是个信息整合的苦力活。你要打开七八个标签页,比价、看评价、查攻略,最后把碎片信息手动拼成一个决策。Nomova.ai的作者想解决这个问题——不是做另一个OTA平台,而是用AI把推荐逻辑彻底重做一遍。

这个项目的完整技术栈已经开源。作者详细记录了如何从PyTorch模型开发,一路推进到Vertex AI的生产部署。整个系统的核心挑战在于:怎么让机器学习 pipeline 既能快速迭代,又能稳定服务真实用户。


三层架构的切分逻辑

系统被拆成三个独立层:特征处理、模型推理、服务部署。这种切分不是架构洁癖,而是为了解决一个实际问题——数据科学家改特征工程的时候,不能每次都让后端工程师跟着重构API。

特征层负责把原始交互数据(点击、停留时长、筛选条件)转换成结构化信号,包括三类:行为历史、目的地偏好、以及预算/天数等硬性约束。模型层用PyTorch做排序预测,输出个性化推荐列表。部署层则完全托管在Vertex AI上,负责弹性扩缩容和版本管理。

这种设计让实验和生产解耦。作者可以本地训练新模型,验证效果后直接推送到Vertex AI的端点,不影响线上流量。

三个真实踩过的坑

冷启动是新用户的死穴。系统没有历史数据时,需要一套fallback逻辑生成初始推荐。作者的做法是用热门目的地+用户填写的偏好标签做混合排序,而不是直接给全局热门。

个性化与泛化的平衡更难拿捏。模型太贴合用户历史,会陷入"信息茧房";太追求通用相关性,又变成千篇一律。解决方法是特征选择上的刻意设计——既保留用户长期偏好,也引入目的地本身的流行度信号作为正则项。

生产迁移是最后一个坎。本地开发和云端部署的环境差异,导致模型在Vertex AI上的推理延迟比预期高了40%。最终通过批量预测和缓存策略解决,而不是重写模型结构。

技术选型的取舍

为什么选择Vertex AI而不是自建K8s集群?作者的考量很实际:这个项目是个人副业,没有运维团队。托管服务虽然贵一点,但把"凌晨三点被报警叫醒"的风险转移给了Google。

PyTorch的选择则是因为动态图更适合快速实验。作者提到,早期用静态图框架时,改一个特征输入就要重新编译整个计算图,迭代速度被拖慢。切换到PyTorch后,模型结构的调整成本大幅降低。

整个系统的代码量控制在可维护范围内——核心推荐服务约2000行Python,特征pipeline用Apache Beam实现,基础设施用Terraform管理。没有微服务拆分,没有复杂的服务网格,单体式部署但逻辑分层清晰。

对同类项目的启示

这个案例最值得参考的不是技术深度,而是scope控制。作者明确放弃了实时学习(online learning),选择批量重训的简化方案;放弃了多目标优化,只做单一排序目标;放弃了复杂的用户画像体系,用显式偏好+隐式行为的两层结构。

这些"不做"的决定,让项目从idea到上线控制在三个月内。对于个人开发者或小团队来说,这种克制可能比任何架构技巧都更重要。

项目已开源,包含完整的模型训练脚本、特征定义和Terraform配置。如果你正在搭建类似的推荐系统,这份代码的参考价值在于:它展示了一个"刚好够用"的生产系统长什么样,而不是一个过度设计的demo。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
特朗普时隔9年再度访华;首次访华两国曾签下2535亿美元大单,今年2月特朗普还在赞叹访华期间中国仪仗队强大阵容、整齐划一

特朗普时隔9年再度访华;首次访华两国曾签下2535亿美元大单,今年2月特朗普还在赞叹访华期间中国仪仗队强大阵容、整齐划一

极目新闻
2026-05-11 10:22:20
中美共同的两个敌人

中美共同的两个敌人

环球时报国际
2026-05-11 08:42:59
8-3领先连丢8分,张本智和输到脸变形!赛后沮丧发声,日媒也怂了

8-3领先连丢8分,张本智和输到脸变形!赛后沮丧发声,日媒也怂了

萌兰聊个球
2026-05-11 09:08:17
中国赛车+中国车手再夺世界冠军!吉利星瑞TCR首战即夺冠

中国赛车+中国车手再夺世界冠军!吉利星瑞TCR首战即夺冠

扬子晚报
2026-05-10 21:25:15
国家德比2-0!11.7亿豪门无解联赛11连胜 完爆死敌夺冠第29次加冕

国家德比2-0!11.7亿豪门无解联赛11连胜 完爆死敌夺冠第29次加冕

狍子歪解体坛
2026-05-11 04:56:31
曝光!剪一次头!!20万美元!

曝光!剪一次头!!20万美元!

柚子说球
2026-05-10 11:24:26
张本智和回应遭梁靖崑逆转:一切都怪我,留下了太多遗憾,金牌依然遥不可及,回家好好训练变更强

张本智和回应遭梁靖崑逆转:一切都怪我,留下了太多遗憾,金牌依然遥不可及,回家好好训练变更强

鲁中晨报
2026-05-11 10:18:08
人大代表建议机关事业单位双休制调整为“大周休3天,小周休2天”

人大代表建议机关事业单位双休制调整为“大周休3天,小周休2天”

细说职场
2026-05-10 10:34:41
2:3!日本女团惜败国乒,张本美和赛后采访满是心有不甘与心碎!

2:3!日本女团惜败国乒,张本美和赛后采访满是心有不甘与心碎!

田先生篮球
2026-05-10 23:07:16
王曼昱哭了登热搜第一!两度致谢莎莎情真意切 陈熠何卓佳都哭了

王曼昱哭了登热搜第一!两度致谢莎莎情真意切 陈熠何卓佳都哭了

颜小白的篮球梦
2026-05-11 07:50:35
惨遭国乒男团3:0横扫!张本智和赛后与赛前采访对比,狠狠被打脸

惨遭国乒男团3:0横扫!张本智和赛后与赛前采访对比,狠狠被打脸

田先生篮球
2026-05-11 06:20:39
善恶有报!许家印刚认罪1天,子女近况曝光,大儿子的安排全白费

善恶有报!许家印刚认罪1天,子女近况曝光,大儿子的安排全白费

历史伟人录
2026-05-10 22:06:40
毛主席83岁给华国锋的珍贵书法,练字真的有意义吗?

毛主席83岁给华国锋的珍贵书法,练字真的有意义吗?

书画相约
2026-05-11 10:09:02
上汽大众:2026年开启新能源大反攻

上汽大众:2026年开启新能源大反攻

汽车大观
2026-01-23 14:24:38
赛前叫嚣要和国乒清算!遭横扫后22岁张本智和蔫了:离冠军仍遥远

赛前叫嚣要和国乒清算!遭横扫后22岁张本智和蔫了:离冠军仍遥远

我爱英超
2026-05-11 08:12:48
马姆达尼执政不足百天时间,印证了平均主义民粹政治的彻底破产

马姆达尼执政不足百天时间,印证了平均主义民粹政治的彻底破产

壹家言
2026-05-11 09:06:45
实锤了!俄媒公布俄军真实伤亡数字,比利时向乌克兰提供53架F16

实锤了!俄媒公布俄军真实伤亡数字,比利时向乌克兰提供53架F16

史政先锋
2026-05-10 21:05:57
一问到底丨世界杯转播费谈判为何陷入僵局,中国球迷还能愉快地看球吗?

一问到底丨世界杯转播费谈判为何陷入僵局,中国球迷还能愉快地看球吗?

上游新闻
2026-05-10 15:45:20
FIFA以1.2亿美元“贱卖”世界杯转播权,CCTV该不该接?

FIFA以1.2亿美元“贱卖”世界杯转播权,CCTV该不该接?

新浪财经
2026-05-10 18:02:01
震惊!小马云18岁成年首播,在线人数破7万,与女生接吻刷爆网络

震惊!小马云18岁成年首播,在线人数破7万,与女生接吻刷爆网络

火山詩话
2026-05-09 16:02:57
2026-05-11 12:19:00
Ping值焦虑
Ping值焦虑
有态度网友ytd
2400文章数 38关注度
往期回顾 全部

科技要闻

黄仁勋:你们赶上了一代人一次的大机会

头条要闻

特朗普时隔9年再度访华 今年特朗普还赞叹中国仪仗队

头条要闻

特朗普时隔9年再度访华 今年特朗普还赞叹中国仪仗队

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

谢霆锋没想到,王菲靠张艺谋重返巅峰

财经要闻

"手搓汽车"曝光:伪造证件、电池以旧代新

汽车要闻

全球化成国内车企未来胜负手,谁是出海最强"水手"?

态度原创

手机
旅游
亲子
公开课
军事航空

手机要闻

控制成本 三星Galaxy S27或引入京东方供货屏幕

旅游要闻

河南洛阳栾川重渡沟景区,百米巨型瀑布被喷上油漆:瀑布暂停开放

亲子要闻

fsh值如何降下来?卵子质量不好要调理卵巢吗?

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗革命卫队深夜警告

无障碍浏览 进入关怀版