我用Gemma 4做了个"鬼职位"检测器：招聘黑话翻译机|gemma

我用Gemma 4做了个"鬼职位"检测器：招聘黑话翻译机

2026-05-09 06:11:41　来源: 硅屿手记

北京举报

分享至

招聘网站上的职位描述，读起来总让人有种说不清的别扭。"快节奏环境""自我驱动""抗压能力强"——这些词背后到底藏着什么？我做了一个工具，专门拆解这种语言迷雾。

这个叫Ghost Job Detector的小项目，核心功能很简单：丢进去一份职位描述，它告诉你这是真职位、虚假招聘、骗局，还是只是可疑。更重要的是，它解释为什么。

选择Gemma 4不是跟风。处理招聘信息需要模型能读懂混乱的人类表达，捕捉弱信号而不只是关键词匹配，还要能推理意图并稳定输出结构化结果。实际跑下来，我用OpenRouter调了两个版本：26B MoE做主模型，31B Dense当备用。

真正让我意外的是Gemma 4的可用性。三条路径完全不同的场景都能覆盖：想最快上手就用OpenRouter，零基础设施、零本地显卡，纯API调用；需要浏览器里快速试提示词就去Google AI Studio，更适合原型验证；要完全离线免费就跑本地，从Hugging Face或Kaggle下载模型，用Ollama、LM Studio或者Transformers库启动。各有代价——本地要算力和配置，云端要按量付费——但选择权在自己手里，这种灵活性对实际项目很关键。

不过模型本身反而是最容易的部分。真正折磨人的是让它在产品里稳定表现：强制JSON结构、输出校验、API故障处理、限流重试逻辑、模型间降级切换。这些工程细节决定了用户看到的是流畅体验还是报错页面。

来看个真实案例。输入："We are looking for a self-starter in a fast-paced environment." 系统输出：判定为"可疑"，推理是"模糊期望+压力信号"，HR翻译层直接点破：高工作负荷、结构不清、支持有限。

这就是"翻译层"的价值。很多职位描述并不直接撒谎，只是把真实含义埋进企业黑话里。我整理了一批高频对照：

• "Fast-paced environment" → 高压，加班 likely
• "Wear many hats" → 人手不足，职责边界模糊
• "Self-starter" → 管理薄弱，你得自己摸索
• "Competitive salary" → 薪资可能低于市场，或不透明

这种解码不是语义游戏。对求职者来说，这是面试前就能拿到的信息对称；对招聘方来说，也是一种倒逼——当你的话术被系统性拆解，要么诚实一点，要么接受更高的筛选成本。

Gemma 4在这个场景里的表现，让我重新理解了"开源模型"的实用含义。不是参数多少、榜单排名，而是你能不能在今天下午就让它跑起来，处理真实世界的脏数据，并在出错时有退路。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.