网易首页 > 网易号 > 正文 申请入驻

马斯克罕见低头:开源推荐算法,自嘲“很烂”不过未来月更

0
分享至

就现在,GitHub已经能完整看到马斯克开源的推荐算法系统了。

开源文件里明确表示,这是一个几乎完全由AI模型驱动的算法系统。

  • 我们移除了所有人工设计特征和绝大多数启发式规则。



消息一出,整个社区立刻沸腾了,最高赞上去就是一顿猛夸:

  • incredible!没有其他平台能做到如此透明。



马斯克本人也火速转发了工程团队原帖,不过一向言辞高调的老马,此番却低调表示:

  • 我们知道这个算法很蠢(dumb),需要大幅改进,但至少您可以实时、透明地看到我们为改进它而努力。
  • 其他社交媒体公司都没有这样做。



早在2022年收购(原Twitter)之前,马斯克就多次批评该平台过于封闭。

自收购之后,他也兑现承诺多次公开Twitter核心推荐算法,这一次也算是不忘初心了。

原来纯AI驱动的推荐系统,是这样运作的!

话不多说,咱这就扒一扒整套系统的运作机制。

一句话概括这个系统即为:

基于Grok-1同款Transformer架构打造,能通过学习你的历史互动行为(点赞/回复/转发过什么),来决定给你推荐什么内容。

从用户打开“For You”开始,客户端会向服务器发送一个请求,触发整个算法流程。



然后系统会先做一件事——搞清楚你是谁、你最近在干什么、你平时对什么内容有反应。

为实现这一目的,系统会拉取两类用户信息:

  • 行为序列(Action Sequence):一类代表最直接、最强烈的兴趣信号,比如最近点赞、回复、转发、点进、停留过什么。
  • 属性(Features):另一类代表长期属性,比如关注列表、声明的兴趣主题、地理位置、使用设备等。

这一步的目标并不是人工构造特征,而是尽可能真实地构建“实时用户画像”——

以前工程师可能会假设“某些属性很重要”,然后手动编写规则或公式去计算一个“用户兴趣得分”。

但这本质上是工程师的猜想,而非用户真实状态的反映。

于是马斯克的这套算法就决定不做任何预设假设,而是尽可能多地、原始地收集用户最真实的行为反应,然后将这堆数据直接喂给后续的模型,从而让模型自己去从原始数据中学习和发现规律。(即“去人工化”和“端到端”)

而拿到实时用户画像后,系统会接着兵分两路,从整个平台的海量推文中快速筛选出几千条“可能相关”的推文

一条是通过熟人圈。即从Thunder模块,直接抓取你关注的所有人的最新推文。

另一条是通过外部。利用Phoenix Retrieval这一核心检索模块,抓取那些你可能感兴趣、但来自未关注账号的推文。



以上两类来源不同的信息,会在后续阶段被统一对待。

需要提醒,此时筛选出来的还只是推文ID。

于是系统会通过Hydration模块,补全每条候选推文的信息,包括推文全文、作者详情、图片/视频、历史互动数据等,以便后续深度评估。

而且在正式开始计算前,还会进一步通过Filtering模块淘汰那些明显不要的内容,例如:

  • 重复或过期的帖子
  • 用户自己发布的内容
  • 来自拉黑或静音账号的帖子
  • 包含用户屏蔽关键词的内容
  • 已经看过或在当前会话中展示过的帖子
  • 用户无权限访问的订阅内容

记住,这一步只做一件事:回答某条内容“能不能出现,而不是值不值得推荐”。



铺垫到这里,最终剩下来的内容会被逐条送入Phoenix排序模型进行打分。

这个模型是一个基于Transformer的模型,它会同时接收:

  • 用户的行为序列与属性信息
  • 单条候选帖子的内容与作者信息

然后模型会预测用户对某条推文执行各种操作的概率,并将各种概率按照预设权重进行加权组合(如点赞类正向行为加分、拉黑类负向行为减分),并形成最终排序分数。

基于此,系统还会进行少量工程层面的调节——

比如控制作者多样性,避免单一账号在信息流中占据过高比例(防止某一大V刷屏)。

这里也需要提醒,为了保证送入的每条帖子都是独立评分的,所以系统还特意设置了“不允许候选帖子相互看见”(推文之间没有交叉注意力机制)。



所有候选帖子按最终得分排序,系统从中选出Top-K条帖子,作为本次请求的推荐结果。

而且在返回客户端之前,系统还会进行最后一轮校验,确保内容符合平台安全规范——

例如,移除任何已删除、被标记为垃圾信息或包含暴力血腥等违规内容的推文。

最终,经历重重筛选后的信息会根据分数高低,依次展示给客户端用户。



总结下来,这套系统能够成功运转的五大关键在于(官方划重点版):

(1)纯数据驱动,拒绝人工规则

彻底摒弃人工定义“什么内容算好”的复杂规则,改由AI模型直接从原始用户数据中学习。

(2)采用候选隔离机制,独立评分

AI模型在给内容打分时,每条内容“看不见”其他候选内容,只能看到用户信息。这确保了每条帖子的分数不会因为同批次其他帖子而变化,分数一致且可高效缓存复用。

(3)哈希嵌入,实现高效检索

检索和排序都使用多个哈希函数进行向量嵌入查找,提高效率。

(4)预测多元行为,而非单一分数

AI模型不直接输出一个模糊的“推荐值”,而是对多种用户行为同时预测。

(5)模块化流水线,支撑快速迭代

整个推荐系统采用模块化设计,各个组件可以独立开发、测试、替换。

“是的,这算法太烂了”

不过,虽然众人对老马开源的姿态表达了赞赏,但奈何这套算法还是有一些“缺陷”。

有网友就在推荐算法开源后吐槽道:

  • 由于API访问受限且成本高昂,现在屏蔽列表的做法已经很少见了,但以前这种做法非常普遍。
  • 算法必须让较旧的屏蔽列表随着时间推移而逐渐消失,这样这些较旧的屏蔽列表就不会再被恶意利用。

言下之意是,算法代码显示“被大量用户屏蔽”是一个强负面信号,会直接导致账号被“降权”,即内容更难获得推荐,但代码中没有明确看到针对“屏蔽”信号的时间衰减机制

这意味着,历史上的屏蔽记录可能至今仍在影响账号的推荐分数。

此番言论也引得马斯克本人现身评论区吐槽:

  • 是的,这算法太烂了。



但不管怎样,老马想要改变的态度已经明确——

不仅过去开源、现在开源,而且接下来还会持续开源,未来每4周将重复一次开源更新

开源仓库:
https://github.com/xai-org/x-algorithm

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
格陵兰岛本就不是丹麦的!从历史根儿上算,真正归属早有定论

格陵兰岛本就不是丹麦的!从历史根儿上算,真正归属早有定论

福建平子
2026-01-12 10:33:34
15胜0负!联盟第一!全联盟都说要退役了,你却逆天改命要冲冠了

15胜0负!联盟第一!全联盟都说要退役了,你却逆天改命要冲冠了

篮球扫地僧
2026-01-21 18:18:33
特朗普“格陵兰关税”引爆达沃斯,全球政要警告、怒骂齐上阵

特朗普“格陵兰关税”引爆达沃斯,全球政要警告、怒骂齐上阵

凤凰网财经
2026-01-21 19:14:31
丹麦打响第一枪!250亿美元养老基金“清仓美债”,手握83万亿元美元资产的欧洲,会用资本“保卫”格陵兰岛?

丹麦打响第一枪!250亿美元养老基金“清仓美债”,手握83万亿元美元资产的欧洲,会用资本“保卫”格陵兰岛?

每日经济新闻
2026-01-21 16:28:05
哈佛发现:高血脂不用治,治好都是误诊?告诉您5个血脂真相!

哈佛发现:高血脂不用治,治好都是误诊?告诉您5个血脂真相!

岐黄传人孙大夫
2026-01-08 10:06:20
汪嘉伟:离婚又再婚,一生辜负两个女人,如今儿子是他的骄傲

汪嘉伟:离婚又再婚,一生辜负两个女人,如今儿子是他的骄傲

小嶯说故事
2026-01-19 12:57:15
大布发文控诉父母!贝嫂改婚纱抢跳舞不尊重儿媳,全家表演型人格

大布发文控诉父母!贝嫂改婚纱抢跳舞不尊重儿媳,全家表演型人格

照见古今
2026-01-21 19:34:24
又一旅游巨头被查!曾控制56%市场,日赚2亿多,美资手握众多股份

又一旅游巨头被查!曾控制56%市场,日赚2亿多,美资手握众多股份

顾史
2026-01-21 19:45:37
美女画师展示身材回应AI作画质疑,玩家惊呼作品还是保守了

美女画师展示身材回应AI作画质疑,玩家惊呼作品还是保守了

街机时代
2026-01-20 15:00:03
江西省德兴市委常委、市政府常务副市长严志平,主动向组织交代问题

江西省德兴市委常委、市政府常务副市长严志平,主动向组织交代问题

大风新闻
2026-01-20 21:04:26
护士长曝光李亚鹏感人细节!医院早没钱了,却硬不裁员,不停手术

护士长曝光李亚鹏感人细节!医院早没钱了,却硬不裁员,不停手术

谈史论天地
2026-01-18 13:23:55
佰维存储:公司预计2026年底晶圆级先进封测制造项目月产能将达到5000片

佰维存储:公司预计2026年底晶圆级先进封测制造项目月产能将达到5000片

每日经济新闻
2026-01-21 15:52:06
马斯克一语成真 全球抢购的不是芯片 而是中国20万一台变压器

马斯克一语成真 全球抢购的不是芯片 而是中国20万一台变压器

时尚的弄潮
2026-01-21 13:47:15
北京一驾校突然人去楼空!上千名学员培训中断......官方回应

北京一驾校突然人去楼空!上千名学员培训中断......官方回应

驾研院
2026-01-21 10:27:07
刘銮雄长子将股权卖给继母,获得巨额财富后,甘比首次露富心情超好

刘銮雄长子将股权卖给继母,获得巨额财富后,甘比首次露富心情超好

小鱼爱鱼乐
2026-01-20 22:39:00
19万志愿军牺牲在朝鲜,为何毛主席下令:不惜代价抢回701遗体?

19万志愿军牺牲在朝鲜,为何毛主席下令:不惜代价抢回701遗体?

大运河时空
2026-01-20 13:00:03
俄罗斯公开喊话中国!明确表示尊重中国

俄罗斯公开喊话中国!明确表示尊重中国

胥言
2026-01-21 15:42:21
什么是性成瘾?患者自述:比烟瘾、酒瘾厉害多了,比戒毒还难

什么是性成瘾?患者自述:比烟瘾、酒瘾厉害多了,比戒毒还难

泠泠说史
2025-10-30 15:20:45
谢杏芳没想到,费心培养9年的儿子,开始帮她保全婚姻的“体面”

谢杏芳没想到,费心培养9年的儿子,开始帮她保全婚姻的“体面”

阿柒的讯
2026-01-21 12:37:13
央视曝光毒纸巾,比抹布还脏用多了还致癌,别再整箱往家扛了

央视曝光毒纸巾,比抹布还脏用多了还致癌,别再整箱往家扛了

通文知史
2026-01-20 19:10:03
2026-01-21 20:15:00
量子位 incentive-icons
量子位
追踪人工智能动态
12044文章数 176360关注度
往期回顾 全部

科技要闻

给机器人做仿真训练 这家创企年营收破亿

头条要闻

32岁程序员周末晕倒后猝死 抢救期间还被拉入工作群

头条要闻

32岁程序员周末晕倒后猝死 抢救期间还被拉入工作群

体育要闻

只会防守反击?不好意思,我们要踢决赛了

娱乐要闻

田亮一家新年全家福!森碟变清纯少女

财经要闻

丹麦打响第一枪 欧洲用资本保卫格陵兰岛

汽车要闻

2026款上汽大众朗逸正式上市 售价12.09万起

态度原创

房产
手机
游戏
旅游
时尚

房产要闻

那个砸下400亿的绿地,又要杀回海南了!

手机要闻

给苹果iPhone 17 Pro Max穿金甲,京东京造推出Au99.99黄金手机壳

粉丝:比GTA6更好?《剑星2》最新概念图汇总

旅游要闻

免票!超值套票!伏羲山冰雪节全线优惠上线!

告别93岁时尚传奇Valentino:他留下了全世界最美的“红”

无障碍浏览 进入关怀版