![]()
说真的,最近这两年,AI 圈给我的感觉就一个字:卷。
各个大厂都在卷参数、卷跑分。但我们作为真的拿AI当工具干活的人,关心的是什么?
AI 能不能让我少干点活,能不能帮我一键搞好选题,甚至能不能在我写作一团浆糊的时候,给我一个清晰的思路。
今天,腾讯混元发布了他们的新模型 Hy3 preview。这是腾讯混元在预训练和强化学习基础设施重建后的第一个新模型,姚顺雨他来了之后搞的,说实话我还是挺好奇的。
![]()
混元新模型,到底行不行?
这次的新模型,它新在哪?
根据官方的报道来看,相比过往的 2.0,它在推理能力和 Agent 能力上会有所升级。当然,这些官方信息我就不多念了,简单来说,就是新模型更能思考,也更能干活了。
目前,这个模型在腾讯元宝以及腾讯龙虾——WorkBuddy 上面都能使用。
![]()
至于它效果怎么样?会不会和其他模型一样喜欢胡说八道,我这边刚好提前拿到了测试资格。
准备测试一下,看看它能不能帮我解决工作中的实际问题。
![]()
网上的瓜,它能辨真吗?
作为一个有一定体量的科技博主,我们团队每天最头疼的其实不是写文章,而是写文章之前的“选题”。
基本上每天都会有热点,但现在资讯这么发达,资讯的真假却难辨。一个新闻爆出来,不到一小时内全网疯传,配图、细节、时间线一应俱全,看着比真的还真。
![]()
但你要是信了,马上让下面的人跟进写了文章,结果半天后官方辟谣了,那场面,你就说尴不尴尬?
昨天就出了这么一档子事,一张“库克宣布加入小米汽车”的图片刷爆了科技圈,那叫一个天衣无缝,这么好的热度,我们都差点想先谢为敬了。
直到后来小米高管出来辟谣,大家才知道是恶搞。
所以今天,我就把这个难题丢给混元,让它评估一下这个信息的真实性,并给我理由。
其实我没有抱太大希望,毕竟 AI 在处理这种多方信源交叉的事件时,经常会搞错,最典型的就是 315 被揭露的 GEO,只要给它喂足够多的“毒”,那它就会置事实于一旁。
![]()
不过没想到,它不仅给了我一个判断,甚至还给了我判断的依据:
它抓取了全网 7 个权威信源,从官方社媒,到各大科技媒体的报道,相互交叉验证,从而判断信息的真伪。
![]()
最牛的是,它精准地抓住了几个信息反转的关键节点:
小米集团高管徐洁云的微博,当时第一时间出来辟谣,这是最核心的证据;同时翻看苹果官网发布的消息,也有信息表示,库克卸任 CEO 后将转任执行董事;最后,再经多方辟谣,流言自然散去。
![]()
整个分析过程有理有据,逻辑链条非常清晰,特别是从苹果官网寻找线索这一点尤为值得称赞,一下子就把信息的真伪探了个大概。
![]()
AI 财报精读机器
能辨别资讯真伪,在我这里已经算是生产力了,但是我想进一步看看它的工作能力如何。
我想起前段时间写的那篇分析 Keep 的文章时的痛苦经历:为了搞清楚他们这几年的业务状况,我硬着头皮啃完了他们2023到2025连续三年的财报。
巨多内容,再加上苦涩难懂的专业用语,当时读完后,我整个人感觉都被掏空了。
![]()
所以我把这三份PDF财报文件直接扔给了 Hy3 preview,让它把 Keep23~25 年的关键财务数据整理出来,以及给我相关的核心结论。
等待结果的时候,我还在想我是不是过于为难它了,它会不会开始胡编乱造了?
但结果出来后,竟然还不错。
![]()
因为第一眼,它真的做得很美观,设计感很强的可视化报表,而且审美很在线,简洁、清晰,线条和配色都透着一股高级的科技感。
![]()
最关键的是,它给很多数据都做了可视化表格,一眼就能看出 Keep 这 3 年来的财务动态。
其次,它给出的数据,准确无误。不仅有每年的收入、毛利、毛利率等数据,
![]()
还把各版块的财务状况一并统计展示了出来,
![]()
最重要的是,它似乎明白月活用户是互联网企业的关键运营指标,所以竟然把这一数据单独列出来了,它真的太懂了!
![]()
最后,它给出的结论还很一针见血,当时很多我花了好几天才想到的观点,它几分钟就搞定了。
例如说 Keep 在 2025 年的首次实现扭亏为盈,各版块结构上的变化,活跃用户数的下滑,它都有敏锐地捕抓到。
![]()
这个功能,给经常接触数据的打工人来说,价值简直不可估量,能让我们更专注于数据背后的洞察和决策。
当然对于很多热衷于大 A 的股民来说,可能也是一个很不错的工具。
![]()
市场分析做得怎么样?
最后,我还想给它做一个测试:最近手机市场价格暴涨,内卷加剧,未来的机会到底在哪里?
这是我最近很困扰的问题,因为作为博主,我们不应该只会看产品,更要看懂趋势才行。
于是我让混元以手机暴涨作为切入,分析一下当前手机市场的机会和陷阱。
这是一个开放性极强的问题,很多模型对于这样的问题,只会做信息的搬运,但更关键的,应该是逻辑推理、趋势预判和观点输出。
这次混元给的报告很长,但是质量也很高。
![]()
不仅全球市场做了一个整体的分析,
也对现在苹果、三星,以及国产头部厂商的市场博弈做了一顿分析,颇有几分行业分析师的味道。
当然,到这里其实我已经挺满意的了,但我还是再想压榨一下它的性能,于是让他把这份报告做成 PPT。
做出来的 PPT 嘛,整体效果谈不上多惊艳,但绝对是“能用”的水平。
![]()
框架网站,逻辑清晰,我感觉找个AI再智能美化一下图标,一份该质量ppt就完成了。
说实话,Hy3 preview 给我的感觉,确实有点不一样。
过去两年,我们看到了太多在参数、跑分上“屠榜”的模型,但一到实际应用场景,就瞬间拉胯。
而混元很明显是有考虑用户的真实应用场景,认真思考“用户到底需要什么”。
可以预见,当混元这种更懂场景、更务实的能力,全面融入腾讯自家的社交、游戏、广告、娱乐等各种场景业务后,或许还真能跑出不错的效果。
看来这场 AI 战争,腾讯是第一个放下身段,真正做好应用的人。
编辑:志坚
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.