网易首页 > 网易号 > 正文 申请入驻

实测华为小艺版 DeepSeek,和满血版 R1 有差别吗?

0
分享至

春节期间,互联网上最火的不是春晚小品,也不是春节档电影,而是 DeepSeek。

这匹来自中国的 AI 黑马,以极低的训练成本实现了媲美 OpenAI o1 的性能,凭借强大的中文能力、堪称赛博觉醒的顿悟时刻和秉持开源精神,迅速搅动了以 ChatGPT 为首的 AI 圈。

自家人出息了,家里的其他人肯定要撑场子,于是,在全国人民享受愉快假期的同时,程序员们又忙了起来。

随着腾讯云、秘塔 AI、阿里云、百度智能云和国家超算互联网平台纷纷宣布接入 DeepSeek,手机作为最常用的个人智能终端,也迎来了它的身影。

其中,动作最快的是华为。

话不多说,作为 DeepSeek 首次集成到智能手机的头马,我们第一时间进行了上手测试,来看看它的实际表现如何。


在将小艺助手升级到 11.2.10.310 版本后,DeepSeek 已正式出现在小艺助手的智能体广场中。

进入小艺助手 app 主界面,点击导航栏中的「发现」,就能一眼看见 DeepSeek 的存在,且从封面来看,目前接入的 DeepSeek 是 R1 的 Beta 版。


相比官方应用,华为小艺接入的 DeepSeek-R1 Beta 总体保持了小艺助手一贯的设计风格和逻辑,界面简洁直观,分为上下两部分。

上半部分是 DeepSeek-R1 Beta 的自我介绍,并展示了一些预设的常见问题,供首次使用者挑选尝试。而下半部分则是对话框,支持语音输入,用户的语音内容会自动转化为文字并即时发送,方便快捷。


▲ 左:小艺版 DeepSeek / 右:DeepSeek 官方应用

点击 DeepSeek-R1 Beta 的头像,可以进入详情页面,在这个页面中有更详细的介绍:

我是基于 DeepSeek 开源版本部署的智能体,旨在帮助鸿蒙用户获得深度思考体验。

除此之外,小艺版 DeepSeek-R1 Beta 只支持简单的设置,包括智能体音色、清除上下文和删除对话记录,这意味着你没有办法新开对话框,如果想重新开始,只能清除上下文以及删除对话记录。


▲ 最丰富的设置居然是小艺自带的音色

在详细测试开始前,我们还有一些注意事项和细节,需要你提前知道:

  • 华为小艺接入的 DeepSeek-R1 Beta 只在纯血鸿蒙版本的小艺助手中提供,鸿蒙 4.3 用户暂时无缘享受
  • 小艺版 DeepSeek 支持招牌功能深度思考,但不提供详细的思考过程
  • 小艺版 DeepSeek 目前在对话框中没有提供联网搜索功能的选项,但答案里有时会显示参考的在线网页
  • 小艺版 DeepSeek 在回答完问题后会给出一些拓展选项,以备用户进一步追问,这是官方应用中没有的
上下文长度略短,日常够用

衡量 AI 的性能,有一个重要因素——长上下文长度。

上下文长度(Context Length)指的是大语言模型在处理文本时,能够同时考虑和记住的文本长度。

例如,如果一个模型的上下文长度是 2048 个 token,那么在生成或理解文本时,它只能「看到」最多 2048 个 token 的信息,超出这个长度的信息则会被模型忽略或丢失。

换句话说,如果,上下文长度不够,可能聊着聊着,AI 就忘了你之前说过的话。

虽然小艺接入的 DeepSeek-R1 Beta 没有公开上下文长度的数据,但我们可以设计一个简单的办法进行初步测试。

我准备了《三国演义》的前三回,约一万五千字,将其输入到华为小艺接入的 DeepSeek-R1 中,并要求其输出最后一百个字。


重复了多次,华为小艺接入的 DeepSeek-R1 都提示:

稍等,稍等片刻再试试呢。

在将文章缩短到第一回,约四千五百个字的时候,依旧失败。

无奈之下,我换了一篇曾经撰写的新闻稿,并节选了约 700 字的内容,才最终得到了成功的输出。


这个长度基本足够日常简单问题的交流,但想要与其畅聊人生,恐怕是个容易失忆的哲学导师。

输出质量和满血版 R1 有差别吗

又到了大家喜闻乐见的环节,AI 发展至今,测试方法多种多样,我们选择了一系列的问题,从那些人类容易理解、但 AI 容易误会的问题,到日常需求的应答可行性,都进行了详细的测试。

作为曾经搞翻大半个 AI 圈的经典问题,「9.11 和 9.8 哪个大」以及「Strawberry 里有几个 r」已经并入了常规测试环节。


▲ 左:小艺版 DeepSeek / 右:DeepSeek 官方应用

令人意外的是,在 Strawberry 里有几个 r 这个问题上,华为小艺接入的 DeepSeek-R1 Beta 居然翻车了,甚至在给出了参考来源的情况下,依旧给出了两个 r 的答案,并且在 r 出现的位置上也有错误。

而 DeepSeek 的官方应用则没有任何意外,在给出正确答案的同时也准确指出了 r 的位置。

除此之外,华为小艺接入的 DeepSeek 与官方应用相比,还有一个显著的不同——R1 模型的思考过程被隐藏了。

虽然这个过程在大多数时候并不干扰答案,但一个能够展示思考过程的 AI,显然让人更有信心,同时,如果用户希望调整问题,能够通过查看 AI 展示的思考逻辑来帮助理解,避免 AI 未能准确捕捉到用户的思路。


▲ 从官方应用提供的思考过程来看,有几个 r 依旧是个让 AI 纠结的问题

平时用惯了 DeepSeek 的官方应用,突然失去了思考过程让我觉得有些心里没底。

于是,我将电车难题交给了两个 DeepSeek,这个涉及道德伦理的经典思考题,考验其对复杂道德议题的理解深度,看看这个思考过程隐藏后,还能不能回答有条理的、考虑全面的答案,并避免我预设的「你怎么选」的坑。


在这个问题上,DeepSeek-R1 Beta 并没有出现差错,也没有掉进我设计的坑里,在回答中详细介绍了两个选择的后果,并分别在各种观点和视角下进行具体分析,提示无论做出怎么样的选择,都要认真思考其伦理含义和潜在影响及其后果。

简单的道德伦理题难不住它,就尝试一下更有难度的题,考察一下推理能力、判断力以及对逻辑关系的理解:

「有三个人站在一座桥的一端,他们需要去桥的对面,但桥只能承受两个人同时过桥,而且桥上只有一把手电筒。三个人的过桥速度不同:一个人过桥需要 1 分钟,另一个需要 2 分钟,最后一个需要 5 分钟。每次只有两个人可以一起过桥,而桥上必须有手电筒。问:怎么样才能让他们在最短时间内过桥?」

这个测试就比较有意思了,小艺接入的 DeepSeek-R1 Beta 得出来的结论是 12 分钟,这个答案与 ChatGPT 的结论相同,而 DeepSeek 官方 app 则得出了一个用时更短的答案,同时在思维逻辑上也给出了充足的辩论脉络。


▲ 左:小艺版 DeepSeek / 中:DeepSeek 官方应用 / 右:ChatGPT-4o

在测试完道德伦理、逻辑数学后,我们最后测试一个更贴近普通使用场景、但对于 AI 来说很难做到自然的测试——中文写作。

我设计了一个视频选题,并让小艺接入的 DeepSeek-R1 Beta 帮我输出一个简略的台词,兼顾画面设计的同时以小品形式来呈现华为 Mate X6 折叠屏的外观,看看在用户提出复合型任务要求的情况下,它的表现如何:

「我要制作一期华为 Mate X6 折叠屏的视频,展示折叠屏外观的同时进行中立评价,全片通过两人小品的形式呈现,请你帮我设计台词,要求台词诙谐有趣,并保持口语化,同时需要兼顾画面设计。」


小艺接入的 DeepSeek-R1 Beta 在短暂思考以后给了我一份完整的对话台词设计,从折叠屏的不同特点出发,共设计了四个场景以及一个结尾,整体结构还算完整,且台词口语化做得还不错,同时每句对白都给了相应的画面设计,美中不足就是有趣诙谐的内容略有欠缺,没有什么梗,但应对日常的文字处理工作基本没问题。

需要注意的是,如果不要求口语化,那它给出的回答用词过于板正严谨,还是有些 AI 味道。


总得来说,可能受制于发布速度、集成妥协等等因素,目前的小艺接入的 DeepSeek-R1 Beta 的上下文长度性能、回答准确度尚处于一个比较基础的状态,需要等待后续的迭代。

不过,考虑到目前 DeepSeek 官网及官方应用的连接条件实在糟糕,而其他各种云平台及本地部署对使用环境与门槛的要求又较为苛刻,在面对一些不那么复杂的问题时,直接使用华为小艺中接入的 DeepSeek 是个不错的选择。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
27岁国足名宿之子拒归化!只想代表日本,媒体人:他对中国没感情

27岁国足名宿之子拒归化!只想代表日本,媒体人:他对中国没感情

我爱英超
2025-04-28 22:39:24
同学聚会上偶遇初恋女友,我假装退休金2100,她的话让我湿了眼眶

同学聚会上偶遇初恋女友,我假装退休金2100,她的话让我湿了眼眶

诡谲怪谈
2025-04-16 09:11:26
天天打扫,为什么家里还有那么多毛絮?学会这么做,家会很干净的

天天打扫,为什么家里还有那么多毛絮?学会这么做,家会很干净的

室内设计师有料儿
2025-04-29 10:46:20
追梦谈巴特勒:他的存在对我们影响巨大 那个篮板我以为是库明加

追梦谈巴特勒:他的存在对我们影响巨大 那个篮板我以为是库明加

直播吧
2025-04-29 15:45:11
巴克利谈杰伦·格林:竟然只出手8次太荒唐了,这都不知道自己手感是好是坏

巴克利谈杰伦·格林:竟然只出手8次太荒唐了,这都不知道自己手感是好是坏

雷速体育
2025-04-29 13:26:11
个人微信收款被查了!5月起个人收款高于这个数,要小心了!

个人微信收款被查了!5月起个人收款高于这个数,要小心了!

祥顺财税俱乐部
2025-04-29 09:14:50
1966年《人民日报》发表的破四旧照片

1966年《人民日报》发表的破四旧照片

尚曦读史
2025-04-29 08:32:04
23岁朝鲜男人入赘浙江,8年寄了100万回家,首次回家却让他傻眼

23岁朝鲜男人入赘浙江,8年寄了100万回家,首次回家却让他傻眼

萧竹轻语
2025-04-27 17:52:52
章子怡华表奖摔倒,隔天坐轮椅现身高铁站,一个月前就有人提醒她

章子怡华表奖摔倒,隔天坐轮椅现身高铁站,一个月前就有人提醒她

东方不败然多多
2025-04-29 12:27:09
辽篮回沈阳,全队垂头丧气,李晓旭郁闷,杨鸣忙签名,郭士强随队

辽篮回沈阳,全队垂头丧气,李晓旭郁闷,杨鸣忙签名,郭士强随队

小嵩
2025-04-29 14:17:35
男女工地同居5年,工程款结算完后,她却拦住男人:该算我的账了

男女工地同居5年,工程款结算完后,她却拦住男人:该算我的账了

白云故事
2025-04-29 03:15:07
没钱飞了!航空公司取消五一前所有航班,有飞行员因被欠薪送外卖

没钱飞了!航空公司取消五一前所有航班,有飞行员因被欠薪送外卖

奇特短尾矮袋鼠
2025-04-29 00:58:12
畸形儿童吃播:父母用女儿命赚钱,3岁饭量远超成年人,边吃边哭

畸形儿童吃播:父母用女儿命赚钱,3岁饭量远超成年人,边吃边哭

阿伧说事
2025-04-27 17:33:06
赛季报销!利拉德确诊左脚跟腱撕裂 恐缺席下季大部分或全部比赛

赛季报销!利拉德确诊左脚跟腱撕裂 恐缺席下季大部分或全部比赛

醉卧浮生
2025-04-29 02:24:18
“不能让李嘉诚跑了!”中方这次下了死命令,有一道口子决不能开

“不能让李嘉诚跑了!”中方这次下了死命令,有一道口子决不能开

猎火照狼山
2025-04-29 08:26:46
阿森纳梦碎!英媒爆曼联敲定哲凯赖什引热议,球迷:又要重蹈覆辙

阿森纳梦碎!英媒爆曼联敲定哲凯赖什引热议,球迷:又要重蹈覆辙

侧身凌空斩
2025-04-29 10:07:35
在马尔代夫遭酒店管家性侵 当事女子:警方已立案但进展缓慢,酒店方试图给钱和解

在马尔代夫遭酒店管家性侵 当事女子:警方已立案但进展缓慢,酒店方试图给钱和解

封面新闻
2025-04-28 21:34:02
卸妆后,真人卤蛋忍了、周冬雨大黄牙忍了、萧亚轩鞋拔子脸没忍住

卸妆后,真人卤蛋忍了、周冬雨大黄牙忍了、萧亚轩鞋拔子脸没忍住

归史
2025-03-24 09:29:39
复旦教授:社会充满戾气,因为我们丢掉了最宝贵的精神财富!

复旦教授:社会充满戾气,因为我们丢掉了最宝贵的精神财富!

尚曦读史
2025-04-26 21:00:03
王菲谢霆锋极简日常:女的素面朝天下厨做仆妇,男的一脸温柔凝视

王菲谢霆锋极简日常:女的素面朝天下厨做仆妇,男的一脸温柔凝视

野山历史
2025-04-29 14:10:21
2025-04-29 16:11:00
爱范儿 incentive-icons
爱范儿
消费科技第一媒体
37200文章数 2598165关注度
往期回顾 全部

数码要闻

Q1中国电子纸平板全渠道销量同比增长8.6%

头条要闻

特朗普刚执政百日 白宫已经开始就下一个100天"画饼"

头条要闻

特朗普刚执政百日 白宫已经开始就下一个100天"画饼"

体育要闻

勇士火箭雷霆太阳,你们是怎么失去他的?

娱乐要闻

85花回归古偶赛道 刘诗诗能否重现辉煌

财经要闻

特朗普执政百日下的美元危机

科技要闻

Qwen3登顶开源榜 阿里称大模型是十年长跑

汽车要闻

年轻or传统?上汽奥迪A5L与一汽奥迪A5L有什么不同?

态度原创

本地
游戏
数码
艺术
公开课

本地新闻

春色满城关不住 | 北洋门扉开:名校与花潮撞个满怀

《明末》新实机播放量已突破50万!女主装扮太吸睛

数码要闻

七彩虹推出双24GB战斧DDR5 6000内存套条:黑白双色可选,1049元

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版