网易首页 > 网易号 > 正文 申请入驻

DeepSeek R1 API实测,哪家服务商最靠谱?

0
分享至

文章转载自「祝威廉」

R1 火了之后,对国内AI开发者来说,就关心两件事。

哪里能用,这个现在基本解决了,硅基流动、阿里百炼、火山方舟等几乎所有的云平台都上线了 DeepSeek 的模型。但哪家好用,哪家能用,现在也是众说纷纭。今天这篇文章,就测一下国内云平台 DeepSeek 的服务质量。

第二个问题是,怎么用 R1。平民价格的推理模型,带来的是全新的与用户交互的范式,过往的很多提示工程可能都会直接被取代。怎么用 R1 等推理模型,开发 AI 应用,是一个当下待讨论的话题。

也因此,我们建了个R1 开发者交流群,切身聊一聊,今天创业,到底怎么用 R1。

扫码申请进群

进群之后,你有机会得到:

  • 高浓度的 DeepSeek 模型开发交流;

  • 资源对接,与 API、云厂商、模型厂商直接交流反馈的机会;

  • 好用、有趣的产品/案例,Founder Park 会主动做宣传。

01判断哪些是凑热闹的供应商

先大家做几个祛魅。不要看到那么多厂商都提供了 R1/V3 ,实际有些可能根本没办法用的。

首先,R1/V3 都只有一个规格的版本,都是 6000+亿参数的,不存在所谓满血不满血。那所谓蒸馏版 R1 是指什么呢?实际上就是用 Qwen/Llama 这些开源模型,使用从 R1 蒸馏出来的思维链数据再做一次微调得到的模型。他们本质还是 Qwen/Llama,并且因为参数规模小,数据来源又是 R1。效果和原生的 R1 差距很大。所以,上蒸馏版,不提供原版的 R1 的,一般都是凑热闹的。

再次,如果是原版 R1/V3, 那么我们接着可以看供应商提供的 Context Window (窗口大小),简单来说,很多厂商,比如某软,他提供的免费 R1 实际窗口只有 4K, 这意味着你使用R1,输入和输出不能超过 4K, 基本也就几轮的聊天。而应用对接,一般都会提供大量的上下文,基本随随便便就超了,属于只能聊天打屁用的。

第三个是 TPM 限制,比如某厂 TPM 限制是 10000, 对于AI辅助编程基本一次请求都过不了,刚请求就触发 rate limit 了,也只能适合聊天打屁。

第四个,大家也能感受到,就算都是原版模型,可能聊天或者使用效果还是略有差别的。这个我们以后再讨论。

所以,总结下:

作为用户,你区分一个供应商是不是真的良心供应商,先看模型不是是原版的(6000亿参数规模),其次再看窗口大小(64k+ 是正常),最后看 TPM(一般要10w以上)。如果都符合要求,现在,才能进入我们今天的主题,谁的速度更快。

02速度大比拼

一个供应商提供的 R1/V3 速度指标由下面两个指标来衡量:

1. TPS(每秒Token生成速度)

2. TTFT(首token出现等待时间)

这两个指标又收到三个因数的影响:

1. 你的输入长度。

2. 你测试的时间段

3. 用户体量

啥意思呢?比如贴了一万个字符的问题,和输入“你好”,这两个指标肯定都会有区别的。其次,你在一个供应商非常繁忙的时间段去测试,肯定速度很慢。时间段我这里就随机了,好不好就看各个供应商的命了,而用户体量,这个对应的各家资源也不一样,这个是供应商要自己解决的问题。

这次我们会同时对比国内外供应商,输入的问题长度,我们也会分成两个部分测试,一个输入100token以内,一个输入 14000 token左右。我们来分别看看TPS/TTFT。

与此同时,除了 R1/V3 我们也引入了一些其他模型的速度,大家可以权当参考。

小输入测试(20)

其中, 说下每个模型名字的对应关系:

1. or_o1_mini_chat 表示在openrouter 里的 o1 mini 模型。

2. doubao_pro_chat 表示在火山方舟的 doubao 1.5 pro 256k 模型

3. sili_r1_chat 表示硅基流动的 R1 模型(pro版)

4. doubao_32k_pro_chat 表示 doubao 1.5 pro 32k 模型

5. doubao_r1_chat 表示火山方舟的 R1 模型

6. QwenMax 表示阿里最新Qwen大模型

7. qianfan_r1_chat 百度千帆的 R1模型

8. qianfan_v3_chat 百度千帆的 V3模型

9. or_r1_chat openrouter 里免费 R1 模型

10 or_v3_chat openrouter 里 R1 模型

11 deepseek_chat 官方 V3 模型

12 ali_deepseek_r1_chat 阿里百炼上的 R1模型

13 doubao_v3_chat 火山方舟的 V3 模型

14 or_nitro_r1_chat openrouter 里的付费 R1 模型

15. ali_deepseek_chat 阿里百炼平台的 V3 模型

16. sili_deepseek_r1_chat 硅基流动的普通版 R1 模型

17. sili_deepseek_chat 硅基流动的普通版本 V3 模型

18. or_sonnet_chat openrouter 里的sonnet 3.5 模型

19. deepseek_r1_chat 官方 R1 模型

简单做个总结:

1. 官网的 R1/V3 一直处于不可用状态。

2. R1 的每秒输出速度,硅基流动以 22t/s 为冠军,openrouter, 火山方舟分别以 20.24t/s 以及 20.15t/s 居于亚军和季军。其他的基本都低于 20t/s。

3. V3 每秒输出速度,百度千帆以 14.86t/s 为冠军, 硅基流动和火山方舟分别以 13.35t/s 13.08t/s 分别居于亚军和季军。

4. R1 的首字母等待时间, 硅基流动以 0.2是为冠军,阿里百炼和火山方舟分别以 1.0 和 1.5s 为亚军和季军。

整体而言,类似你好,世界这样的场景里,硅基流动,火山方舟两家稳居前三,openrouter和百度千帆和阿里百炼则偶有入局前三

大输入测试(14000)

接下来,重磅来了 ,我们看看大输入下各家的表现。

1. R1 模型, openrouter TPS 以 29.55 为冠军,火山方舟和硅基流动分别以 24.90t/s, 10.31t/s 分别居于亚军和季军。

2. V3 模型, 硅基流动TPS 以 12.63t/s 为冠军, 火山方舟和openrouter 分别以 8.82t/s, 7.22t/s 居于亚军和季军。

3. 在R1模型的TTFT上,硅基流动以 5.08 的延时获得冠军, 火山方舟则以 5.62 居于亚军。两者差距不大。

最后做个总结:在大输入下(14000tokens),火山方舟,硅基流动,openrouter稳居前三, 各有优劣。其他的诸如百度千帆因为 TPM 限制,直接报错

最后总结

国内R1/V3 提供上,表现最好的是就是火山方舟和硅基流动,基本也和我之前的认知相同,他们两家技术实力强悍,行动也都很早,而且效果上也和官方有在对齐,基本值得信赖。

03如何自己测试

最后,如果大家想自己验证,可以安装如下工具:

然后运行如下指令:

然后按文档配置模型:https://uelng8wukz.feishu.cn/wiki/K3EmwuNrbiAN0CkHMGyc315Wn7f?fromScene=spaceOverview

最后小输入测试为:

大输入测试,运行命令:

你还可以控制测试多少轮:

最后一个数字表示测试3轮。

转载原创文章请添加微信:founderparker

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
从1-4惨败到主帅瘫坐教练席!泰山换帅选谁?答案就在这几个人里

从1-4惨败到主帅瘫坐教练席!泰山换帅选谁?答案就在这几个人里

曹老师评球
2026-04-26 20:05:54
马科斯总算低头,想求中国帮忙拉一把,中方回了四个字:不知感恩

马科斯总算低头,想求中国帮忙拉一把,中方回了四个字:不知感恩

兵说
2026-04-26 08:30:07
随着河南队0-3不敌上海申花 ,赛后产生了5个不争事实

随着河南队0-3不敌上海申花 ,赛后产生了5个不争事实

生活新鲜市
2026-04-27 01:23:22
蛇吞象?生产歼-20的中国军工巨头174亿就被收购了,用意耐人寻味

蛇吞象?生产歼-20的中国军工巨头174亿就被收购了,用意耐人寻味

趣文说娱
2026-04-23 19:52:36
64岁俞敏洪独居北京,妻儿定居加拿大原因曝光,原来他是身不由己

64岁俞敏洪独居北京,妻儿定居加拿大原因曝光,原来他是身不由己

阅微札记
2026-04-24 14:49:10
Shams:联盟已开始调查掘金和森林狼冲突,预计G5前公布结果

Shams:联盟已开始调查掘金和森林狼冲突,预计G5前公布结果

懂球帝
2026-04-27 02:37:02
笑不活了!女孩把鸡画得圆肥被判不合格,家长把鸡的照片发给老师

笑不活了!女孩把鸡画得圆肥被判不合格,家长把鸡的照片发给老师

夜深爱杂谈
2026-04-25 07:33:34
雷来了,周末15家公司利空,11被st,2家退市,2家被立案调查!

雷来了,周末15家公司利空,11被st,2家退市,2家被立案调查!

风风顺
2026-04-27 00:00:04
上海突然掀桌子:这次救市不太对劲,真正想救的,其实不是楼市

上海突然掀桌子:这次救市不太对劲,真正想救的,其实不是楼市

林子说事
2026-04-26 15:48:02
凯恩:若再轻易丢球权、控制不了对手的反击,那巴黎会更致命

凯恩:若再轻易丢球权、控制不了对手的反击,那巴黎会更致命

懂球帝
2026-04-26 21:04:42
网友开盒挂出“深圳派出所烟男”名单,微博官方:严重违规,已关号处理

网友开盒挂出“深圳派出所烟男”名单,微博官方:严重违规,已关号处理

极目新闻
2026-04-26 17:45:26
记者:高下立判,阿隆索34场6负下课,阿韦洛亚23场7负仍留任

记者:高下立判,阿隆索34场6负下课,阿韦洛亚23场7负仍留任

懂球帝
2026-04-26 19:19:07
中国第四艘航母官宣:是核动力!舷号19,命名大概率是“江苏号”

中国第四艘航母官宣:是核动力!舷号19,命名大概率是“江苏号”

谛听骨语本尊
2026-04-25 14:44:21
斯诺克世锦赛战报:8强已产生4席,赵心童13-9丁俊晖,吴宜泽9-7

斯诺克世锦赛战报:8强已产生4席,赵心童13-9丁俊晖,吴宜泽9-7

体育就你秀
2026-04-27 07:21:36
全网唱衰的下嫁!嫁普通人5年,前任是法拉利总裁,终究还是输了

全网唱衰的下嫁!嫁普通人5年,前任是法拉利总裁,终究还是输了

橙星文娱
2026-04-18 16:42:58
“新管理层对我不友好”,东方甄选四大主播集体离职!俞敏洪公开致歉:是平台的损失

“新管理层对我不友好”,东方甄选四大主播集体离职!俞敏洪公开致歉:是平台的损失

都市快报橙柿互动
2026-04-26 10:57:49
连续三天嫖娼一次嫖俩,花800元毁掉一手女神好牌,他图什么?

连续三天嫖娼一次嫖俩,花800元毁掉一手女神好牌,他图什么?

街上的行人很刺眼
2026-04-25 10:55:49
只喝烧开的自来水,不碰桶装水,不买矿泉水,最后结果如何?

只喝烧开的自来水,不碰桶装水,不买矿泉水,最后结果如何?

芹姐说生活
2026-04-26 15:17:10
闻泰科技一季报可能会超出看空人士的想象

闻泰科技一季报可能会超出看空人士的想象

风风顺
2026-04-27 03:05:03
新娘确实漂亮,但我更喜欢戴眼镜那个。

新娘确实漂亮,但我更喜欢戴眼镜那个。

动物奇奇怪怪
2026-04-12 12:44:36
2026-04-27 08:35:00
FounderPark incentive-icons
FounderPark
关注AI创业,专注和创业者聊真问题
1198文章数 160关注度
往期回顾 全部

科技要闻

打1折!DeepSeek输入缓存降价

头条要闻

高市用双语表态:得知特朗普总统安然无恙 我如释重负

头条要闻

高市用双语表态:得知特朗普总统安然无恙 我如释重负

体育要闻

森林狼3比1掘金:逆境中杀出了多孙穆?!

娱乐要闻

仅次《指环王》的美剧,有第二季

财经要闻

事关新就业群体,中办、国办发文

汽车要闻

预售19.38万元起 哈弗猛龙PLUS七座版亮相

态度原创

家居
手机
教育
本地
公开课

家居要闻

自然肌理 温润美学

手机要闻

vivo Y600 Pro配备 6.83 英寸 1.5K 护眼屏,新机明天见!

教育要闻

小学找规律,6,9,13,16,(),25,难住老师

本地新闻

云游中国|逛世界风筝都 留学生探秘中国传统文化

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版