网易首页 > 网易号 > 正文 申请入驻

DeepSeek内部数据库泄露;ChatGPT仿DeepSeek升级推理交互;Claude全球服务宕机 | 极客头条

0
分享至

「极客头条」—— 技术人员的新闻圈!

CSDN 的读者朋友们好,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。

整理 | 箭蛙

出品 | CSDN(ID:CSDNnews)

一分钟速览新闻点!


  • 前阿里高管张斯成评论 DeepSeek 热议,呼吁理性对待开源项目

  • DeepSeek 内部数据库因配置问题暂时可被访问

  • ChatGPT 优化推理功能展示,与 DeepSeek 采用类似交互设计

  • Claude 全球服务突发中断,Anthropic 紧急启动故障排查

  • 阿里宣布 Qwen2.5-Max 旗舰模型 API 定价

  • 吴恩达:DeepSeek 崛起凸显 AI 领域四大趋势

  • 谷歌发布 Gemini 2.0 Flash 模型,Imagen 3 图像生成技术同步升级

  • OpenAI 新轮融资估值或达 3400 亿美元,软银拟投资最高 250 亿美元

  • 扎克伯格公布 Llama 4 研发进展,将主打原生多模态和代理能力

  • DeepSeek R1 70B 登陆 Cerebras 平台,推理速度较 GPU 提升 57 倍

  • OpenAI 为欧洲多国用户推出新功能,包括视频共享和自定义指令更新

  • Waymo 在亚特兰大启动完全无人驾驶测试,年内将与 Uber 合作推出服务

  • 微软将 DeepSeek R1 模型引入 Azure AI 和 GitHub 平台

  • PyTorch 2.6 发布:加入 Python 3.13 支持并停用 Conda 发布

国内要闻

前阿里高管张斯成评论 DeepSeek 热议,呼吁理性对待开源项目

前阿里钉钉事业部副总裁张斯成在社交媒体发文,就近期 DeepSeek 相关热议分享看法,指出网传“黄教主给股东的信”和“梁文峰的公开信”均为杜撰。他认为 DeepSeek 在技术层面确有创新,主要聚焦于提升算力效率和算法有效性,但关于 PTX 调用是否规避 CUDA 限制仍存在专业争议。

张斯成指出,目前事态发展面临挑战:一方面是外媒对其训练成本的质疑,另一方面是将其过度解读为中美科技竞争。他呼吁给予这一国内优秀开源项目更多包容和发展空间。

他同时强调,尽管 DeepSeek 带来突破,但算力仍是行业刚需,只是市场对高端算力稀缺性的焦虑有所缓解。他建议 DeepSeek 加强危机公关管理,避免陷入不必要的争议。

DeepSeek 内部数据库因配置问题暂时可被访问

外媒 TechCrunch 报道,云计算公司 Wiz 的安全研究人员发现并报告了 DeepSeek 一个数据库的配置问题。该数据库包含用户聊天记录和 API 密钥等信息。Wiz 团队表示,这是由数据库访问权限的默认配置导致,在收到通知后,DeepSeek 已及时调整了相关配置。目前尚无法确认该配置持续了多长时间,以及是否有其他访问情况。

阿里宣布 Qwen2.5-Max 旗舰模型API定价

阿里云通义千问今日宣布其新一代模型 Qwen2.5-Max 的 API 定价:输入令牌价格为每百万/ token 1.6 美元,输出令牌价格为每百万/ token 6.4 美元。

此前,Qwen2.5-Max 模型凭借其在大规模 MoE(混合专家)模型领域的研究成果,在 Arena Hard、LiveBench、LiveCodeBench 和 GPQA-Diamond 等多个基准测试中展现出优异性能。目前,用户可以通过通义千问官方网站的在线对话服务、API 接口以及 Hugging Face 演示平台等多个渠道使用该模型。

国际要闻

吴恩达:DeepSeek 崛起凸显 AI 领域四大趋势

AI 领域知名学者吴恩达近日发表观点,认为 DeepSeek 的爆发性增长揭示了当前 AI 发展的四个重要趋势:

  • 首先,中国在生成式 AI 领域正快速追赶美国。他指出,过去两年中美差距显著缩小,包括 Qwen、Kimi、InternVL 和 DeepSeek 等中国模型在多个领域展现出强劲实力,部分领域甚至已现领先迹象。

  • 其次,开源权重模型正推动基础模型层“平民化”。以 DeepSeek-R1 为例,其每百万 token 定价仅为 OpenAI 的 1/30,大幅降低了开发和使用成本,为应用开发者创造了新机遇。

  • 第三,算法创新正成为 AI 发展的重要路径。受限于硬件条件,DeepSeek 团队通过算法优化,仅用不到 600 万美元的算力成本就完成了模型训练,展示了规模扩张并非进步的唯一途径。

  • 最后,开源模式对 AI 供应链具有重要意义。吴恩达表示,如果美国持续限制开源发展,中国可能在 AI 供应链中占据更重要地位。

Claude 全球服务突发中断,Anthropic 紧急启动故障排查

AI 公司 Anthropic 今日发布服务异常通告,其旗下产品 Claude 的全球服务出现大规模中断。故障表现为用户登录 claude.ai 时遭遇 502 网关错误,出现身份认证失效提示。监测数据显示,中断期间 API 调用失败率峰值达 82%,控制台仪表盘数据延迟超过 15 分钟。

OpenAI 新轮融资估值或达 3400 亿美元,软银拟投资最高 250 亿美元

财联社报道,软银正主导 OpenAI 新一轮融资,计划投资 150 亿至 250 亿美元。此轮融资总规模预计达 400 亿美元,将使 OpenAI 估值升至最高 3400 亿美元,较去年 10 月 1570 亿美元的估值翻倍。

部分资金将用于支持 OpenAI 履行在"星际之门"项目中约 200 亿美元的出资承诺,该项目初期投资额为 1000 亿美元,由 OpenAI、软银各投 190 亿美元,甲骨文和阿布扎比 AI 公司 MGX 投资 70 亿美元。剩余资金将用于支持 OpenAI 业务运营。

谷歌发布 Gemini 2.0 Flash 模型,Imagen 3 图像生成技术同步升级

谷歌今日宣布在 Gemini 应用中推出 Gemini 2.0 Flash 模型,声称是“为了 Agent 时代设计的最新型号”。该模型在多项关键基准测试中展现出更快的响应速度和更强的综合性能,适用于头脑风暴、学术辅助和文本创作等日常场景。官方数据显示,2.0 Flash 的单次推理延迟较前代模型降低 43%,在逻辑推理类任务中的准确率提升 19%。

Gemini Advanced 用户将继续享有 1M token 上下文窗口支持,可处理长达 1,500 页的文档上传,并拥有深度研究(Deep Research)和专属技能包(Gems)等功能的优先使用权。同步升级的还有图像生成模块——最新版 Imagen 3 在细节丰富度和纹理表现力上达到新高度,能更精准理解用户指令完成创意可视化。

目前 2.0 Flash 已通过 Gemini 网页端和移动端向全球用户开放。为保障用户体验连续性,Gemini 1.5 Flash 和 1.5 Pro 版本将在未来数周内继续保留现有对话功能。

ChatGPT 优化推理功能展示,与 DeepSeek 采用类似交互设计

ChatGPT 近期悄然进行了界面更新,新增了一个灯泡图标功能,用户点击后可切换“Use more intelligence”(使用更多智能)和“Think”(思考)两种模式。这一设计使其推理思考功能更加直观可见,与近期广受关注的 DeepSeek 采用了相似的交互方式。

此次更新似乎正在进行灰度测试,不同用户收到的更新内容略有差异。例如,部分 Mac 版本用户发现模型选择按钮除了原有的顶部位置外,现在在输入栏也能进行切换,提供了更便捷的操作方式。

扎克伯格公布 Llama 4 研发进展,将主打原生多模态和代理能力

Meta CEO 马克·扎克伯格在 Facebook 上透露,作为下一代开源 AI 模型,Llama 4 的研发正在稳步推进。其中,Llama 4 Mini 已完成预训练阶段,推理模型和更大规模的模型也展现出良好成果。

与此前 Llama 3 着重于让开源模型追赶封闭模型的目标不同,Llama 4 的定位是成为行业领导者。扎克伯格表示,Llama 4 将是一个原生的多模态“全能模型”,具备智能体能力(agentic capabilities),有望解锁更多新的应用场景。相关详细计划将在未来几个月内陆续公布。

对于 2025 年的 AI 发展,扎克伯格预测将出现重要突破:AI 智能体(agent)有望达到中级工程师水平,具备编程和解决问题的能力。他认为,这将成为历史上最重要的技术创新之一,率先实现这一目标的公司将在 AI 研究和行业格局中占据领先优势。

DeepSeek R1 70B 登陆 Cerebras 平台,推理速度较 GPU 提升 57 倍

AI 芯片公司 Cerebras 今日宣布,DeepSeek R1 70B 模型已在其平台上线。该版本结合了完整版 R1 的推理能力和 Llama 70B 的规模优势,在通用和推理基准测试中的表现超越了 GPT-4o 和 o1-mini,被认为是目前性能最强的 Llama 70B 变体。

在 Cerebras 平台上,R1 70B 的推理速度达到每秒 1,500 个 token,比 GPU 解决方案快 57 倍。例如,在代码生成任务中,Cerebras 平台仅需 1.5 秒即可完成,而 o1 mini 则需要 22 秒。

OpenAI 为欧洲多国用户推出新功能,包括视频共享和自定义指令更新

OpenAI 今日宣布,面向欧盟、挪威、冰岛、列支敦士登和瑞士的用户推出多项新功能。ChatGPT 移动应用的高级语音功能(Advanced Voice)现已支持视频和屏幕共享功能,这项功能此前于 2024 年 12 月首次在其他地区推出。

同时,OpenAI 还在这些地区的 chatgpt.com 网站和 Windows 桌面应用上推出了更新版的自定义指令功能。该功能于 1 月 18 日首次发布,通过全新的用户界面,允许用户自定义 ChatGPT 的回应方式,包括设定其性格特征、对话风格以及遵循的规则等。

这两项功能的欧洲区域推出,标志着 OpenAI 继续扩大其全球服务范围,为更多地区的用户提供完整的 ChatGPT 体验。

Waymo 在亚特兰大启动完全无人驾驶测试,年内将与 Uber 合作推出服务

Waymo 今日宣布在亚特兰大开启完全无人驾驶模式测试,目前仅面向其员工开放。该公司表示,这一进展建立在其在旧金山、凤凰城、洛杉矶和奥斯汀等城市累计超过 3300 万英里自动驾驶经验的基础之上。

Waymo 计划于今年晚些时候通过与 Uber 的独家合作,在亚特兰大向公众推出商业化无人驾驶出租车服务。此外,该公司还将目标瞄准迈阿密市场。目前在奥斯汀的服务仍处于候补名单阶段。

程序员专区

微软将 DeepSeek R1 模型引入 Azure AI 和 GitHub 平台

微软宣布在其 Azure AI 和 GitHub 平台上正式提供 DeepSeek R1 模型服务。开发者现可通过 Azure 一键部署方案快速集成该模型,免去复杂的基础设施搭建过程。微软表示已对模型进行安全测试并集成内容安全过滤功能。

值得注意的是,微软计划推出 R1 的精简版本,使其能够在 Copilot Plus PC 上本地运行。开发者可通过 Azure 账号直接调用 API,或在 GitHub 平台获取更多开发资源和集成指南。

此前,微软曾向所有 Copilot 用户免费提供 OpenAI 的 o1 推理模型。

PyTorch 2.6 发布:加入 Python 3.13 支持并停用 Conda 发布

PyTorch 团队近日发布 2.6 版本,带来多项重要更新:torch.compile 现已支持 Python 3.13,新增性能控制参数 torch.compiler.set_stance,以及多个 AOTInductor 改进。此外,该版本还为 X86 CPU 添加了 FP16 支持。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
金价闪崩创纪录,创40年最大跌幅,普通人何时进场?一招就搞定

金价闪崩创纪录,创40年最大跌幅,普通人何时进场?一招就搞定

丁蓳解说
2026-05-16 05:02:48
U17亚洲杯-万项破门 中国队3比1逆转沙特晋级四强

U17亚洲杯-万项破门 中国队3比1逆转沙特晋级四强

体坛周报
2026-05-16 03:32:18
53岁逆天身材连20岁都嫉妒!从哥伦比亚村姑到红毯女王的开挂人生

53岁逆天身材连20岁都嫉妒!从哥伦比亚村姑到红毯女王的开挂人生

东方不败然多多
2026-05-16 05:04:37
在迪士尼花2000多买「插队特权」怎么激怒普通游客?“排队3小时快要昏厥突然有人插到你前面”

在迪士尼花2000多买「插队特权」怎么激怒普通游客?“排队3小时快要昏厥突然有人插到你前面”

Vista氢商业
2026-05-15 15:21:52
欢迎宴会企业家座位曝光:马斯克、黄仁勋与海信集团贾少谦、福耀玻璃曹晖等同桌吃饭,波音CEO和中国商飞董事长、国航董事长同席

欢迎宴会企业家座位曝光:马斯克、黄仁勋与海信集团贾少谦、福耀玻璃曹晖等同桌吃饭,波音CEO和中国商飞董事长、国航董事长同席

大风新闻
2026-05-15 08:42:09
马斯克为什么不四处合影,拉关系,结交人脉啊,菜真就那么好吃?

马斯克为什么不四处合影,拉关系,结交人脉啊,菜真就那么好吃?

老方
2026-05-15 11:37:48
乌克兰低成本武器多由手工焊接或胶带缠绕 防长:都是消耗品,随时会被击落或炸毁

乌克兰低成本武器多由手工焊接或胶带缠绕 防长:都是消耗品,随时会被击落或炸毁

红星新闻
2026-05-15 18:47:49
女娃被锁车里绝望喝光3瓶水,都没有等到打麻将的父母想起她

女娃被锁车里绝望喝光3瓶水,都没有等到打麻将的父母想起她

第四思维
2025-07-15 13:16:45
今夜,美股大跌500点,欧洲集体跳水,白银暴跌9%!利率风暴,席卷全球

今夜,美股大跌500点,欧洲集体跳水,白银暴跌9%!利率风暴,席卷全球

中国基金报
2026-05-16 00:19:39
小米17T系列定档5月28日,三款新机配置全曝光

小米17T系列定档5月28日,三款新机配置全曝光

摸鱼算法
2026-05-15 03:11:35
捅你一刀,是为了你好

捅你一刀,是为了你好

柴差说
2026-05-14 17:27:50
国宴火了:不追求奢华,只把食材本味/烹饪功底/摆盘美学做到极致

国宴火了:不追求奢华,只把食材本味/烹饪功底/摆盘美学做到极致

魔都姐姐杂谈
2026-05-15 15:06:00
注意!日本机场狂查,大姐8个箱子被海关扒穿,当场罚到沉默!

注意!日本机场狂查,大姐8个箱子被海关扒穿,当场罚到沉默!

东京在线
2026-05-15 16:30:30
为何美国精英一到中国,瞬间收敛随性画风,全员变正经?

为何美国精英一到中国,瞬间收敛随性画风,全员变正经?

荆楚寰宇文枢
2026-05-15 23:18:56
NBA历史总薪资榜:詹姆斯第一,杜兰特、库里、哈登分列2-4名

NBA历史总薪资榜:詹姆斯第一,杜兰特、库里、哈登分列2-4名

懂球帝
2026-05-16 01:22:05
6战5胜!泰国公开赛国羽战报:石宇奇决胜局险胜,陈雨菲横扫晋级

6战5胜!泰国公开赛国羽战报:石宇奇决胜局险胜,陈雨菲横扫晋级

郝小小看体育
2026-05-15 18:38:06
我国取得重大找矿突破!

我国取得重大找矿突破!

证券时报
2026-05-15 21:07:11
两老人捡十几年破烂存五六万,这都下得去手!真正的“骗子”是谁

两老人捡十几年破烂存五六万,这都下得去手!真正的“骗子”是谁

走读新生
2026-05-15 15:05:17
四季酒店什么来头?能让特朗普2026年访华放弃了国宾馆

四季酒店什么来头?能让特朗普2026年访华放弃了国宾馆

翰林冷知识
2026-05-14 23:15:40
“奶奶经常用嘴咬我,”10岁儿子说出真相,妈妈当场崩溃报警

“奶奶经常用嘴咬我,”10岁儿子说出真相,妈妈当场崩溃报警

一丝不苟的法律人
2026-05-14 23:17:13
2026-05-16 05:55:00
CSDN incentive-icons
CSDN
成就一亿技术人
26548文章数 242288关注度
往期回顾 全部

科技要闻

直降千元起步!苹果华为率先开启618让利

头条要闻

黄仁勋在北京喝豆汁痛苦皱眉 问“这是什么东西”

头条要闻

黄仁勋在北京喝豆汁痛苦皱眉 问“这是什么东西”

体育要闻

德约科维奇买的球队,从第6级联赛升入法甲

娱乐要闻

方媛为何要来《桃花坞6》没苦硬吃?

财经要闻

腾讯掉队,马化腾戳破真相

汽车要闻

高尔夫GTI刷新纽北纪录 ID. Polo GTI迎全球首秀

态度原创

房产
时尚
健康
手机
军事航空

房产要闻

老黄埔热销之下,珠江春,为何去化仅3成?

顶级团队拍出来的作品不如素人,问题出在哪儿了?

专家揭秘干细胞回输的安全风险

手机要闻

iPhone 17系列全系跳水,最高立减2500!

军事要闻

乌克兰首都基辅遭空袭 死亡人数增至12人

无障碍浏览 进入关怀版