网易首页 > 网易科技 > IT业界 > 正文

一周AI大事:DeepSeek炒股“封神”,OpenAI自建浏览器"抢饭碗"

0
分享至

一、重磅工具:视觉语言开源模型DeepSeek-OCR发布,浓缩的不是精华是算力

新闻: DeepSeek发布视觉语言开源模型DeepSeek-OCR,参数量30亿,致力于实现对图像和PDF文档的稳健理解。该模型采用类MIT许可证(MIT-style license),已经上线HuggingFace。DeepSeek同时还公布了相关代码及技术论文《DeepSeek-OCR:上下文光学压缩》(DeepSeek-OCR:Contexts Optical Compression)。

DeepSeek-OCR的独到之处在于,这款视觉语言模型极大提升了图像压缩极限,同时仍能保持高质量的OCR识别结果。实验表明,当文本token数量不超过视觉token数量的10倍时(即压缩比低于10倍),模型对OCR文档的解码准确率可达97%……这让大语言模型(LLM)在历史长上下文压缩、记忆遗忘机制等研究领域展现出可观的潜力。

DeepSeek-OCR不仅是一款高效的SOTA OCR模型,还通过使用基于视觉的文本压缩技术,为长上下文管理提供了新思路。人们借此可以用更少的token数量(仅为直接阅读文本的十分之一)理解图像中的文本。

锐评: 10倍压缩率换97%的准确率,这“浓缩”技术有点东西。

二、AI技术与产品发布:新品“下饺子”,大厂卷到爆

1. 新闻: OpenAI推出ChatGPT Atlas,这是一款适用于macOS的桌面AI浏览器,它集网页浏览、ChatGPT功能以及可选的“浏览器记忆”功能于一身。OpenAI将ChatGPT Atlas宣传为“内置ChatGPT的浏览器”,提供与ChatGPT账户绑定的第一方浏览器体验。部分评测者认为其好于AI浏览器竞品Perplexity Comet,但也有评论指出这款工具虽有潜力,但尚未成为一款可靠的AI工具。

OpenAI发布AI浏览器ChatGPT Atlas (来源:网易科技报道)

锐评: OpenAI下场造浏览器,AI也开始上网冲浪。

2. 新闻: Anthropic推出网页版Claude Code。这个基于浏览器的界面可用于执行并行编码任务并连接到GitHub。其研究预览版支持隔离沙盒环境、任务导向和自动PR生成等功能。现已向Pro和Max订阅用户开放。Anthropic概述了其基于沙盒的安全控制措施,并分享了设置文档的链接。

锐评: AI写代码,debug的屁股还不是要人擦?

3. 新闻: OpenAI为ChatGPT引入“公司知识” (company knowledge) 功能。这一功能可帮助用户集中管理内部文档、常见问题解答和术语等公司内部信息,使ChatGPT的答案更能反映组织的权威信息源。这一新功能旨在减少定制化检索的复杂性,确保在企业工作区中提供一致且合规的答案。而且企业管理员能控制系统数据治理和访问权限。

锐评: 企业版ChatGPT开小灶了。

4. 新闻: 微软扩展Edge浏览器的AI浏览Copilot模式,新增Copilot智能体操作(例如退订电子邮件或预订酒店)、以及可将浏览历史按主题项目分组的“旅程”(Journeys) 功能。新的标签页聊天、集成搜索/导航以及操作/旅程功能正在预览版中陆续上线。美国用户现可在Edge浏览器中开启Copilot模式。

锐评:Edge化身无微不至的赛博老妈,下一步该提醒你穿秋裤了。

5. 新闻: 谷歌推出一款基于Gemini构建的AI“氛围编程” (vibe-coding) 工具。用户只需输入想法,即可创建Web应用程序。用户在提示词中描述一个应用,AI工具便会编写完整的应用程序代码,并在几分钟内完成部署。这款工具已经上线AI Studio,由Gemini 2.5 Pro提供支持,还具备查看代码、恢复检查点和部署应用等功能。

锐评: 什么软件工厂,在AI面前都是小把戏。

6. 新闻: 宇树科技发布了新一代仿生人形机器人H2。这款机器人有70公斤重,拥有31个自由度、带面部特征的仿生头部以及多种灵巧手选项,现已公开发售。

宇树科技发布H2人形机器人 (来源:网易科技报道)

锐评: 马斯克家的机器人工程师该急了,压力山大。

7. 新闻: 腾讯发布开源世界模型混元世界1.1 (Hunyuan World 1.1)。其能够根据文本、图像或视频输入快速重建3D场景。1.1版扩大了输入范围,支持视频和多张图像。

锐评: 腾讯这波是把元宇宙做成了“速溶茶包”。

8. 新闻: Liquid AI推出轻量级多模态(图像-文本)模型LFM2-VL-3B,专为高效的边缘和服务器部署设计;该模型具备可调的速度和质量,原生支持512×512图像处理。LFM2-VL-3B在一众小型开源模型中具有竞争力,现已登陆Hugging Face。

锐评: 在“终端”搞游击战,主打一个错位竞争。

9. 新闻: 阿里通义千问更新Qwen3-VL系列,新增了小型和大型检查点,包括Qwen3-VL-2B-Instruct和Qwen3-VL-32B-Instruct(含FP8变体)。

锐评: “模型超市”再次上新,从2B到32B任君挑选。

10. 新闻: 艾伦人工智能研究所(AI2)发布olmOCR-2-7B-1025-FP8,这是一个基于Qwen2.5-VL-7B微调的量化OCR模型,适用于处理文档、数学公式、表格和扫描页面。该模型已经上线Hugging Face。

锐评: 老外习惯了抄中国作业。

11. 新闻: 百川智能正式发布Baichuan-M2 Plus医疗大模型,这也是业内首个“循证增强”医疗大模型。该模型自百川今年8月开源的Baichuan-M2医疗推理模型技术基础上升级而来,是百川在医疗AI领域的最新探索。M2 Plus的核心亮点在于其首创的六源循证推理(EAR)范式。这一创新机制对通用大模型在医疗领域长期存在的幻觉问题,提出了有效的解决方案,让AI不再“闭门造车“,而是有理有据地回答问题。

锐评: “循证”紧箍咒能不能真的管住大模型。

12. 新闻: Pokee AI发布“深度研究”开源智能体PokeeResearch-7B,参数70亿,基于Qwen2.5-7B-Instruct微调,它使用RLAIF和推理框架来分解、验证和综合多来源信息。Pokee AI声称其在70亿参数级研究智能体中达到SOTA水平。用户现可通过预览页面访问,模型现已登陆Hugging Face。

锐评: 又一个自称SOTA的7B模型。

13. 新闻: Krea开源实时视频模型Krea Realtime 14B。该模型从Wan 2.1 14B蒸馏而来,能以交互式速度流式生成长视频,首帧生成时间约1秒。相关技术博客解释了模型如何使用“自强制” (self-forcing) 技术使扩散模型自回归,从而实现实时长视频生成。Krea Realtime 14B现已上线Hugging Face。

锐评: 视频实时生成1秒起步,AI要把剪辑师卷成历史。

14. 新闻: Lightricks发布LTX-2。这是一个高保真、支持4K的AI视频引擎,已经集成到LTX套件中,具备音视频同步生成和多种性能模式。LTX-2支持包含故事板、时间轴和角色一致性的端到端创意工作流。Lightricks现已提供相关技术资料、文档和LTX-2试用入口。

锐评: AI快进化到“全自动拍电影”了。

15. 新闻: Hugging Face为AI Sheets添加视觉功能。此次更新允许用户使用开源模型提取和丰富图像数据,将类似电子表格的工作流扩展到文本之外的视觉领域。该版本支持视觉任务的快速原型设计,无需定制的Python流水线。

锐评: 以后Excel里不光能拉数据,还能“拉”图像了。

16. 新闻: BrowserBase发布Director 2.0。这是一款由BrowserBase和Stagehand支持的免费应用程序,可自动执行Web任务。Director 2.0专为智能体“计算机操作”任务设计,可通过BrowserBase在云端部署。Director是BrowserBase AI自动化技术栈的组成部分,与兼容Playwright的AI原生浏览器自动化框架Stagehand并列。

锐评: 堪称懒人福音,但也可能是“摸鱼杀手”。

17. 新闻: 三星与Perplexity AI合作,为2025年智能电视产品线推出专用电视应用,支持直接在屏幕上进行语音和文本AI搜索。用户无需手机即可查询航班、食谱或新闻。

锐评: 电视不止能看,还能想。

18. 新闻: Dropbox正在扩大AI助手和搜索引擎Dash的可用范围。Dash可连接所有工作应用来提高生产力。它现提供自然语言搜索、AI答复和内容组织功能,用户可通过新应用访问,并已集成到Dropbox本身。后续改进有通过Mobius Labs提供的多模态功能以及通过MCP服务器实现应用内搜索。

锐评: 在N个App之间“找东西”的焦虑,现在要靠第N+1个App来解决?

19. 新闻: OpenAI的Sora团队预告“宠物客串” (pet cameos) 功能,表明该视频模型可以将用户的宠物加入生成场景中。更多社交化使用Sora的方式也即将推出。

锐评: 铲屎官做导演不是梦。

三、AI研究资讯:“上帝视角”看地球,“实盘”炒股赚到笑

1. 新闻: 谷歌研究院 (Google Research) 宣布更新并扩大对Google Earth AI的访问范围,包括发布新的图像(Imagery)和人口(Population)基础模型。他们还发布了一个由Gemini提供支持的地理空间推理智能体。该智能体能够链接卫星、人口和环境信号,以回答复杂的现实世界问题(如风暴风险、脆弱社区)。谷歌研究院报告称,该智能体在地球观测任务方面的成绩达到SOTA级别,并能通过融合多模型嵌入(embeddings)改进预测效果。

锐评: 这简直是给AI开了“上帝视角”,现实版“文明”游戏。

2. 新闻: DeepSeek在港大AI-Trader项目中以9.68%的收益率击败GPT、Claude、Gemini等全球顶级模型,成为能够在真实美股市场实现自主盈利的AI交易系统,这标志着AI在金融实盘应用中的重大突破。这意味着,通过DeepSeek赚钱的速度是直接买热门美股基金(QQQ)的8倍,是第二名AI大模型的4倍。

锐评: 这让基金经理情何以堪?

四、AI商业与政策:疯狂吸金获资本青睐,大口吃电遭公众抵制

1. 新闻: Meta宣布AI部门裁员600人,此次裁员主要针对超级智能实验室中的FAIR(基础AI研究)职位。与此同时,Meta正在加大通用人工智能(AGI)研究的招聘力度。Meta首席AI官汪滔称,此举是为了打造更精简、更敏捷的团队,专注于研发可扩展的模型。

锐评: 这是要集中火力冲“超级智能”。

2. 新闻: IBM和Groq宣布建立合作伙伴关系,共同推动企业级智能体。IBM将通过Watsonx Orchestrate开放GroqCloud推理服务,以实现低延迟智能体工作流。合作计划包括将Red Hat支持的vLLM与Groq的LPU架构集成,并在GroqCloud上支持IBM Granite模型。

锐评: 老牌巨头联手新锐架构。

3. 新闻: OpenAI宣布收购多位苹果资深员工创办的初创公司Software Applications。这家公司致力于打造一款面向Mac的AI驱动用户界面。作为此次收购的一部分,OpenAI将把Software Applications打造的AI助手Sky整合进ChatGPT,包括这款产品在macOS上的集成能力与其产品设计理念。同时,Software Applications的整个团队将加入OpenAI。交易的具体财务条款尚未披露。

锐评: 颇有“师夷长技以制夷”的味道。

4. 新闻: 通用汽车宣布从2026年开始,将谷歌的Gemini AI助手集成到其车辆中。Gemini助手将通过OTA (over-the-air) 更新提供给配备OnStar (安吉星) 的车型,直接连接到车辆导航和诊断系统中。通用汽车的目标是将其发展为完全定制的GM AI界面,以提升驾驶员的安全性和便利性。

锐评: 以后开车不止有“安吉星”客服,还有个“全知全能”的AI副驾。

5. 新闻: Stability AI与艺电合作开发游戏工具,将其AI图像模型和创意AI工具引入艺电的游戏内容工作流。这标志着Stability AI继续向企业级创意工具领域推进。

锐评: 以后游戏里的NPC和风景可能都是“一键生成”的。

6. 新闻: AI原生内容创作平台LiblibAI(哩布哩布AI)于近日已完成1.3亿美元(约合人民币9.2亿元)B轮融资,由红杉中国、CMC资本以及一家大型互联网公司战略投资部联合领投。

这是今年以来国内AI应用领域公开的最大一笔融资,超过了此前Manus在5亿美元(约合人民币35.6亿元)估值下完成的8000万美元(约合人民币5.7亿元)融资纪录。仅在2024年一年内,LiblibAI就完成了三轮融资,累计金额达数亿元人民币。

锐评: AI应用赛道终于跑出了个“吸金兽”。

7. 新闻: Netflix在第三季度财报电话会议上宣布“全力投入”生成式AI。首席执行官泰德·沙兰多(Ted Sarandos)强调AI在加速剧本创作和视觉特效 (VFX) 方面的积极作用,预计到2026年可节省15%到20%的成本。Netflix将AI视为饱和市场中获取竞争优势的利器,认为公司可利用AI工具进行内容创作、个性化推荐并提高生产效率。

锐评: 网飞这波操作是要把好莱坞工会气爆。

8. 新闻: 据《纽约时报》报道,全球范围内对AI数据中心的抵制情绪日益高涨。这些数据中心给当地电网和水源带来巨大压力,墨西哥的停电和智利的缺水问题相继引发人们的反对。智利政府正面临AI投资的两难境地,一方面在讨论为科技中心提供数十亿美元补贴来支持经济发展,另一方面则面临公众因数据中心造成资源枯竭而产生的愤怒。

锐评: AI数据中心要成“电老虎”和“水耗子”?

9. 新闻: Meta与Blue Owl Capital成立270亿美元的合资企业,为Hyperion AI数据中心提供资金。Meta与Blue Owl Capital管理的基金成立合资公司,共同开发位于路易斯安那州的Hyperion数据中心园区,其中Blue Owl拥有80%的股份,Meta保留20%。这笔交易凸显出建设AI基础设施所需的巨额资本。

锐评: 钞能力不够,也可以找人来凑。

10. 新闻: 英国AI安全研究所(AI Security Institute)发布一份中期《先进AI安全的国际科学报告》。该报告由来自世界各地的74位AI专家共同撰写,旨在为即将举行的峰会上的多边政策讨论提供信息。该报告总结了当下对通用AI以及风险管理方法的理解。

锐评: 74位专家“会诊”AI风险,阵仗挺大。

11. 新闻: 特斯拉正式宣布,Cybercab将于2026年第二季度开始量产。公司CEO埃隆・马斯克(Elon Musk)在财报电话会议上表示:“产能扩张的最大来源将是Cybercab,其生产将于明年第二季度启动。这款车完全是为实现完全自动驾驶而优化设计的。事实上,它没有方向盘和踏板,真正实现了对每英里综合运营成本的极致优化。”

锐评: 这次会不会又是狼来了的故事?

五、AI观点与文章:特斯拉前大佬泼冷水,超级智能还差N个9

新闻: 特斯拉人工智能和自动驾驶部门(Autopilot)原负责人安德烈·卡帕斯(Andrej Karpathy)最近在接受硅谷知名科技播客主持人Dwarkesh Patel采访时,就AI发展时间线和进展发表了评论,引发热议。卡帕斯表示,要让AI智能体完全实现相当于人类员工的水平,大约还需要十年时间。他认为,AI智能体目前缺乏足够的智能、多模态能力、计算机使用能力和记忆力,尚未达到真正实用的程度。

一些人认为他是在反驳AI乐观主义者,但他在X平台上发帖澄清,自己并非AI怀疑论者:

“我对AI时间线的预测,可能比你在旧金山AI圈派对或X上看到的要悲观5到10倍,但相比日益增多的AI否认者和怀疑论者,我仍然算乐观。”

他明确表示相信AI会持续进步,但通往AGI和超级智能的道路目前来看将是计算和自动化领域的“艰苦跋涉”(grinding continuation),而非“奇点”(singularity):

“我认为这就像社会自动化的进程……我感觉很多事物会逐渐自动化,而超级智能就是这种趋势外推的结果。”

卡帕斯关于AI进展的推理,源于他在自动驾驶汽车研发中吸取的惨痛教训:AI改进的每一步都比前一步困难得多:

“这是一场‘九的进军’(a march of nines),每多一个9(指90%、99%、99.9% 等)都需要等量的工作。所以当你做出一个演示,某个功能在90%的时间里都可用时,那只是……第一个9。然后你还需要第二个9、第三个9、第四个9和第五个9。”

锐评: AI在前往9个9的路上喘粗气。(辰辰)

相关推荐
热点推荐
真的要夸夸香飘飘,居然能请到莎莎穿长裙拍商务照,

真的要夸夸香飘飘,居然能请到莎莎穿长裙拍商务照,

小光侃娱乐
2026-03-25 12:40:06
原来他们是夫妻,《冬去春来》他中年大火,与妻因戏生情恩爱17年

原来他们是夫妻,《冬去春来》他中年大火,与妻因戏生情恩爱17年

揽星河的笔记
2026-03-25 19:31:09
俄罗斯宣传三天攻占爱沙尼亚!炮制公投,又是特别军事行动?

俄罗斯宣传三天攻占爱沙尼亚!炮制公投,又是特别军事行动?

项鹏飞
2026-03-24 20:28:43
他是CBA现役最老球员,打了20年拿5冠,身家过亿,已为退役铺路

他是CBA现役最老球员,打了20年拿5冠,身家过亿,已为退役铺路

以茶带书
2026-03-25 16:35:52
黄油欧美卖爆,顿顿都离不开,为啥中国人却不爱,超市也很少卖?

黄油欧美卖爆,顿顿都离不开,为啥中国人却不爱,超市也很少卖?

揽星河的笔记
2025-12-08 13:30:38
18岁的姚晨在肯德基工作时的一张照片,那时就难掩浑身的好气质

18岁的姚晨在肯德基工作时的一张照片,那时就难掩浑身的好气质

娱你同欢
2026-03-17 16:08:28
美媒:对不起歼-20和歼-35,“新款”F-22战斗机已经揭开神秘面纱

美媒:对不起歼-20和歼-35,“新款”F-22战斗机已经揭开神秘面纱

零度Military
2026-03-26 22:20:35
重磅:欧盟冻结匈牙利160亿欧元援助!反制欧尔班的关键一招

重磅:欧盟冻结匈牙利160亿欧元援助!反制欧尔班的关键一招

项鹏飞
2026-03-26 20:50:33
泰国U23主帅:中国队是支很强劲的队伍,这场比赛对我们有益

泰国U23主帅:中国队是支很强劲的队伍,这场比赛对我们有益

懂球帝
2026-03-26 10:30:13
参数全赢,销量没赢:尚界Z7销量输给小米SU7!差哪呢?

参数全赢,销量没赢:尚界Z7销量输给小米SU7!差哪呢?

生活魔术专家
2026-03-26 18:07:46
以色列真敢丢核弹!美国顶流媒体警告:四种情况下以色列会动核武

以色列真敢丢核弹!美国顶流媒体警告:四种情况下以色列会动核武

星辰大海路上的种花家
2026-03-25 13:09:41
黄一鸣回应公开孩子父亲身份:你不给抚养费,我就用你的流量赚钱

黄一鸣回应公开孩子父亲身份:你不给抚养费,我就用你的流量赚钱

每一次点击
2026-02-22 12:02:41
美军最不愿看到的事发生:又一架战机被击中,仓皇往航母方向跑

美军最不愿看到的事发生:又一架战机被击中,仓皇往航母方向跑

阿龙聊军事
2026-03-26 20:32:20
约基奇背靠背均贡献15+15+15历史首人!穆雷:叹为观止

约基奇背靠背均贡献15+15+15历史首人!穆雷:叹为观止

北青网-北京青年报
2026-03-26 20:51:06
黄晓明回应考博失利今年再战:希望自己有一天能成功,因为我们家没有博士,想做家里第一个博士

黄晓明回应考博失利今年再战:希望自己有一天能成功,因为我们家没有博士,想做家里第一个博士

台州交通广播
2026-03-26 19:49:12
公积金新调整!4月1日起,职工可自愿提高缴存比例

公积金新调整!4月1日起,职工可自愿提高缴存比例

另子维爱读史
2026-03-25 22:28:47
大反转!U23国足球员劝架染红原因终于找到了,球迷曝光现场视频

大反转!U23国足球员劝架染红原因终于找到了,球迷曝光现场视频

侃球熊弟
2026-03-26 00:36:57
估值420亿!刘强东押注宇树科技!

估值420亿!刘强东押注宇树科技!

新零售参考Pro
2026-03-25 14:22:05
我说送他鼠标,结果他开口就要799的鼠标,太下头了…

我说送他鼠标,结果他开口就要799的鼠标,太下头了…

夜深爱杂谈
2026-03-21 19:15:14
美军发布战果,摧毁中国产战机,伊朗空军损失殆尽

美军发布战果,摧毁中国产战机,伊朗空军损失殆尽

爱吃醋的猫咪
2026-03-22 22:29:08
2026-03-26 22:55:00

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

健康
教育
时尚
数码
房产

转头就晕的耳石症,能开车上班吗?

教育要闻

骂人没有杀伤力?那不是白忙活吗?

这些才是适合春季的穿搭!不沉闷、不单调,大方靓丽又减龄

数码要闻

Intel IBOT加速技术揭秘!硬件不变 白嫖22%游戏性能

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

无障碍浏览 进入关怀版
×