不管大家关不关注,AI 行业仍然再疯狂的发展中,几乎每一个重磅级玩家都再默默深耕自己的领域。
DeepSeek 团队每次出手都会让行业震惊,就在这两天 DeepSeek 刚发布了一个新模型,在国内外的AI圈都炸锅了!
DeepSeek-OCR!
![]()
什么意思呢?
OCR?不是你理解的图像文字识别那套技术,而是想从另外一个角度来解决 AI 的记忆问题。
DeepSeek-OCR 想做的事很简单:先把一大段文字“变成图”,再用少量图像 Token 编码内容,实现了比文本 Token 更高的“信息压缩率”。
比如 1 万字≈5,000 文本 Token,用图像表示或许仅需 ~512 个 Token。
它用“视觉表示”来压缩文本(把整页当图来编码),能把需要的 Token 数量减少7~20 倍。
这意味着同样的篇幅,用更少的“格子”装下,长上下文更便宜、更稳定。
以前 1 万字很快就把上下文塞满;现在先“光学压缩”成少量视觉 Token,再交给 LLM 处理,单次可处理的材料长度显著提升,长文摘要、跨文档问答不再动不动超限。
DeepSeek-OCR 的意义不在“又做了个 OCR”,而在于用视觉把文本高效打包:
同样的信息更省 Token、更快处理、更易被大模型长距离理解——这对“长文档 + LLM”的所有应用,都是实实在在的降本增效。
大家有没有发现。
当所有的大厂都再卷应用的时候,DeepSeek 团队一直再深耕底层的技术,做 AI 大模型最基础的研发。
可以让 AI 以更低的成本,更高效的方式,变革的更聪明,并且他们研究出来后就开源了,可以让整个行业受益。
有武侠小说中扫地僧的感觉,不管外界如何纷纷扰扰,我就专心去做我应该去做的事情。
当大家都快遗忘的时候,偶尔出来震惊大家一把!
同时间, OpenAI 已正式发布 AI 浏览器「ChatGPT Atlas」!
Atlas 不只是一个能聊天的浏览器,而是能直接理解网页内容、帮你完成任务的 AI 浏览器。
例如,它能读取你正在浏览的网站内容,帮你总结、回答问题,甚至在“Agent 模式”下自动执行操作,比如帮你订餐、查资料、或整理网页信息。
![]()
更厉害的是,它支持“浏览记忆”(Browser Memories),能记住你浏览过的内容并在未来使用。
比如可以问:“总结一下我上周看过的招聘网站趋势。”同时这些记忆是可控的,可以随时删除或关闭。
目前已发布 MacOS 版本,Windows / iOS / Android 在路上。
行业真的是越来越热闹,真的很好奇再过 10 年, 很期待 我们的世界会被 AI 改造成什么样子。
想象一下:你在国内花 10 块拿货,在海外能卖 X 美金,这就是跨境电商,不是噱头,是趋势。
出海有35倍理论,国外用户付费率比国内多5倍,汇率有7倍的差距,5*7=35倍红利。
我们做了6个店,每月营收都在高速增长;合作伙伴一个员工负责十几个店单人单月营收十几万,关键利润率在30-50%+。
出海跨境,做了,你才知道世界有多大。
我最近在做这个项目,如果你想了解怎么入局、怎么找货、怎么赚美刀,加我注里微信,通过后回复关键字【跨境】,给你发资料。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.