
—— ·要点速览· ——
1、清华开源 TurboDiffusion:AI 视频生成最高提速 200 倍,单张 RTX 5090 秒出大片
2、阿里通义 Qwen-lmage-Edit-2511 图像编辑 AI 模型开源,支持两人隔空“合照”
3、腾讯混元推出 ETC 领域首款 AI 智能体,问题解决率达 90%
4、人形机器人概念股涨幅扩大 浙江荣泰午后涨停
更聚焦的科技行业交流群,捕捉每一条科技动态,诚挚邀请创业者、发烧友加入我们。微信扫码进群:
进群后,你有机会得到:
最新、最热的科技资讯;
最精准的行业资源对接;
论坛、沙龙、企业游学门票。
![]()
1、国产一体化航天任务仿真设计软件研发商「星邑空间」完成3亿元Pre-A轮融资,由深创投领投,开源思创、盛景资本、智宸财富等跟投。
星邑空间是一家国产一体化航天任务仿真设计软件研发商,公司以“航天测运控+”为发展理念,聚焦航天器测运控服务、空间操控软件、航天测运控网一体化解决方案三大主营业务,致力于为国内外客户提供专业、优质、可靠的航天器测运控服务及相关软硬件产品。
2、具身智能机器人研发应用服务商「云深处科技」完成数亿元Pre-IPO融资,由上海国盛集团领投,京东跟投。
云深处科技是一家具身智能机器人研发应用服务商,专注于人形、四足机器人及其核心零部件的自主研发、精益生产、全球销售与专业服务。公司坚持自主创新,构建了“感知-决策-执行”全链路技术体系,其核心的多模态环境感知、跨场景具身导航、AI驱动的感控融合运动控制等新技术,已在多个新场景中应用落地。其自主研发的“绝影”系列机器人在电站、工厂、管廊巡检、以及应急救援、消防侦查、未来科研等多种应用环境中落地应用,曾在地下管廊服务亚运,参与新加坡国家电网项目,实战参演应急使命抗震救灾、燃爆侦察实战演习。
3、零碳运力超充快换解决方案提供商「智锂物联」完成1亿元B轮融资,由九智资本领投。
智锂物联是一家零碳运力超充快换解决方案提供商,公司具备新能源重卡换电整体解决方案及软硬件设备的供应能力。国内首家集电池PACK、车载换电系统、换电装备、换电运营优化、电池安全监管于一体的数字化重卡换电能源运营解决方案提供商。
4、AI智能备考系统研发商「登榜教育」完成天使轮融资。
登榜教育是一家AI智能备考系统研发商,聚焦军队文职招录考试专业化培训,业务高度契合国家国防现代化建设与人才强国战略,精准把握招录政策动态与命题规律,形成“应试辅导+岗位胜任力培养”的差异化服务模式。
5、多模态感知和AI计算解决方案提供商「一目科技」完成数亿元D2轮融资,由博原资本领投,中网投、顺为资本、TCL创投跟投。
一目科技是一家多模态感知和AI计算解决方案提供商。公司打造了以微光谱AI芯片和流体识别传感器为核心的多模态感知+AI计算解决方案,它将物理世界信号转化为数字世界信号,传送给目标用户,帮助家电、水务、机器人、生命科学等多个产业实现智慧升级。一目科技的多模态感知+AI计算解决方案已广泛应用于智慧水务、智慧家居(智慧净饮、智慧洗涤)、生命科学等领域,并已打入了TCL、惠而浦、松下等头部白电厂商的供应链。
![]()
1、清华开源 TurboDiffusion:AI 视频生成最高提速 200 倍,单张 RTX 5090 秒出大片
12 月 25 日消息,清华大学 TSAIL 实验室联合生数科技推出开源视频生成加速框架 TurboDiffusion,该框架能在保持视频质量的前提下,将端到端扩散生成的推理速度提升 100 至 200 倍。
在技术方面,TurboDiffusion 为实现极致的推理速度,采用了 SageAttention 和 SLA(稀疏线性注意力机制)来加速注意力计算,显著降低了模型处理高分辨率视频时的算力开销。
其次,团队引入了 rCM(时间步蒸馏)技术,有效减少了扩散模型的采样步数。这些技术方案的深度融合,让模型在保持生成效果一致性的基础上,大幅削减了计算延迟。 GitHub 页面公布的实测数据展示了惊人的性能跃升。在单张 RTX 5090 显卡上测试 Wan-2.1-T2V-1.3B-480P 模型,生成 5 秒视频的原版耗时为 184 秒,而 TurboDiffusion 仅需 1.9 秒。对于参数量更大的 Wan-2.2-I2V-A14B-720P 模型,原版生成耗时高达 4549 秒(约 1.2 小时),TurboDiffusion 将其压缩至 38 秒。
附上相关检测结果如下:即便是在 Wan-2.1-14B-480P 模型上,耗时也从 1676 秒骤降至 9.9 秒,速度远超目前市面上的FastVideo等加速方案。
TurboDiffusion 目前已提供多种规格的模型权重下载,并针对不同硬件进行了针对性优化。针对 RTX 5090、RTX 4090 等显存有限的消费级显卡,团队提供了量化版(Quantized)权重,并建议开启线性层量化功能;而对于拥有 80GB 以上显存的 H100 等工业级显卡,则推荐使用非量化版本以获得最佳效果。(36氪)
2、阿里通义 Qwen-lmage-Edit-2511 图像编辑 AI 模型开源,支持两人隔空“合照”
12 月 25 日消息,阿里通义千问今日宣布 Qwen-Image-Edit-2511 正式开源。 Qwen-Image-Edit 是阿里通义团队推出的图像编辑模型。2511 版本中着重进行了包括一致性提升在内的多项增强,新版本的整体生成质量、尤其是人物生成质量,得到显著提升。
Qwen-Image-Edit-2511 的主要特性包括:提升了角色一致性 集成了 Lora 能力,例如打光、多场景 提升了工业设计能力 提升了几何推理能力 从具体案例来看,Qwen-Image-Edit-2511 提升了角色的一致性在 Qwen-Image-Edit-2511 中,角色的一致性获得了提升,模型可以依据输入肖像图进行具有想象力的编辑,并维持输入肖像的人物一致性。
此外,Qwen-Image-Edit-2511 的多人合照的一致性也进一步提升了。Qwen-Image-Edit-2509 相比于 Qwen-Image-Edit 提升了单人合照的一致性,而 Qwen-Image-Edit-2511 又进一步提升了多人合照的一致性,这种一致性使得可以输入两张人物照片,并返回一致性很好的合照。
Qwen-Image-Edit-2511 的一个新的特色是集成了部分社区的有趣 Lora Qwen-Image-Edit。Qwen-Image-Edit-2511 集成了这些 Lora,因此基础模型本身就具备一些 Lora 效果。(IT之家)
3、腾讯混元推出 ETC 领域首款 AI 智能体,问题解决率达 90%
12 月 25 日消息,腾讯混元今日官宣推出 ETC 领域首款 AI 智能体。据介绍,基于混元大模型,腾讯云和安徽驿路微行科技有限公司联合推出 ETC「助手 Agent」,通过文本或语音发出指令,智能体可精准理解并高效执行。
官方数据显示,自今年 4 月启动内测以来,该智能体已服务超百万用户,问答准确率达 95%、问题解决率达 90%。ETC 助手基于腾讯混元大模型,融合多模态交互技术,不仅可以通过传统的文本输入方式提问,更可体验 AI 增强的语音交互方式获取 ETC 服务。 例如,用户发出“开启畅行模式”的指令,智能体会调高设备灵敏度,获得设备快识别、高速快抬杆的通行体验。
从腾讯混元官方获悉,ETC 领域首款 AI 智能体可通过 105 种状态监测算法实时采集设备运行数据,并借助语音交互与关键状态播报;在执行层,既可作为行业百科答疑解惑,也能实现语音直接控制设备。(钛媒体)
![]()
1、人形机器人概念股涨幅扩大 浙江荣泰午后涨停
![]()
人形机器人概念股涨幅扩大,浙江荣泰午后涨停,埃夫特、拓斯达涨超14%,力星股份涨超9%。(东方财富Choice数据)
![]()
“ 一句话,AI 手机怎么搞,需要产业的广泛共识,需要 Super Agent 和 Super App 之间的共识。”
朋友,来这场峰会瞅瞅。
更多干货分享敬请注我们的公众号与视频号~超多精彩对话内容等待您的解锁!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.