
—— ·要点速览· ——
1、苹果发布 Pico-Banana-400K 数据集:含 40 万张图像,帮助训练 AI 图像编辑模型
2、探迹科技推出针对AI数字员工打造的大模型智能体平台
3、酷开旗下创视科技发布AI物业服务平台
4、打造 AI 编程界“瑞士军刀”:GitHub 推 Agent HQ,目标统一管理所有智能体
5、英伟达最新宣布!量子计算板块大爆发
更聚焦的科技行业交流群,捕捉每一条科技动态,诚挚邀请创业者、发烧友加入我们。微信扫码进群:
进群后,你有机会得到:
最新、最热的科技资讯;
最精准的行业资源对接;
论坛、沙龙、企业游学门票。
![]()
1、智慧教育服务提供商「温纳斯」完成1000万元天使轮融资。
温纳斯是一家智慧教育服务提供商,聚焦教育信息化,依托自研的计算机视觉AI技术和图像识别算法,打造理化生实验教学云平台与AI智能测评方案,推动实验教学全流程的可视化与集成化管理。通过自主研发的智能终端设备,公司持续深化“互联网+教育”场景应用,助力校园智能化转型。
2、营销Agent视频生成工具开发商「极致上下文」完成数百万美元股权融资,投资方为HT investment,百度风投。
极致上下文是一家营销Agent视频生成工具开发商,前端通过多模态交互理解企业品牌调性和需求,后端整合各种AI模型能力,直接交付成品视频。
3、非侵入式脑机接口技术解决方案供应商「BrainCo强脑科技」完成2000万美元股权融资,投资方为三七互娱。
强脑科技是一家非侵入式脑机接口技术解决方案供应商,是首家入选哈佛大学创新实验室(HarvardInnovation Lab)的中国团队,致力于脑机接口技术底层技术的突破,通过在大脑和外部设备之间建立信号传送通路实现两者信息交换的方式为残疾人康复、孤独症等脑疾病提供了解决方案。产品线主要围绕医疗康复、健康管理及教育科技领域展开:智能仿生假肢、开星果社交沟通训练系统、神经电子消费品等。
4、智能AMR系统提供商「松智达机器人」完成500万元天使轮融资,投资方为中楝投资。
松智达机器人是一家智能AMR系统提供商,专注于智能制造与柔性物流系统技术,公司以“复合机器人”技术为核心,融合激光SLAM、视觉识别、物联网与边缘计算等前沿技术,致力于为制造业客户提供从移动底盘、机械臂协同作业到整场调度的全流程自动化解决方案。产品已广泛应用于汽车、电子、锂电池、半导体、医药、光伏等多个行业。
5、毫米波雷达芯片研发商「矽杰微电子」完成C1轮融资,由中信建投资本领投,启泰资本、元科创投跟投。
矽杰微电子是一家毫米波雷达芯片研发商,公司孵化于上海微技术工业研究院,专注于毫米波雷达芯片开发,深耕毫米波雷达传感器在消费领域、工业领域、以及汽车领域中应用落地。矽杰微电子已经完成24/60/77GHz三个毫米波雷达芯片产品线的开发,面向六个细分领域的应用场景,实现了数百万颗的产品交付,客户包括世界500强以及细分行业全球前10的企业。
![]()
1、苹果发布 Pico-Banana-400K 数据集:含 40 万张图像,帮助训练 AI 图像编辑模型
10 月 29 日消息,苹果公司发布了 Pico-Banana-400K,这是一个包含 40 万张图像的研究数据集,有趣的是,该数据集是利用谷歌的 Gemini-2.5 模型构建的。
据了解,苹果的这个研究成果名为《Pico-Banana-400K:面向文本引导图像编辑的大规模数据集》(Pico-Banana-400K: A Large-Scale Dataset for Text-Guided Image Editing),该公司还发布了由此生成的包含 40 万张图像的完整数据集。该数据集采用非商业性研究许可(non-commercial research license)发布,意味着研究人员和学术机构可自由使用,但不得用于商业用途。
数月前,谷歌推出了 Gemini 2.5-Flash-Image 模型,也被称为 Nanon-Banana,该模型在图像编辑任务中表现出色,被广泛认为是当前最先进的图像编辑模型之一。尽管近年来多个模型在图像生成与编辑方面取得显著进展,苹果的研究团队指出:“尽管技术不断进步,开放研究仍受限于缺乏大规模、高质量且可完全共享的图像编辑数据集。现有数据集往往依赖专有模型生成的合成数据,或仅包含有限的人工筛选子集。此外,这些数据集普遍存在领域偏移(domain shifts)、编辑类型分布不均以及质量控制不一致等问题,严重阻碍了鲁棒图像编辑模型的发展。”
为解决这一瓶颈,苹果团队着手构建一个更全面、更具代表性的图像编辑数据集。
Pico-Banana-400K 的构建过程
研究团队首先从 OpenImages 数据集中选取了大量真实照片,确保涵盖人物、物体及含文字场景等多样化内容。
![]()
然后,团队设计了 35 种不同类型的图像修改指令,并将其归入八大类别,包括:
像素与光度调整(Pixel & Photometric):如添加胶片颗粒或复古滤镜;
以人为中心的编辑(Human-Centric):例如将人物转换为 Funko-Pop 风格的玩具形象;
场景构成与多主体编辑(Scene Composition & Multi-Subject):如改变天气条件(晴天 / 雨天 / 雪天);
对象级语义修改(Object-Level Semantic):如移动物体位置或调整空间关系;
图像缩放(Scale):如放大画面(Zoom in)等。
接下来,研究人员会将一张原始图像连同一条编辑指令输入至 Nanon-Banana 模型进行图像编辑。生成结果随后交由 Gemini 2.5-Pro 模型进行自动评估,判断其是否准确遵循指令并具备良好视觉质量。只有通过双重验证的结果才会被纳入最终数据集。
![]()
Pico-Banana-400K 不仅包含单轮编辑(single-turn edits,即一次提示完成编辑)的样本,还涵盖了多轮连续编辑序列(multi-turn edit sequences),以及“偏好对”(preference pairs)—— 即成功与失败编辑结果的对比样本,帮助模型学习区分理想与不良输出。
尽管研究团队承认 Nanon-Banana 在精细空间控制、布局外推和文字排版处理方面仍存在局限,但他们强调,Pico-Banana-400K 的目标是为下一代文本引导图像编辑模型提供一个坚实、可复现的训练与评测基础。
目前,相关研究论文已发布于预印本平台 arXiv,而完整的 Pico-Banana-400K 数据集也已在 GitHub 上向全球研究者免费开放。(IT之家)
2、探迹科技推出针对AI数字员工打造的大模型智能体平台
10月29日消息,探迹科技推出针对AI数字员工打造的大模型智能体平台,这些数字员工具备类人思考、自主执行、精通业务、适应性强等特征。覆盖B2B、B2C核心业务场景的AI Agent同步推出,如集成销售、营销、触达与分析能力的Agent组合等,推动企业从“人力驱动”迈向“智能驱动”,开启人机协同。目前,探迹科技已与华为、小米、vivo等头部硬件厂商达成合作,打造覆盖多终端、服务多场景的协同生态体系。(广角观察)
3、酷开旗下创视科技发布AI物业服务平台
高通正携新型芯片和计算机进军利润丰厚的AI数据中心市场,旨在在该行业增长最快的领域挑战英伟达。该公司表示,AI200芯片将于明年开始出货,可作为独立组件、可插入现有设备的扩展卡,或作为由高通提供的整机机架服务器的一部分。该产品的首位客户是沙特阿拉伯的人工智能初创公司Humain,该公司计划从2026年开始基于这款新芯片部署200兆瓦的算力。(新浪财经)
4 、 打造 AI 编程界“瑞士军刀”:GitHub 推 Agent HQ,目标统一管理所有智能体
10 月 29 日消息,科技媒体 Windows Report 发布博文,报道称 GitHub 推出全新平台 Agent HQ,其核心目标是统一管理各类 AI 编程智能体,并将其原生集成至 GitHub 的工作流中。
GitHub 官方表示当前开发者在调用 AI 智能体过程中,面临工具分散、上下文频繁切换以及需要管理多个订阅等痛点,而 Agent HQ 的初衷源于开发者的切身体会,希望工具能真正辅助而非阻碍开发者。
![]()
援引博文介绍,此次发布恰逢 GitHub 平台开发者总数突破 1.8 亿的里程碑。数据显示,高达 80% 的新晋开发者在加入平台的第一周内便会使用 Copilot 辅助编程。
Agent HQ 的核心是一个名为 Mission Control 的统一指挥中心。开发者通过该中心,可以协调来自不同提供商的多个 AI 智能体,实现任务分配、进度跟踪和 AI 项目管理。这一操作可以在 GitHub 网站、VS Code、移动端甚至是命令行界面中无缝完成。
此外,平台还内置了名为 Plan Mode 的功能,支持 Copilot 在执行任务前主动提问,以确保充分理解上下文、识别缺失步骤,从而显著提升代码质量。
为满足不同场景的需求,Agent HQ 支持开发者通过创建 AGENTS.md 文件,来构建具有特定规则和行为的自定义智能体。
同时,为了打造强大的 AI 生态,GitHub 已宣布与 OpenAI、Anthropic、谷歌、Cognition 及 xAI 等多家行业领先者展开合作,计划将它们的编码智能体直接整合进 Copilot 订阅服务中。
作为合作的初步成果,Copilot Pro+ 订阅用户从即日起即可在 VS Code Insiders 版本中率先体验 OpenAI Codex 的诸多功能。(IT之家)
![]()
1、英伟达最新宣布!量子计算板块大爆发
![]()
量子计算板块在10月29日表现强势,其中天融信、神州信息涨停;科大国创、国盾量子大涨超10%;西部超导、普源精电也涨幅靠前。
消息面上,北京时间10月29日凌晨,在全球市值最高上市公司英伟达举办的GTC大会上,黄仁勋展示了基于CUDAQ核心构建的开放式系统架构NVQLink,用于连接传统GPU和量子计算机,共同加速量子计算。
不久前,谷歌量子人工智能(AI)实验室研究团队在英国《自然》杂志上发表论文宣布,在谷歌自研的适用于量子计算机的“威洛”芯片上,其新研发的“量子回声”算法实现了首个可验证的量子优势。该研究团队表示,“量子回声”算法运行速度比世界上最快的超级计算机之一——美国“前沿”计算机运行的经典算法快1.3万倍。
公开资料显示,A股不少上市公司正直接或间接参与量子计算,比如国盾量子,作为量子计算龙头企业,正致力于量子信息技术的全面产业化。科大国创、格尔软件、吉大正元等也积极参与量子计算领域。而ST复华、铜牛信息、天融信则与相关量子公司签订了战略合作协议。还有部分公司通过投资间接参与了量子计算领域,比如博实股份(持有本源量子部分股权)、浙江东方(旗下基金投资国盾量子)等。
国金证券表示,2024年全球量子计算产业规模已达50.4亿美元,预计在2024至2030年间将以87.64%的年平均增长率(CAGR)快速增长。随着专用量子计算机在特定领域相较于经典计算的显著优势逐步显现,预计2027年量子计算产业规模将跃升至111.8亿美元。此后,在专用量子计算机的深度应用与通用量子计算机技术持续进步的双重推动下,产业规模有望迎来爆发式增长,预计2035年将突破8000亿美元,量子计算产业将迈向全面成熟与商业化。(东方财富研究中心)
![]()
“AI命运掌握在实践者手里。 ”
更多干货分享敬请关注我们的公众号与视频号~超多精彩对话内容等待您的解锁!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.