阿里巴巴集团控股有限公司发布了其 Qwen 系列中的一款新型人工智能模型。据该公司介绍,这款模型能够处理文本、图片、音频和视频信息,而且运行效率颇高,可直接在手机和笔记本电脑上使用。
该公司表示,目前这款新模型已在 Hugging Face 和 GitHub 上公开发布,预计将被用于构建所谓的 AI 智能体。比如,它可以通过实时音频描述,帮助视障人士在周围环境中辨别方向。
自今年大力投入人工智能技术领域以来,阿里巴巴一直以惊人的速度推出人工智能产品。在 DeepSeek 于 1 月份引发广泛关注后的几天内,这家中国电子商务和云计算领域的龙头企业就推出了不同版本的 Qwen 模型。本月初,该公司又发布了其人工智能助手夸克应用程序的新版本。
当然,阿里巴巴并非唯一一家开发多模态模型的人工智能研发企业。OpenAI 和字母表公司(Alphabet Inc.)旗下的谷歌,都推出了能够处理文本、音频等不同类型输入信息的生成式人工智能工具。周二,OpenAI 进一步拓展了其功能,为 ChatGPT 增添了更高级的图像生成能力。
阿里巴巴在声明中称,其新款 Qwen2.5-Omni-7B 系统在语音理解和生成方面展现出了极高的性能。
这家由马云联合创办的互联网企业计划在人工智能和云计算网络方面投入比过去十年更多的资金。随着模型的不断演进,对计算能力的需求也在持续增长,阿里巴巴希望成为那些致力于开发人工智能并将其应用于现实世界的公司的重要合作伙伴。
自 DeepSeek 凭借据称仅花费数百万美元就构建出的强大模型,对 OpenAI 形成挑战以来,中国的科技领军企业迅速向市场推出了一系列低成本的人工智能服务,对 OpenAI 和谷歌等公司的高端产品造成了冲击。
尽管目前尚不清楚这些人工智能产品是否能够与西方人工智能研发商的前沿系统相媲美甚至超越它们,但这些新的选择无疑给美国领先企业的商业模式带来了更大的压力。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.