![]()
阿里近日为千问App配上了数字人形象“小酒窝”。
这个3D写实风格助手能听懂“帮我订周五晚上七点西湖边的川菜馆,然后叫一辆半小时后从公司出发的车”,并自动调用高德打车或淘宝闪购完成预定。
千问小酒窝的特点不只是可视化形象,而是它背后串联阿里生态内多个App的能力。
从技术实现看,千问App接入了淘宝、飞猪、高德、支付宝、大麦等服务的API接口。用户发出一个包含多个步骤的指令后,千问的大模型会拆解意图,依次调用不同服务的功能模块,并在执行过程中保持上下文连贯。
例如订机票加酒店加接送机,系统需要先查航班余票,选定时段后锁定座位,同时调取酒店房态,再匹配接送机车辆的可用时段。
整个链条中任何一个环节失败,都需要回滚或给出替代方案。阿里方面没有公布这类多步任务的成功率。
据行业测试数据,当前主流智能体面对真实场景的复杂指令,平均得分在1.23到2.20之间(满分5分)。这意味着多步任务在现阶段仍有一定比例的失败可能。
数字人形象的加入,目的是降低用户对这套操作的心理门槛。有形象、有表情、有声音的交互方式,比纯文字对话更容易让用户建立直观感受。
千问App上线两个月,C端月活突破1亿,主要集中在学生和白领群体。这部分用户对新鲜交互方式的接受度较高,同时对效率也有要求。如果数字人对话与手动打开几个App逐个操作相比耗时更短,用户更可能持续使用。
目前市场上其他大厂的数字人产品,多数聚焦在单一场景。字节跳动的Seedance 2.0主要用于视频生成和实时交互,腾讯混元的HunyuanVideo-Avatar侧重3D动作生成和开源生态。
像千问这样试图用一个数字人打通多个垂直服务场景的做法,属于不同的技术路线。跨App串联执行需要处理多个服务的接口标准、数据格式和容错机制,用户中途修改指令也会增加系统重新规划的复杂度。
千问小酒窝的实际体验还在用户验证阶段。一个开放的问题是,当用户习惯了在各自独立的App里快速完成操作,转向一个数字人助手来统一调度,需要满足哪些条件。
两个关键因素是多步任务的成功率,以及完成同样任务所节省的时间。如果千问能做到平均一次多步指令的耗时低于手动操作,用户可能会改变习惯。具体数据有待后续公布。
[本文作者i黑马,i黑马原创。如需转载请联系微信公众号(ID:iheima)授权,未经授权,转载必究。]
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.