2026年2月7日消息,千问Qwen团队联合阿里巴巴AIData团队、晓天衡宇评测社区,正式发布PLaw bench。
![]()
据了解,PLaw Bench基于大模型面对的法律实务咨询场景的现实,模拟真实的咨询场景,并通过三大任务模块和特定的判分标准,来测评大模型的实际法律能力。同时,Plaw Bench的文书生成板块并未止步于格式规范,而是将重点放在案情归纳、策略选择、程序意识等核心诉讼实务能力的考察上。在数据集构建上,为了确保评测的公正与高效,我们邀请了39位法律专家对850道题目完成三轮交叉质检,并通过API调用了多款主流大模型进行作答。
![]()
此外,对法律从业者而言,在使用AI辅助办案时,不应盲目追求“最强”的通用模型,而应根据具体工作场景来选择在该项任务上表现最佳的“专家”模型。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.