观点网讯:4月10日,字节跳动豆包大模型团队宣布正式开源首个多语言类SWE数据集——Multi-SWE-bench。这一数据集旨在评估和提升大模型的“自动修Bug”能力,标志着在提升编程错误修复方面迈出重要一步。
Multi-SWE-bench基于SWE-bench,首次覆盖了除Python外的7种主流编程语言,包括Java、Go、Rust、C、C++、TypeScript和JavaScript。这为全栈工程师提供了一个全面的评测基准,有助于更准确地测评和提高大模型的高阶编程智能水平。
免责声明:本文内容与数据由观点根据公开信息整理,不构成投资建议,使用前请核实。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.