PG·电子(中国文化有限公司)- 数字纹身技术领航者

『行业资讯』提供数字纹身行业最新动态,包含PG电子技术突破、市场数据及行业趋势,年发布专业资讯120+篇。

大模型“自动修bug”能力将提升豆包开源多语言代码修复基准

2025-05-31  

  IT之家 4 月 10 日消息,豆包大模型团队今日通过官方公众号宣布,首个多语言类 SWE 数据集 Multi-SWE-bench 现已正式开源,可用于评估和提升大模型“自动修 Bug”能力。

  在 SWE-bench 基础上,Multi-SWE-bench首次覆盖 Python 之外的 7 种主流编程语言,是真正面向“全栈工程”的评测基准。其数据均来自 GitHub issue,历时近一年构建,以尽可能准确测评和提高大模型高阶编程智能水平。

  Multi-SWE-bench 旨在推动自动编程技术从仅能解决单一语言(如 Python)和低复杂度的任务,朝着支持多语言、具备真实问题解决能力的通用型智能体迈进。

  SWE-bench 是当前最具代表性的代码修复评测基准,强调任务真实、难度高。它基于 GitHub issue,要求模型自动定位并修复 Bug,兼具跨文件修改、复杂语义推理与上下文理解等挑战。

  Multi-SWE-bench 旨在补全现有同类基准语言覆盖方面的不足,系统性评估大模型在复杂开发环境下的“多语言泛化能力”,推动多语言软件开发 Agent 的评估与研究,其主要特性如下:

  首次覆盖 7 种主流编程语言(包括Java、Go、RuPG电子官方网站st、C、C++、TypeScript、JavaScript),构建多语言开发环境下的代码修复任务,系统评估模型的跨语言适应与泛化能力;

  引入任务难度分级机制,将问题划分为简单(Easy)、中等PG电子官方网站(Medium)和困难(Hard)三类,涵盖从一行修改到多文件、多步骤、多语义依赖的开发挑战;

  1,632 个实例全部来源于真实开源仓库,并经过统一的测试标准和专业开发者的审核筛选,确保每个样本具备清晰的问题描述、正确的修复补丁以及可复现的运行测试环境。

上一篇:投融界观察:联袂杭州六小龙AI编程教育站上风口
上一篇:全面屠榜!谷歌最强编程模型提前释出碾压Claude 37

猜你喜欢

  • 2025听两会丨全国人大代表李紫微:可出台、完善违规向未成年

    2025听两会丨全国人大代表李紫微:可出台、完善违规向未成年

      央广网北京3月1日消息(记者 李洪鹏)近年来,文身行为呈现出低龄化趋势,不少未成年人由于图案冲击、新奇感以及偶像影响等因素叠加,盲目跟风文身。对此,3月1日,全国人大代表、辽宁省辽阳市特殊教育学校教师李紫微接受央广网记者采访时表示,建议出台、完善违规向未成年人提供文身服务的处罚措施,对违规向未成年人提供文身...
  • 魔法图纹 锁与钥匙的时尚纹身一些简单好看的纹身展示

    魔法图纹 锁与钥匙的时尚纹身一些简单好看的纹身展示

      纹身艺术是最令人印象深刻的身体点缀形式之一,通过使用独特和艺术的纹身设计,一定要注意。虽然像天体,动物,花和水一样的元素已经成为纹身设计中使用的一些主要的元素,但一些纹身爱好者已经看到了一些创新元素,如锁和关键纹身。主要纹身不仅具有时尚的吸引力,而且非常有意义,这使得他们成为两性和世界各地纹身爱好者的受欢迎...
  • 纹身设计在线生成

    纹身设计在线生成

         图怪兽是一款极简易操作的在线设计工具,为您提供了纹身设计在线生成设计模板,您还可以找到更多的纹身设计在线生成图片素材,如:公众PG电子官方平台号首图、易拉宝展架、banner、PPT等。 模板的设计PG电子官方平台风格有卡通、 手绘、中国风、小清新...
  • 麦肯锡(McKinsey):2025年技术趋势展望报告

    麦肯锡(McKinsey):2025年技术趋势展望报告

         麦肯锡《2025年技术趋势展望报告Technology Trends Outlook 2025》指出:“人工智能不仅是一股强大的技术浪潮,更是其他趋势的放大器,它正通过与其他趋势的组合,加速机器人训练、推进生物工程发现、优化能源系统,并解锁更多可能...

手机扫一扫添加微信