大模型开源
创始人
2025-04-15 06:45:29

  日前,字节跳动豆包大模型团队开源首个多语言类SWE数据集“Multi-SWE-bench”,可用于评估和提升大模型“自动修Bug”能力。在SWE-bench基础上,Multi-SWE-bench首次覆盖Python之外的7种主流编程语言,是真正面向“栈工程”的评测基准。

  豆包大模型团队希望,Multi-SWE-bench能作为大模型在多种主流编程语言与真实代码环境中的系统性评测基准,推动自动编程能力向更实用、更工程化的方向发展。相比以往聚焦Python的单语言任务,Multi-SWE-bench更贴近现实中的多语言开发场景,也更能反映当前模型在“自动化软件工程”方向上的实际能力边界。

相关内容

热门资讯

城市治理“飞”上云端——来自重... “十五五”规划纲要提出,推进低空经济健康有序发展。2026年跻身“新兴支柱产业”的低空经济,早已是各...
开盘暴涨200%,国产运动医学... 作者 | 东台编辑 | 秦酒带量采购全面落地后,运动医学还是一门好生意吗?01市值119亿天星医疗港...
贴近你的“芯” 来源:财经林妹妹为什么王勃会写诗:海内存知己,天涯若比邻?因为将海量的内存屯在身边,则宇宙上任何一个...
省三防办部署做好近期强降雨防御... 转自:茂名发布5月6日,广东省防汛防旱防风总指挥部办公室印发通知,部署各地各有关部门深入学习贯彻习近...
鼎龙股份:三类抛光液产品取得重... 转自:证券时报人民财讯5月6日电,鼎龙股份(300054)5月6日公告,公司控股子公司武汉鼎泽新材料...