AI写的论文首次被顶会ACL录用,评分位列投稿前8.2%
创始人
2025-05-30 00:36:02
0

除论文格式调整与绘图外,内容全程无人工参与。

大模型的发展落地日新月异,就在年初,业界还在担心AI生产的学术垃圾充斥论文库,年中,AI生成的论文已经可以被顶会认可了。

5月29日,海外初创公司Intology 宣布,他们的“AI科学家”Zochi的论文被顶会ACL主会议录用,成为首个独立通过 A* 级别科学会议同行评审的AI,同时宣布开放Zochi的Beta 测试。

这一发布的含金量在于,ACL是自然语言处理领域全球排名第一的顶会,其主会议平均录用率通常低于20%,论文需具备突破性创新。据悉,Zochi的论文获得评审最终评分4分,在所有投稿论文中排名前8.2%。

Intology是一家较为陌生的初创公司,从目前官网和博客的信息梳理来看,这家公司是在2025年初新成立的,定位是一个研究智能科学的实验室,两名联创分别是连续创业者Ron Arel和前Meta华人研究员Andy Zhou,两人均毕业于伊利诺伊大学厄巴纳-香槟分校(UIUC)。

Intology成立后,此前3月团队就推出了智能体Zochi,称其为AI科学家,并宣布其研究成果已被ICLR 2025研讨会接收。不过,此前的这一研讨会的论文接收率在60%-70%,要求比顶会的主会低了不少,官方认为,此次更进一步的顶会突破标志着AI达到博士级科研水平,人类博士通常需数年才能在此类会议发表。

具体看此次AI科学家Zochi“写”的论文,主题是关于大模型安全的,名为《Tempest: Automatic Multi-Turn Jailbreaking of Large Language Models with Tree Search》,直译过来是《Tempest:基于树搜索的大模型自主多轮越狱》,简单来说,Zochi利用了一种“树搜索”技术,来探索多种对话路径,逐步突破大模型的安全防线。

研究提出的Tempest框架,能通过多轮对话逐步瓦解模型的安全防线,绕过安全检测,通过小让步的累积完成违规的内容输出。例如,直接让模型回答敏感信息“制作炸弹”,基于安全机制模型会直接拒绝,但通过多轮委婉地引导提问,最终却可以让模型回答出正确的信息。

评估结果显示,Tempest在OpenAI的旧模型GPT-3.5-turbo上的成功率为100%,在GPT-4上的成功率为97%。这一研究主要是揭示了多轮对话攻击的漏洞,可以为设计更佳的AI安全防御提供参考。

值得一提的是,论文的署名是两位联创,但官方博客表示,除论文格式调整与绘图外,内容全程无人工参与,“我们对这项工作负责,但主要的智力贡献是由AI系统完成的” 。

据官方介绍,人类仅输入研究领域,Zochi就可以独立完成后续全流程。Zochi 首先会采集并分析数千篇研究论文,以确定特定领域内有潜力的研究方向。其检索系统能够识别文献中的关键贡献、方法论、局限性以及新兴模式,识别论文之间不明显的联系,并提出创新的解决方案。从提出假设到完成实验,就像一个真正的科学家。

AI科学家并非个例,除了Intology外,Transformer作者Llion Jones去年创立的Sakana AI,也推出了一个基于AI的科研系统“AI Scientist”,论文也已被ICLR 2025研讨会接收,分数为6/7/6。

AI for Science(AI4Science)一直是AI行业最前沿的落地领域之一,人工智能可以极大地促进科学的进步,提高科学家的效率、准确性和创造力。不过,新事物的出现也伴随着合理性和规则适配的争议。

此前3月Intology 推出Zochi、宣布论文被会议接收时,就被不少学术界人士批评,认为这是对科学同行评审过程的滥用,在提交论文前,团队并未知会相关方是AI生成的论文,也未获得同行评审者的同意。

在此次博客最后,官方提到了AI带来的学术伦理问题,认为AI驱动的研究给科学问责和可重复性带来了挑战。但他们认为,虽然 Zochi 自主运营,但人类研究员仍然是作者,并负责验证方法、解释结果并确保符合伦理规范。对于论文,人类作者进行多轮内部审查,并在提交前仔细核实了所有结果和代码。

“我们鼓励在致谢中列出AI系统,而不是将其列为作者。虽然AI驱动的研究提出了关于归属、透明度和问责制的重要问题,但我们认为,智力贡献应该以实质内容而非来源来评判。”Intology官方表示,他们的主要关注点是通过AI工具协助人类研究者。

相关内容

热门资讯

趣活旗下橙途民宿五一假期入住率... 北京2025年5月30日 /美通社/ -- 近日,趣活集团(NASDAQ: QH)旗下橙途民宿(以下...
阿联酋数字化转型取得显著成效 转自:经济日报阿联酋政府数字化转型高级委员会近日发布第二版《数字化转型状况报告》,显示阿联酋在电信基...
旭辉控股集团旗下7只公司债自6... 旭辉集团  视觉中国 资料图5月30日,旭辉控股集团(00884.HK)旗下的旭辉集团股份有限公司发...
萌娃变身“小掌柜” 童趣市集乐...   5月30日,玉泉区通顺街小学的校园里热闹非凡,一场充满童真童趣的跳蚤市集欢乐开启。此起彼伏的叫卖...
俄副外长在北京最新表态 俄副外长表态:俄方高度评价中方就乌克兰局势采取的建设性立场综合塔斯社等俄媒报道,俄罗斯副外长鲁登科5...
博晖创新:获得医疗器械注册证 每经AI快讯,5月30日,博晖创新(300318.SZ)公告称,公司近日获得国家药品监督管理局颁发的...
蒙泰高新:5月30日召开董事会... 蒙泰高新(SZ 300876,收盘价:22.37元)5月30日晚间发布公告称,公司第三届第二十一次董...
时代出版连续3个交易日收盘价格... 5月30日,时代出版(600551)发布公告,公司A股股票在2025年5月28日、29日和30日连续...
长来长往•见证一体化丨11个月... 【编者按】长三角一体化发展,是习近平总书记亲自擘画、亲自推动的国家重大战略。2025年度长三角地区主...
滇池学院赴昭通市大关县慰问学校... 5月27日至30日,滇池学院校长马杰、副校长向晓明一行赴昭通市大关县慰问该校首批云南省体育美育浸润行...
华为揭秘国产算力+国产模型的全... 近日,华为在MoE模型训练领域再进一步,重磅推出参数规模高达7180亿的全新模型——盘古Ultra ...
马关县人民医院6月2日--6月... 尊敬的患者朋友及家属:为让大家能及时了解到我院专家门诊医生坐诊时间安排,方便大家就诊及咨询,现为您提...
亲属短线交易公司股票获利!汇洲...   5月30日,浙江证监局发布公告,对汇洲智能(维权)技术集团股份有限公司(以下简称汇洲智能)副总经...
新筑股份资产重组:注入清洁能源...   作为四川省轨道交通装备领域的龙头企业,新筑股份5月26日公告披露重大资产重组计划:公司于近日收到...
大洋电机:2024年度分红预案... 投资者提问:董秘,你好,公司已经开完董事会了,今年业绩也不错,请问何时分红啊?董秘回答(大洋电机SZ...
重构代驾平台责任体系迫在眉睫 近日,广西消委会经过调查发现,10家代驾平台存在代驾服务协议霸王条款较多、代驾服务保险处于真空地带、...
学习100|加强新兴领域立法有... 伴随着DeepSeek等大语言模型火出圈,生成式人工智能给我们的工作与生活带来越来越多的影响。与此同...
陕西省数据和政务服务局关于面向... 转自:陕西发布5月30日陕西省人民政府网站发布陕西省数据和政务服务局关于面向社会征集全省一体化算力监...
重庆公益组织走进特殊学校 非遗... 中新网重庆新闻5月29日电 (记者 何蓬磊)在“六一”国际儿童节来临之际,29日,“非遗传承·童心筑...
【地评线】荔枝网评:为梦想护航... 2025年全国高考报名人数1335万人。教育部会同国家教育统一考试工作部际联席会议成员单位,强化统筹...