(来源:磐创AI)
开源项目观察AI Scientist-v2:第一个 AI 生成、被顶会接收的论文AI 自己做科研
Sakana AI 发布了一个令人震惊的项目:AI Scientist-v2。
它生成的论文,被 ICLR 2025 Workshop 接收了。
这是历史上第一篇完全由 AI 自主生成、通过同行评审的科学论文。
什么是 AI Scientist-v2
AI Scientist-v2 是一个端到端的自主科研系统。
它能够:
:给定一个研究主题,AI 自动提出可验证的假设
:自动设计实验、运行代码、分析结果
:统计检验、可视化、结果解读
:生成完整的学术论文(LaTeX 格式)
全程无需人类干预。
v1 vs v2:不同的设计哲学
AI Scientist 之前有一个 v1 版本。v2 是完全重写的。
特性 | v1 | v2 |
|---|---|---|
模板依赖 | 依赖人工撰写的模板 | 无需模板 ,完全自主生成 |
适用场景 | 目标明确、有成熟框架的任务 | 开放性科学探索 |
成功率 | 高(模板约束) | 较低(更开放) |
创新性 | 受限于模板 | 更高的潜在创新性 |
v2 的设计哲学是:当你不知道答案时,探索比模仿更有价值。
核心技术:Agentic Tree Search
v2 采用了 Best-First Tree Search (BFTS) 算法。
流程:
:基于主题描述,AI 生成多个研究想法
:对每个想法,进行实验探索 - 探索可能的代码修改 - 运行实验 - 分析结果 - 如果失败,尝试 Debug(最多 N 次重试)
:将成功的实验写成论文
关键创新:不再需要人工撰写的论文模板。v2 可以从零开始生成任何领域的论文结构。
工作流程详解
Step 1: 准备研究主题
创建一个 Markdown 文件,描述你想探索的研究领域:
Title: Improving Transformers with better attention mechanisms Keywords: attention, transformer, efficiency TL;DR: 探索更高效的注意力机制 Abstract: ... Step 2: 运行 Ideation
python ai_scientist/perform_ideation_temp_free.py \ --workshop-file "my_research_topic.md" \ --model gpt-4o-2024-05-13 \ --max-num-generations 20 \ --num-reflections 5 这会生成 20 个可能的研究假设。
Step 3: 运行实验
python launch_scientist_bfts.py \ --load_ideas "my_research_topic.json" \ --load_code \ --add_dataset_ref \ --model_writeup o1-preview-2024-09-12 \ --model_citation gpt-4o-2024-11-20 \ --model_review gpt-4o-2024-11-20 整个流程大约需要数小时,最终会生成一篇 PDF 论文。
成本估算
阶段 | 成本 |
|---|---|
Ideation | 几美元(取决于模型和迭代次数) |
实验 | 约 $15-20(使用 Claude 3.5 Sonnet) |
论文撰写 | 约 $5 |
单次完整运行,大约 $20-25。
风险提示
AI Scientist-v2 会执行 AI 生成的代码。
这意味着:
可能使用危险的包
可能进行无限制的网络访问
可能启动意外进程
必须在隔离的沙箱环境中运行(如 Docker)。
官方建议:谨慎使用,所有风险自负。
必须披露
使用 AI Scientist-v2 生成的论文,必须在论文中明确声明:
"This manuscript was autonomously generated using The AI Scientist."
这是许可证的强制要求,也是学术诚信的基本要求。
总结
AI Scientist-v2 代表了一个重要的里程碑:
AI 第一次独立完成从假设到论文的全流程,并被顶级学术会议接收。
当然,它不是万能的: - v2 成功率低于 v1 - 复杂领域的效果不如简单领域 - 仍需要人类设定研究边界
但它的意义在于:证明了 AI 可以做真正的科学研究,而不仅仅是「辅助」人类。
GitHub:https://github.com/SakanaAI/AI-Scientist-v2 论文:https://pub.sakana.ai/ai-scientist-v2/paper