尽管AI在科学研究中的应用取得了显著进展,但目前仍缺乏对AI在科学研究(AI4Research)中应用的全面综述,为了填补这一空白,提出了一个全面的AI4Research调查,旨在提供一个统一的视角,并系统地分类AI在研究中的应用。
AI4Research的主流流程和分类,可以分为五个关键领域:(1)用于科学理解的AI,(2)用于学术调查的AI,(3)用于科学发现的AI,(4)用于学术写作的AI,以及(5)用于学术同行评审的AI。这些领域各自有助于提升AI融合研究与出版的有效性和效率。
AI在研究中的分类(AI4Research)被划分为五个关键领域。每个领域进一步细分为具体任务,突出了AI在整个研究过程中多样化的角色。
一、用于科学理解的AI
AI能够从科学文献中提取、解释和综合信息,加速人类知识获取和自动分析效率。这包括文本科学理解(如半自动和全自动科学理解)以及表格和图表科学理解。
半自动科学理解:AI在人类指导下逐步深入理解复杂科学文献。例如,LaMAI通过提问澄清用户查询中的模糊点,减少误解;SciAgent通过调用计算器和公式评估器提供精确推理。
全自动科学理解:AI独立阅读和理解科学文献,无需人类干预。例如,通过生成文章总结来增强对长篇科学文本的整体理解,或通过自我提问和反思来深化对科学内容的理解。
表格理解:AI通过数据增强和推理范式增强来提取、解释和推断表格中的数据。例如,Chain-of-Table通过逐步构建和更新表格来提高对复杂表格的理解。
图表理解:AI能够直接处理和解释图表图像,支持基于图表内容的问题回答和总结。例如,ChartQA和ChartX用于训练端到端和流水线模型,FDV提供图表的结构化文本表示,以实现更深入的理解。
二、用于学术调查的AI
AI技术可以系统地回顾和总结科学文献,帮助研究人员快速了解研究领域的最新进展。这包括相关工作检索和概述报告生成。
语义引导检索:通过匹配用户查询的语义表示与文献中的术语来检索相关文献。例如,GTSLNet通过基于关键词的相似性学习网络提高检索的准确性;
图引导检索:将学术实体(如论文、作者、引用)建模为图结构,基于节点类型和粒度进行检索。
LLM增强检索:利用LLM的能力提升检索系统的性能。例如,单智能体检索直接使用LLM完成检索任务;多智能体检索通过多个专业智能体简化检索过程;深度研究则进一步向更自主的“深度研究”方向发展,AI智能体能够从探索和综合到生成引用丰富的报告。
研究路线图绘制:对大量文献进行清理、整合,描绘研究主题的发展轨迹。例如,CHIME通过迭代人类-AI协作细化LLM生成的结构;HiReview使用多层树结构进行系统知识组织;SurveyEval提供层次化标题树,用于评估综述生成的分布和引用准确性。
章节级相关工作生成:生成相关工作章节,与实际论文结构对齐。
文档级调查生成:自动生成系统性文献综述。例如,AutoSurvey通过提示词引导LLM完成阶段性生成过程;
三、用于科学发现的AI
AI用于生成新的科学假设、理论或模型,并验证其有效性。这涉及想法挖掘、新颖性和重要性评估、理论分析和实验设计。
想法挖掘:AI从内部知识、外部信号和团队讨论中生成新科学假设或想法。
新颖性与重要性评估:AI评估想法的新颖性和重要性,结合传统方法、LLM增强和人机协作。
理论分析:AI验证科学假设的合理性,包括主张形式化、证据收集、验证分析和定理证明。
科学实验开展:AI设计、执行和分析科学实验,涵盖实验设计、前估计、管理、执行和分析。
全自动发现:AI实现从假设生成到实验验证的全流程自动化,形成闭环科学发现过程。
四、用于学术写作的AI
AI工具协助研究人员撰写、编辑和格式化科学论文,提高写作质量和效率。这包括在论文准备、撰写和完成阶段的辅助。
写作准备阶段:AI帮助生成论文标题、优化结构、确保内容连贯性,例如通过MoDeST和LLM-Rubric等工具生成多领域科学标题。
写作阶段:AI协助绘制图表、生成公式、推荐引用,例如FigGen和SciCapenter等工具支持从文本到图表的生成,ScholarCopilot等工具实现智能引用推荐。
写作完成后阶段:AI进行语法纠错、表达和逻辑修订,例如通过AWE系统和AAAR-1数据集提供写作质量评估,Wikipedia Revision Histories数据集帮助优化语言表达。
AI独立完成从草稿撰写到最终稿件生成的全过程,无需人工干预。例如,AI Scientist和Agent Laboratory等系统通过模拟同行评审和反馈循环,优化生成的论文内容,但目前尚未完全消除人工编辑的需求,特别是在正确引用方面。
五、用于学术同行评审的AI
AI自动化和增强同行评审过程,提供结构化、客观和建设性的评审。这包括预评审、评审和后评审阶段。
预评审:AI在桌面评审阶段快速评估稿件是否符合要求,并在审稿人匹配中实现精准分配,同时避免利益冲突。
正在评审:AI生成评审意见和综合评审报告,提升评审质量和效率,减少主观性和偏见。
后评审:AI预测论文影响力并生成宣传材料,提升论文的可见度和影响力。
AI在研究中的多学科应用:
自然科学中的AI,涵盖物理学、生物学与医学以及化学与材料科学等领域