Thomson Reuters近期将旗下CoCounsel法律工具与Anthropic的Claude大语言模型相连接,为CoCounsel用户提供了一种新的访问方式,以便法律专业人士借助AI系统开展工作。
Thomson Reuters首席技术官(CTO)Joel Hron在接受采访时表示,这两款应用体现了通用AI与行业专用AI之间的差异。在法律领域,这种差异具体表现为法律事务的商业属性与实务属性之间的区别。
他说:"通过Claude可以完成很多事情,也能获得不错的输出结果,但在法律领域,'足够好'远远不够。当你需要向法院递交动议、站在法官面前,或者处理涉及声誉、客户利益乃至资金结果的事务时,要求就会截然不同。"
跟上AI的发展节奏
Hron于2022年随技术初创公司ThoughtTrace被Thomson Reuters收购而加入该公司,ThoughtTrace曾开发了一套用于尽职调查的文档分析系统。收购完成后,Hron先后担任公司AI负责人,并于2024年升任CTO。在这一职位上,他主导Thomson Reuters全球产品和服务组合的产品工程及AI研发工作。
鉴于AI的变革速度——大约每六个月便会发生重大转变——Hron坦言,部分组织可能难以跟上这一节奏。
结合自身经历,他说:"我的职业生涯走过了许多意想不到的弯路,而适应能力在这种环境中对我帮助极大。我们正在经历的变化速度,要求人们具备高度的判断力。你需要能够坚持自己的观点,但同时也要随时准备好改变这些观点。"
在初创公司的工作经历让他打下了坚实的基础,学会了如何通过他所说的"极度专注并快速行动"来取得成功。
快速适应的能力是AI项目成败的关键因素之一,也关乎组织能否迅速完成模型的切换和替换。他对技术和业务负责人的建议是:确保组织对决策的形成过程有深入理解,涵盖流程分析、组织设计和文化建设等方面。
面向智能体AI的构建
CoCounsel与Claude的MCP连接代表了Thomson Reuters CoCounsel法律产品的持续演进。Hron表示,CoCounsel的终极目标是打造具备受信赖级别表现的AI产品。虽然AI正在深刻改变法律行业——被用于在数秒内起草、摘要和分析文件——但他指出,要确保输出内容有权威来源支撑、经过准确性验证并可追溯至原始出处,依然十分困难。正因如此,Thomson Reuters在过去三年里持续探索如何为法律行业打造智能体AI工作流。
大约九个月前,公司决定从零开始重建CoCounsel,采用Hron所说的"以智能体为先、以编码智能体为导向,并与Anthropic展开合作"的方式。他说:"我们专注于让智能体原生访问我们的内容工具,并开放了所有信息,使智能体能够利用这些工具发现、规划和执行工作。"
在他最引以为豪的开发成果中,有一个名为"CoCounsel Bench"的评估框架。谈及其中的工作量,Hron说:"我们与内部专家共同投入了数十万小时,开发出这套框架,以便从智能体开发的角度持续提升能力,同时帮助我们判断是否在法律各细分领域取得了切实进展。"
CoCounsel产品开发始于2023年,彼时Thomson Reuters以6.5亿美元收购了CaseText——后者以GPT-4为底层能力,将CoCounsel打造成了一款AI法律助手。今年5月,Thomson Reuters宣布与Anthropic完成模型上下文协议(MCP)集成,将Claude直接与CoCounsel法律产品相连接。这使法律专业人士能够在通用AI与基于引用的法律工作之间无缝切换,无论在哪种工作环境下均可实现。
Hron表示,虽然99.99%的开发精力都投入在CoCounsel本身,但对使用MCP的智能体AI工作流的支持,主要涉及身份验证,以及确保连接的安全性与私密性,并以适当方式保护客户数据。
尽管MCP连接器可以由Claude用户调用以与CoCounsel通信,但Hron认为更常见的情况是:Claude主动访问CoCounsel,自行获取完成任务所需的信息。
"Claude会自行制定工作计划和路径,并根据需要反复迭代,次数由它自己决定。正因如此,我们对这些与CoCounsel交互方式的预期保持着较大的容错空间,"他说。
系统会分析使用模式,并通过速率限制和访问限制来防止CoCounsel过载。Hron补充道:"这些机制与API速率限制的设计思路非常相似,很多方面几乎是一样的。"
智能体编程
当被问及对六个月后AI发展走向的判断时,Hron表示:"软件工程师的工作方式已经与六个月前有了根本性的不同,这一转变正是由智能体编程工具驱动的。"
这一变化的背后,是大语言模型本身的持续进步。但他指出,同样发生演变的,还有智能体的工作范式,以及它们模拟人类行为的方式。在他的亲身实践中,这已经改变了软件开发的模式。
对于六个月后将会发生什么,Hron预测:"我认为你将看到其他工作领域出现同样的模式变化。"
他相信,智能体将在更多人性化的场景中发挥作用,而为了确保其行为的可追责性与可信度,人类监督机制必须内嵌于工作流程之中。这一点在软件开发流程中已有所体现。
"在编程领域,这是自我管理的,"Hron说,"比如在GitHub上,有代码差异对比工具,有PR审查流程,也有用于审核项目各阶段的阶段门控机制,这些都保障了可审计性。"
"随着智能体AI开始向其他领域渗透,人类的治理与监督将变得极为重要,"他补充道。
Q&A
Q1:CoCounsel与通用AI工具(如Claude)有什么本质区别?
A:CoCounsel专为法律实务设计,其核心优势在于输出内容能够追溯至权威法律来源,经过准确性验证,并具备可信赖级别的表现。而Claude等通用AI虽然能产出不错的结果,但在需要向法院提交文件、维护客户声誉或涉及资金利益的场景下,"足够好"远远不够,CoCounsel正是为填补这一差距而生。
Q2:Thomson Reuters是如何重建CoCounsel的?
A:大约九个月前,Thomson Reuters决定从零重构CoCounsel,采用"智能体优先、编码智能体导向"的开发方式,并与Anthropic深度合作。团队开放了所有内部信息和内容工具,使智能体能够自主发现、规划和执行法律任务。同时开发了名为"CoCounsel Bench"的评估框架,投入数十万小时与内部专家共同构建,用于衡量在法律各细分领域的实际进展。
Q3:智能体AI大规模应用后,人类监督的角色是什么?
A:Hron认为,随着智能体AI渗透到更多工作领域,人类治理与监督将变得极为关键。他以软件开发为例指出,GitHub上的代码差异对比、PR审查和阶段门控机制已经形成了一套可审计的自我管理体系。他预测,其他行业也需要建立类似的内嵌式人类监督机制,以确保智能体行为的可追责性与可信度。