Anthropic 开源“思维追踪”工具,可视化揭秘 AI 内部逻辑
创始人
2025-05-30 15:12:36

IT之家 5 月 30 日消息,Anthropic 昨日(5 月 29 日)发布博文,宣布推出“思维追踪”(Circuit Tracer)开源工具,以图形化方式,追踪并展示 AI 大语言模型的内部思维过程。

该工具通过构建“归因图”(Attribution Graph),帮助研究者可视化模型内部运作,并支持交互式探索。这一项目由 Anthropic Fellows 程序的参与者与专注 AI 解释性研究的 Decode Research 团队联合推动,旨在提升 AI 安全性。

Circuit Tracer 已在 GitHub 平台以开源库形式发布,研究者可通过由 Decode Research 运营的 Neuronpedia 平台,使用交互式前端查看“归因图”。

用户使用该工具,不仅能生成自定义的归因图,追踪支持模型的内部逻辑,还能对图形进行标注、分享,甚至通过调整特征值观察模型输出的变化,从而验证研究假设。

Anthropic 表示,当前对 AI 内部结构的理解远远落后于其功能进步。开源这些工具将助力更广泛的社区深入探究语言模型的内部运作,理解模型行为,并为工具的改进和扩展提供可能。

IT之家附上参考地址

相关内容

热门资讯

饶晓志与王俊凯“双向奔赴” ,... 转自:北京日报客户端当王俊凯首次站上话剧舞台,当饶晓志时隔十多年后重新登台,当十年前的小剧场佳作《蠢...
东城原创话剧《问骨》再现文人风... 转自:北京日报客户端今年是居住在北京锡拉胡同的清末著名金石学家、甲骨文发现者王懿荣诞辰180周年。1...
有国际艺术大展,也有甜蜜风暴来... (来源:上观新闻)一场充满仪式感的“星光篝火聚会”点亮了前滩夜晚,“前滩星光王国·暖暖友约”冬日季由...
“罐”军是如何炼成的 □本报记者 康亚飞 全球每10个易拉罐罐体,就有1个产自巩义;国内每3个罐盖,也有1个来自巩义。 党...
《自然》:中国在近90%关键技... 观点网讯:12月14日,根据《自然》杂志报道,中国在近90%的关键技术领域处于全球领先地位。独立智库...