Anthropic 开源“思维追踪”工具,可视化揭秘 AI 内部逻辑
创始人
2025-05-30 15:12:36
0

IT之家 5 月 30 日消息,Anthropic 昨日(5 月 29 日)发布博文,宣布推出“思维追踪”(Circuit Tracer)开源工具,以图形化方式,追踪并展示 AI 大语言模型的内部思维过程。

该工具通过构建“归因图”(Attribution Graph),帮助研究者可视化模型内部运作,并支持交互式探索。这一项目由 Anthropic Fellows 程序的参与者与专注 AI 解释性研究的 Decode Research 团队联合推动,旨在提升 AI 安全性。

Circuit Tracer 已在 GitHub 平台以开源库形式发布,研究者可通过由 Decode Research 运营的 Neuronpedia 平台,使用交互式前端查看“归因图”。

用户使用该工具,不仅能生成自定义的归因图,追踪支持模型的内部逻辑,还能对图形进行标注、分享,甚至通过调整特征值观察模型输出的变化,从而验证研究假设。

Anthropic 表示,当前对 AI 内部结构的理解远远落后于其功能进步。开源这些工具将助力更广泛的社区深入探究语言模型的内部运作,理解模型行为,并为工具的改进和扩展提供可能。

IT之家附上参考地址

相关内容

热门资讯

《折腰》看懂小乔500人马退敌... 宋祖儿、刘宇宁主演的古装剧《折腰》,自开播以来,凭借小乔、魏劭狐狼cp先婚后爱,鲜活群像、女性力量、...
不输横店!迪丽热巴、杨紫、李现... 嘉定不仅拥有深厚的文化底蕴,还因独特的景致成为众多影视剧组青睐的取景地。让我们跟着影视的足迹,一同领...
《藏海传》中,藏海的“第三个仇... 肖战、张婧仪领衔主演的古装权谋剧《藏海传》中,无数网友化身“推理大师”,猜测谁是稚奴的救命恩人“面具...
美国男子指导女儿开车,女儿误踩... 近日,美国洛杉矶一名15岁少女练车时发生意外,导致指导她学车的父亲当场身亡,她自己也受了伤。 警方称...
AI科普:仲夏端午至,如何保“... “端午临中夏,时清日复长。”农历五月初五是端午节,暑湿交织容易诱发疾病。如何做到“端午安康”?这些方...
《在人间》疯批设定引热议,赵丽... 什么是大女主?赵丽颖才是大女主的“模版”:当古偶仙侠还在谈恋爱的时候,靠着“古偶”一飞冲天的赵丽颖,...
漠北王后真实目的曝光,所做的一... 画江湖之不良人第七季第十一集现在已经出来了。这一集一出,漠北王后的真实目的也终于是曝光了。漠北王后的...
《藏海传》这才是藏海最大的死穴... 电视剧《藏海传》新的剧情中庄家算是集体下线了,在藏海的算计之下,蒋襄因为庄之甫废了,庄芦隐要扶持庄之...
MiniMax开源首个视觉RL... 近日,MiniMax正式开源了其自主研发的首个视觉强化学习(Visual RL)统一框架——V-Tr...
“AI教父”辛顿最新专访:没有... Datawhale分享 最新专访:辛顿,来源:腾讯科技 以下视频来源于 腾讯科技 被誉为“AI...
《藏海传》火到台湾,却惹疑惑:... 近日,在中国台湾的时事评论节目里,当主持人问起时事评论员“藏海传好看吗”,评论员郭正亮当即竖起大拇指...
7年了,骂她的人真该闭嘴了 2021年,《我是刑警》导演拨通了马苏的电话:马苏,有一个角色,但是是单元女主,你愿不愿意接?马苏二...
到了夏天怎么穿衣才好看?这些日... 穿衣搭配对个人外在形象的影响还是比较大的,如果能够找到一些适合自己的穿搭,甚至可以起到一个改头换面的...
广西推出“桂智一号”AI平台 如何保障政务敏感数据的安全?如何安全可控且高效地使用企业核心机密数据?医院的重要信息如何稳妥兜底……...
雷军宣布小米·中国汽车耐力锦标... 5月31日,雷军发文宣布小米·中国汽车耐力锦标赛成都站,今天正式开赛,大家一睹中国最高级别的汽车耐力...
阿里通义开源「推理+搜索」预训... 通义实验室 投稿 量子位 | 公众号 QbitAI 为提升大模型“推理+搜索”能力,阿里通义实验室出...
正是肥的时候!每天上万斤在青岛... 初夏时节, 在即墨区丁字湾, 两万亩养殖的蛏子迎来丰收季, 渔民陆续展开采收。 近日, 记者跟随当地...
信阳市委市政府召开基层代表反映... 5月29日,信阳市委市政府召开基层代表反映问题办理情况反馈会,认真落实开门教育的部署要求,系统反馈基...
兵马俑三号坑今日正常开放,受损... 西安市公安局临潼分局官方微博5月31日通报:2025年5月30日17时30分许,孙某(男,30岁)进...