欢迎来到 AI 中文社区(简称 AI 中文社),这里是学习交流 AI 人工智能技术的中文社区。 为了更好的体验,本站推荐使用 Chrome 浏览器。
Anthropic 开源神经网络追踪工具,可生成归因图直观展示 AI 模型处理提示词具体过程
2025-06-02 发布
·
浏览374次
·
点赞0次
·
收藏0次
6 月 2 日消息,Anthropic 公司现已正式开源了其新一代的神经网络追踪(Circuit Tracing)工具,旨在帮助研究人员深入解析大模型的内部推理机制。
据悉,该工具可生成一系列“归因图(Attribution Graphs)”以展示 AI 模型处理提示词的具体过程,便于开发者进一步观察、微调模型。
此外,Anthropic 还与 Decode Research 团队合作推出了 Neuronpedia 前端平台,用户可以在网页上直接与相应归因图进行互动。平台还提供了“示例笔记本”,展示如 Gemma-2-2b 和 Llama-3.2-1b 等模型的内部运作方式,鼓励用户尝试各种提示词,比较不同模型的具体行为。

Anthropic 公司首席执行官 Dario Amodei 指出,大模型的“可解释性”已成为业界共同关注的课题,这套神经网络追踪工具将促进社区参与度,有助于开发者加快对大模型行为逻辑的理解。
声明:本文转载自IT 之家,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。
点赞(0)
收藏(0)
0条评论
珍惜第一个评论,它能得到比较好的回应。
评论
游客
登录后再评论
- 鸟过留鸣,人过留评。
- 和谐社区,和谐点评。
AI 中文社