AI 中文社/资讯/详情

Anthropic 开源神经网络追踪工具，可生成归因图直观展示 AI 模型处理提示词具体过程

2025-06-02 发布 · 浏览254次 · 点赞0次 · 收藏0次

6 月 2 日消息，Anthropic 公司现已正式开源了其新一代的神经网络追踪（Circuit Tracing）工具，旨在帮助研究人员深入解析大模型的内部推理机制。

据悉，该工具可生成一系列“归因图（Attribution Graphs）”以展示 AI 模型处理提示词的具体过程，便于开发者进一步观察、微调模型。

此外，Anthropic 还与 Decode Research 团队合作推出了 Neuronpedia 前端平台，用户可以在网页上直接与相应归因图进行互动。平台还提供了“示例笔记本”，展示如 Gemma-2-2b 和 Llama-3.2-1b 等模型的内部运作方式，鼓励用户尝试各种提示词，比较不同模型的具体行为。

Anthropic 公司首席执行官 Dario Amodei 指出，大模型的“可解释性”已成为业界共同关注的课题，这套神经网络追踪工具将促进社区参与度，有助于开发者加快对大模型行为逻辑的理解。

声明：本文转载自IT 之家，转载目的在于传递更多信息，并不代表本社区赞同其观点和对其真实性负责，本文只提供参考并不构成任何建议，若有版权等问题，点击这里。

浏览(254) 点赞(0) 收藏(0)

0条评论

珍惜第一个评论，它能得到比较好的回应。

游客

登录后再评论

鸟过留鸣，人过留评。
和谐社区，和谐点评。

Anthropic 开源神经网络追踪工具，可生成归因图直观展示 AI 模型处理提示词具体过程

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。

Anthropic 开源神经网络追踪工具，可生成归因图直观展示 AI 模型处理提示词具体过程

aizws = AI 中文社

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。 按下 Ctrl+D 或 ⌘+D 收藏本站。

欢迎来到 AI 中文社区（简称 AI 中文社），这里是学习交流 AI 人工智能技术的中文社区。按下 Ctrl+D 或 ⌘+D 收藏本站。