Claude 标签,匹配到约447个结果, 耗时0.0160秒



Anthropic CEO 阿莫代伊:AI 模型出现“幻觉”的频率可能比人类还低

阿莫代伊强调,AI出现幻觉并不会阻碍Anthropic迈向 AGI的目标。“这取决于你用什么标准衡量,但我怀疑AI模型的幻觉频率可能低于人类,只是它们出错的方式更出人意料。”...
2025-05-24
·
浏览44次



地表最强编程 AI 模型另一面:Claude Opus 4 逃逸、勒索工程师等,官方施加 ASL-3 紧箍咒

《时代》今天(5 月 23 日)发布博文,报道称 Anthropic 的首席科学家 Jared Kaplan 透露,由于测试过程中出现试图逃逸、勒索以及自主举报等不良行为,最新发布的 Claude Opus 4 被列为安全关键级别(ASL-...
2025-05-23
·
浏览64次





Anthropic 研究揭示:AI 推理的思维链解释不可全信

Anthropic 公司发布最新研究报告,指出思维链(Chain-of-Thought,简称 CoT)提示方法虽被广泛用于提升大型语言模型(LLMs)的推理能力并解释其思维过程,但其可靠性存疑。...
2025-05-20
·
浏览53次




新研究发现 AI 无法读懂模拟时钟,还不能告诉你某天是周几

爱丁堡大学研究员、论文作者 Rohit Saxena 表示:“人类从小就能掌握时间与日历概念,而 AI 在这方面的不足,是一个值得警惕的信号。”...
2025-05-18
·
浏览64次


Windsurf 首款 AI 软件工程模型:SWE-1 系列登场,编程能力比肩 GPT-4.1、Gemini 2.5 Pro

Windsurf 昨日(5 月 16 日)发布博文,宣布推出其首款自研 AI 软件工程模型系列 SWE-1,涵盖功能最强的 SWE-1、轻量化的 SWE-1-lite 以及精简版的 SWE-1-mini。...
2025-05-17
·
浏览68次






Anthropic 即推 AI 新星:Claude Neptune 安全测试收官在即,对战 GPT-5 和 Gemini Ultra

Anthropic 即将发布 Claude Neptune 新 AI 模型,目前正接受内部安全测试,可与 OpenAI 的 GPT-5,以及谷歌的 Gemini Ultra 竞争。...
2025-05-14
·
浏览70次
