AI 中文社区

DeepSeek突围奥秘曝光，一招MLA让全世界抄作业！150+天才集结，开出千万年薪

DeepSeek突围奥秘曝光，一招MLA让全世界抄作业！150+天才集结，开出千万年薪...

2025-02-01 · 浏览283次

郭明錤：DeepSeek 加速生成式 AI 产业迈入新阶段

郭明錤称，就算没有DeepSeek-R1，这两个趋势终将显著浮现，但DeepSeek-R1的出现加速了趋势发生。...

2025-02-01 · 浏览258次

DeepSeek-R1 模型全面上线亚马逊云科技

今日起用户可以在 Amazon Bedrock 和 Amazon SageMaker AI 中部署 DeepSeek-R1 模型。...

2025-02-01 · 浏览276次

OpenAI 小钢炮 o3-mini 推理模型登场：性能提升 24%，首次向免费 ChatGPT AI 用户开放

OpenAI 首席执行官山姆・阿尔特曼（Sam Altman）在 2 周前预告后，今天在 ChatGPT 和 API 服务中，正式推出了 o3-mini AI 推理模型，并首次...

2025-02-01 · 浏览612次

英特尔 Gaudi 2D AI 加速器为 DeepSeek Janus Pro 模型进行优化

近日，DeepSeek 发布 Janus Pro 模型，英特尔 Gaudi 2D AI 加速器现已针对该模型进行优化，为 AI 应用的落地和规模化发展提供的支持。...

2025-02-01 · 浏览303次

英特尔酷睿 Ultra 支持 DeepSeek 运行，可在 AI PC 上实现离线使用

英特尔 AI PC 合作伙伴 Flowy 在最新版的 AI PC 助手（英特尔酷睿 Ultra 独享版）上，率先在端侧支持了 DeepSeek-R1 模型，支持翻译、会议纪要、...

2025-02-01 · 浏览446次

OpenAI洽谈巨额融资，估值有望达3000亿，部分用于「星际之门」

OpenAI洽谈巨额融资，估值有望达3000亿，部分用于「星际之门」...

2025-02-01 · 浏览258次

奥特曼被逼急：深夜上线 o3-mini，甚至免费，网友：还是选DeepSeek

此次发布，o3-mini 包含 low、medium 和 high 三个版本。...

2025-02-01 · 浏览486次

奥特曼：在开源AI上，我们错了！DeepSeek让OpenAI优势不再，下一个是GPT-5

奥特曼：在开源AI上，我们错了！DeepSeek让OpenAI优势不再，下一个是GPT-5...

2025-02-01 · 浏览232次

一夜之间，微软、英伟达、亚马逊全部接入DeepSeek！吴恩达：中国AI正在崛起

一夜之间，微软、英伟达、亚马逊全部接入DeepSeek！吴恩达：中国AI正在崛起...

2025-01-31 · 浏览282次

ICLR 2025｜大模型也需要好奇心，TeleAI 提出探索驱动的对齐方法，8B越级胜70B

在自然界中，好奇心驱使着生物探索未知，是生存和进化的关键。...

2025-01-31 · 浏览272次

DeepSeek R1有没有赶上OpenAI o1？八大场景测评结果出炉

经过一系列测试 —— 从创意写作到复杂的教学，DeepSeek-R1 的综合实力完全能和 OpenAI 的付费「精英」们掰手腕。...

2025-01-31 · 浏览421次

清华翟季冬：DeepSeek 百倍算力效能背后的系统革命 | 智者访谈

2025 年伊始，全球 AI 业界被 DeepSeek 刷屏。...

2025-01-31 · 浏览336次

为什么说DeepSeek的R1-Zero比R1更值得关注？

R1-Zero 等模型正在打破人类数据瓶颈，开启 AI 自我进化新范式？...

2025-01-31 · 浏览366次

不用开口：谷歌 AI 帮你致电商家，价格、预约一键搞定

谷歌公司昨日（1 月 30 日）发布公告，在 Search Labs 中推出名为“Ask for Me”的实验性新功能，用户可以利用 AI 代替自己致电商家，咨询价格和服务可用...

2025-01-31 · 浏览134次

英伟达：DeepSeek-R1 模型现已上线 NIM 微服务平台

英伟达今日宣布，DeepSeek-R1 模型现已在 build.nvidia.com 上作为 NVIDIA NIM 微服务预览版提供。DeepSeek-R1 NIM 微服务可以...

2025-01-31 · 浏览316次

OpenAI o1 推理模型免费用，微软 Copilot 开放“深度思考”AI 功能

Microsoft AI 公司首席执行官穆斯塔法・苏莱曼（Mustafa Suleyman）昨日（1 月 30 日）在 X 平台发布推文，宣布所有 Microsoft Copi...

2025-01-31 · 浏览265次

股东施压苹果：要求其公开 AI“黑匣子”，提高隐私保护透明度

根据最新披露的股东提案，多名股东向苹果公司施压，要求其披露更多的 AI 活动细节，进一步提高训练和推理 Apple 智能（Apple Intelligence）的透明度。...

2025-01-30 · 浏览310次

大模型训练开销还能更小：微软推出首个 FP4 训练框架，训练效果与 BF16 相当

首个 FP4 精度的大模型训练框架来了，来自微软研究院！在相同超参数的设置下，可以达到与 FP8 以及 BF16 相当的训练效果。...

2025-01-30 · 浏览218次

Aurora 超级计算机向全球科学界开放，模拟计算能力超 1 FP64 ExaFLOPS

Aurora早在2015年就已公布，但因多次延迟才终于完成。现在，它能够提供超过1 FP64 ExaFLOPS的模拟计算能力，并能为人工智能和机器学习提供11.6混合精度Exa...

2025-01-30 · 浏览303次

OpenAI称有DeepSeek「偷窃」证据？美军已发起攻击！Anthropic CEO喊话加强芯片管制

OpenAI称有DeepSeek「偷窃」证据？美军已发起攻击！Anthropic CEO喊话加强芯片管制...

2025-01-30 · 浏览231次

让大模型互联网「冲浪」，通义实验室WebWalker解锁复杂信息检索新技能

在信息爆炸的时代，互联网就像一座庞大的迷宫，藏着无数宝藏。但传统搜索引擎往往只能触及表面，对于复杂、多层级的信息检索显得力不从心。...

2025-01-29 · 浏览326次

原来，这些顶级大模型都是蒸馏的

除了 Claude、豆包和 Gemini 之外，知名的闭源和开源 LLM 通常表现出很高的蒸馏度。...

2025-01-29 · 浏览550次

OpenAI首席研究官：DeepSeek独立发现了o1的一些核心思路，奥特曼、LeCun纷纷置评

成本打下来了，需求更多才对？...

2025-01-29 · 浏览247次