DeepSeek突围奥秘曝光,一招MLA让全世界抄作业!150+天才集结,开出千万年薪

DeepSeek突围奥秘曝光,一招MLA让全世界抄作业!150+天才集结,开出千万年薪

DeepSeek突围奥秘曝光,一招MLA让全世界抄作业!150+天才集结,开出千万年薪
DeepSeek突围奥秘曝光,一招MLA让全世界抄作业!150+天才集结,开出千万年薪...
2025-02-01 · 浏览283次
郭明錤:DeepSeek 加速生成式 AI 产业迈入新阶段

郭明錤:DeepSeek 加速生成式 AI 产业迈入新阶段

郭明錤:DeepSeek 加速生成式 AI 产业迈入新阶段
郭明錤称,就算没有DeepSeek-R1,这两个趋势终将显著浮现,但DeepSeek-R1的出现加速了趋势发生。...
2025-02-01 · 浏览258次
DeepSeek-R1 模型全面上线亚马逊云科技

DeepSeek-R1 模型全面上线亚马逊云科技

DeepSeek-R1 模型全面上线亚马逊云科技
今日起用户可以在 Amazon Bedrock 和 Amazon SageMaker AI 中部署 DeepSeek-R1 模型。...
2025-02-01 · 浏览276次
OpenAI 小钢炮 o3-mini 推理模型登场:性能提升 24%,首次向免费 ChatGPT AI 用户开放

OpenAI 小钢炮 o3-mini 推理模型登场:性能提升 24%,首次向免费 ChatGPT AI 用户开放

OpenAI 小钢炮 o3-mini 推理模型登场:性能提升 24%,首次向免费 ChatGPT AI 用户开放
OpenAI 首席执行官山姆・阿尔特曼(Sam Altman)在 2 周前预告后,今天在 ChatGPT 和 API 服务中,正式推出了 o3-mini AI 推理模型,并首次...
2025-02-01 · 浏览612次
英特尔 Gaudi 2D AI 加速器为 DeepSeek Janus Pro 模型进行优化

英特尔 Gaudi 2D AI 加速器为 DeepSeek Janus Pro 模型进行优化

英特尔 Gaudi 2D AI 加速器为 DeepSeek Janus Pro 模型进行优化
近日,DeepSeek 发布 Janus Pro 模型,英特尔 Gaudi 2D AI 加速器现已针对该模型进行优化,为 AI 应用的落地和规模化发展提供的支持。...
2025-02-01 · 浏览303次
英特尔酷睿 Ultra 支持 DeepSeek 运行,可在 AI PC 上实现离线使用

英特尔酷睿 Ultra 支持 DeepSeek 运行,可在 AI PC 上实现离线使用

英特尔酷睿 Ultra 支持 DeepSeek 运行,可在 AI PC 上实现离线使用
英特尔 AI PC 合作伙伴 Flowy 在最新版的 AI PC 助手(英特尔酷睿 Ultra 独享版)上,率先在端侧支持了 DeepSeek-R1 模型,支持翻译、会议纪要、...
2025-02-01 · 浏览446次
OpenAI洽谈巨额融资,估值有望达3000亿,部分用于「星际之门」

OpenAI洽谈巨额融资,估值有望达3000亿,部分用于「星际之门」

OpenAI洽谈巨额融资,估值有望达3000亿,部分用于「星际之门」
OpenAI洽谈巨额融资,估值有望达3000亿,部分用于「星际之门」...
2025-02-01 · 浏览258次
奥特曼被逼急:深夜上线 o3-mini,甚至免费,网友:还是选DeepSeek

奥特曼被逼急:深夜上线 o3-mini,甚至免费,网友:还是选DeepSeek

奥特曼被逼急:深夜上线 o3-mini,甚至免费,网友:还是选DeepSeek
此次发布,o3-mini 包含 low、medium 和 high 三个版本。...
2025-02-01 · 浏览486次
奥特曼:在开源AI上,我们错了!DeepSeek让OpenAI优势不再,下一个是GPT-5

奥特曼:在开源AI上,我们错了!DeepSeek让OpenAI优势不再,下一个是GPT-5

奥特曼:在开源AI上,我们错了!DeepSeek让OpenAI优势不再,下一个是GPT-5
奥特曼:在开源AI上,我们错了!DeepSeek让OpenAI优势不再,下一个是GPT-5...
2025-02-01 · 浏览232次
一夜之间,微软、英伟达、亚马逊全部接入DeepSeek!吴恩达:中国AI正在崛起

一夜之间,微软、英伟达、亚马逊全部接入DeepSeek!吴恩达:中国AI正在崛起

一夜之间,微软、英伟达、亚马逊全部接入DeepSeek!吴恩达:中国AI正在崛起
一夜之间,微软、英伟达、亚马逊全部接入DeepSeek!吴恩达:中国AI正在崛起...
2025-01-31 · 浏览282次
ICLR 2025|大模型也需要好奇心,TeleAI 提出探索驱动的对齐方法,8B越级胜70B

ICLR 2025|大模型也需要好奇心,TeleAI 提出探索驱动的对齐方法,8B越级胜70B

ICLR 2025|大模型也需要好奇心,TeleAI 提出探索驱动的对齐方法,8B越级胜70B
在自然界中,好奇心驱使着生物探索未知,是生存和进化的关键。...
2025-01-31 · 浏览272次
DeepSeek R1有没有赶上OpenAI o1? 八大场景测评结果出炉

DeepSeek R1有没有赶上OpenAI o1? 八大场景测评结果出炉

DeepSeek R1有没有赶上OpenAI o1? 八大场景测评结果出炉
经过一系列测试 —— 从创意写作到复杂的教学,DeepSeek-R1 的综合实力完全能和 OpenAI 的付费「精英」们掰手腕。...
2025-01-31 · 浏览421次
清华翟季冬:DeepSeek 百倍算力效能背后的系统革命 | 智者访谈

清华翟季冬:DeepSeek 百倍算力效能背后的系统革命 | 智者访谈

清华翟季冬:DeepSeek 百倍算力效能背后的系统革命 | 智者访谈
2025 年伊始,全球 AI 业界被 DeepSeek 刷屏。...
2025-01-31 · 浏览336次
为什么说DeepSeek的R1-Zero比R1更值得关注?

为什么说DeepSeek的R1-Zero比R1更值得关注?

为什么说DeepSeek的R1-Zero比R1更值得关注?
R1-Zero 等模型正在打破人类数据瓶颈,开启 AI 自我进化新范式?...
2025-01-31 · 浏览366次
不用开口:谷歌 AI 帮你致电商家,价格、预约一键搞定

不用开口:谷歌 AI 帮你致电商家,价格、预约一键搞定

不用开口:谷歌 AI 帮你致电商家,价格、预约一键搞定
谷歌公司昨日(1 月 30 日)发布公告,在 Search Labs 中推出名为“Ask for Me”的实验性新功能,用户可以利用 AI 代替自己致电商家,咨询价格和服务可用...
2025-01-31 · 浏览134次
英伟达:DeepSeek-R1 模型现已上线 NIM 微服务平台

英伟达:DeepSeek-R1 模型现已上线 NIM 微服务平台

英伟达:DeepSeek-R1 模型现已上线 NIM 微服务平台
英伟达今日宣布,DeepSeek-R1 模型现已在 build.nvidia.com 上作为 NVIDIA NIM 微服务预览版提供。DeepSeek-R1 NIM 微服务可以...
2025-01-31 · 浏览316次
OpenAI o1 推理模型免费用,微软 Copilot 开放“深度思考”AI 功能

OpenAI o1 推理模型免费用,微软 Copilot 开放“深度思考”AI 功能

OpenAI o1 推理模型免费用,微软 Copilot 开放“深度思考”AI 功能
Microsoft AI 公司首席执行官穆斯塔法・苏莱曼(Mustafa Suleyman)昨日(1 月 30 日)在 X 平台发布推文,宣布所有 Microsoft Copi...
2025-01-31 · 浏览265次
股东施压苹果:要求其公开 AI“黑匣子”,提高隐私保护透明度

股东施压苹果:要求其公开 AI“黑匣子”,提高隐私保护透明度

股东施压苹果:要求其公开 AI“黑匣子”,提高隐私保护透明度
根据最新披露的股东提案,多名股东向苹果公司施压,要求其披露更多的 AI 活动细节,进一步提高训练和推理 Apple 智能(Apple Intelligence)的透明度。...
2025-01-30 · 浏览310次
大模型训练开销还能更小:微软推出首个 FP4 训练框架,训练效果与 BF16 相当

大模型训练开销还能更小:微软推出首个 FP4 训练框架,训练效果与 BF16 相当

大模型训练开销还能更小:微软推出首个 FP4 训练框架,训练效果与 BF16 相当
首个 FP4 精度的大模型训练框架来了,来自微软研究院!在相同超参数的设置下,可以达到与 FP8 以及 BF16 相当的训练效果。...
2025-01-30 · 浏览218次
Aurora 超级计算机向全球科学界开放,模拟计算能力超 1 FP64 ExaFLOPS

Aurora 超级计算机向全球科学界开放,模拟计算能力超 1 FP64 ExaFLOPS

Aurora 超级计算机向全球科学界开放,模拟计算能力超 1 FP64 ExaFLOPS
Aurora早在2015年就已公布,但因多次延迟才终于完成。现在,它能够提供超过1 FP64 ExaFLOPS的模拟计算能力,并能为人工智能和机器学习提供11.6混合精度Exa...
2025-01-30 · 浏览303次
OpenAI称有DeepSeek「偷窃」证据?美军已发起攻击!Anthropic CEO喊话加强芯片管制

OpenAI称有DeepSeek「偷窃」证据?美军已发起攻击!Anthropic CEO喊话加强芯片管制

OpenAI称有DeepSeek「偷窃」证据?美军已发起攻击!Anthropic CEO喊话加强芯片管制
OpenAI称有DeepSeek「偷窃」证据?美军已发起攻击!Anthropic CEO喊话加强芯片管制...
2025-01-30 · 浏览231次
让大模型互联网「冲浪」,通义实验室WebWalker解锁复杂信息检索新技能

让大模型互联网「冲浪」,通义实验室WebWalker解锁复杂信息检索新技能

让大模型互联网「冲浪」,通义实验室WebWalker解锁复杂信息检索新技能
在信息爆炸的时代,互联网就像一座庞大的迷宫,藏着无数宝藏。但传统搜索引擎往往只能触及表面,对于复杂、多层级的信息检索显得力不从心。...
2025-01-29 · 浏览326次
原来,这些顶级大模型都是蒸馏的

原来,这些顶级大模型都是蒸馏的

原来,这些顶级大模型都是蒸馏的
除了 Claude、豆包和 Gemini 之外,知名的闭源和开源 LLM 通常表现出很高的蒸馏度。...
2025-01-29 · 浏览550次
OpenAI首席研究官:DeepSeek独立发现了o1的一些核心思路,奥特曼、LeCun纷纷置评

OpenAI首席研究官:DeepSeek独立发现了o1的一些核心思路,奥特曼、LeCun纷纷置评

OpenAI首席研究官:DeepSeek独立发现了o1的一些核心思路,奥特曼、LeCun纷纷置评
成本打下来了,需求更多才对?...
2025-01-29 · 浏览247次
第一页 · 上一页 · 下一页 · 当前第155页