3倍提速!现在你跑不过机器狗了,限制波士顿动力机器狗的竟然是电池功率?
当 Scaling Law 在触顶边界徘徊之时,强化学习为构建更强大的大模型开辟出了一条新范式。...
2025-02-24
·
浏览220次
DeepSeek-R1 成 Hugging Face 最受欢迎大模型,力压近 150 万个“对手”
Clement Delangue今日凌晨发文宣布:DeepSeek-R1在Hugging Face上获得了超过10000个赞,成为该平台近150万个模型之中最受欢迎的大模型,“...
2025-02-24
·
浏览326次
谷歌 AI 视频生成模型 Veo 2 使用费用公布:每分钟 30 美元
谷歌近期在其定价页面上低调公布了新一代 AI 视频生成模型 Veo 2 的使用费用。该模型于去年 12 月首次亮相,旨在通过人工智能技术快速生成高质量的视频内容。根据官方信息,...
2025-02-24
·
浏览408次
超 20 家央企接入 DeepSeek,涉及能源、通信、汽车等领域
据经济参考报报道,近来,国资央企“牵手”DeepSeek 已成为一股新风潮。据不完全统计,目前有超 20 家央企接入 DeepSeek,涉及能源、通信、汽车、金融、建筑等多个领...
2025-02-24
·
浏览210次
OpenAI 最新研究:当前 AI 模型仍无法媲美人类程序员
尽管 OpenAI 首席执行官萨姆・奥尔特曼(Sam Altman)坚称,到今年年底,人工智能模型将能够超越“低级别”软件工程师,但该公司研究人员的最新研究却表明,即使是目前最...
2025-02-24
·
浏览273次
DeepSeek 代码库开源进度 1/5:为 Hopper GPU 优化的高效 MLA 解码内核 FlashMLA
DeepSeek今日启动“开源周”,首个开源的代码库为FlashMLA——针对 Hopper GPU 优化的高效 MLA 解码内核,支持可变长度序列。...
2025-02-24
·
浏览304次
Grok 3冲击诺奖级突破,成证明「黎曼猜想」关键!AI与数学家打出终极组合拳
Grok 3冲击诺奖级突破,成证明「黎曼猜想」关键!AI与数学家打出终极组合拳...
2025-02-23
·
浏览256次
孙正义患DeepSeek焦虑症?首谈5000亿星际之门,每年算力暴增1000倍
孙正义患DeepSeek焦虑症?首谈5000亿星际之门,每年算力暴增1000倍...
2025-02-23
·
浏览258次
一次推理解决复合问题:基于MoE的大语言模型知识模块可扩展融合推理架构MeteoRA
在大语言模型领域中,预训练 + 微调范式已经成为了部署各类下游应用的重要基础。...
2025-02-23
·
浏览310次
YOLO已经悄悄来到v12,首个以Attention为核心的YOLO框架问世
YOLO 系列模型的结构创新一直围绕 CNN 展开,而让 transformer 具有统治优势的 attention 机制一直不是 YOLO 系列网络结构改进的重点。...
2025-02-23
·
浏览377次
谷歌 AI 掌门人 Jeff Dean 对话 Transformer 作者:AI 提速 300%,1000 万倍工程师要来了
Jeff Dean,谷歌的首席科学家,和 Transformer 的作者 Noam Shazeer,最近在一场深度访谈中,不仅回顾了 AI 发展的关键时刻,还大胆预测了未来的方...
2025-02-23
·
浏览210次
OpenAI 员工公开指责 xAI:Grok 3 基准测试结果具有误导性
本周,OpenAI 的一名员工公开指责埃隆・马斯克旗下的 xAI 公司,称其发布的最新 AI 模型 Grok 3 的基准测试结果具有误导性。对此,xAI 的联合创始人伊戈尔・巴...
2025-02-23
·
浏览273次
消息称美国 AI 安全研究所大裁员,专家警告将削弱关键研究能力
据 Axios 报道,美国国家标准与技术研究院(NIST)可能将裁减多达 500 名员工,其中美国人工智能安全研究所(AISI)和“美国芯片计划”(Chips for Amer...
2025-02-23
·
浏览166次
10美元成功复现DeepSeek顿悟时刻,3B模型爆发超强推理!微软论文实锤涌现
10美元成功复现DeepSeek顿悟时刻,3B模型爆发超强推理!微软论文实锤涌现...
2025-02-22
·
浏览250次
英伟达 CEO 黄仁勋首次公开回应 DeepSeek:投资者误解,AI 发展仍需强大算力
在周四的一场线上活动中,英伟达公司首席执行官黄仁勋(Jensen Huang)表示,投资者对 DeepSeek 在人工智能领域取得的进展存在误解,这导致了市场对英伟达股票的错误...
2025-02-21
·
浏览346次
Meta 为使用盗版素材训练 AI 辩护:下载不分享即合法
本周 Meta 在法庭文件中声称,尽管其从“影子图书馆”中下载了 82TB 的盗版版权资料用于训练其 LLaMA 人工智能模型,但公司员工已采取措施,确保在下载过程中未对任何文...
2025-02-21
·
浏览335次
两万字长文深度解密DeepSeek-R1、Kimi 1.5,强推理模型凭什么火出圈?
刚刚过去的春节,DeepSeek-R1 推理大模型引爆了国内外 AI 社区,并火出了圈。...
2025-02-21
·
浏览592次
踹了OpenAI后,Figure光速发布具身大模型Helix,能力前所未有、创多项第一
本地 GPU 运行,7B 系统 2 模型 + 80M 系统 1 模型,可多机器人共用「大脑」。...
2025-02-21
·
浏览390次
AI 中文社