AI 中文社区

3倍提速！现在你跑不过机器狗了，限制波士顿动力机器狗的竟然是电池功率？

当 Scaling Law 在触顶边界徘徊之时，强化学习为构建更强大的大模型开辟出了一条新范式。...

2025-02-24 · 浏览220次

人刚毕业，代码一点不会，他纯靠ChatGPT写APP，年入千万美金

第一个App年入50万，第二个年入500万，第三个月入100万。...

2025-02-24 · 浏览381次

DeepSeek-R1 成 Hugging Face 最受欢迎大模型，力压近 150 万个“对手”

Clement Delangue今日凌晨发文宣布：DeepSeek-R1在Hugging Face上获得了超过10000个赞，成为该平台近150万个模型之中最受欢迎的大模型，“...

2025-02-24 · 浏览326次

谷歌 AI 视频生成模型 Veo 2 使用费用公布：每分钟 30 美元

谷歌近期在其定价页面上低调公布了新一代 AI 视频生成模型 Veo 2 的使用费用。该模型于去年 12 月首次亮相，旨在通过人工智能技术快速生成高质量的视频内容。根据官方信息，...

2025-02-24 · 浏览408次

超 20 家央企接入 DeepSeek，涉及能源、通信、汽车等领域

据经济参考报报道，近来，国资央企“牵手”DeepSeek 已成为一股新风潮。据不完全统计，目前有超 20 家央企接入 DeepSeek，涉及能源、通信、汽车、金融、建筑等多个领...

2025-02-24 · 浏览210次

OpenAI 最新研究：当前 AI 模型仍无法媲美人类程序员

尽管 OpenAI 首席执行官萨姆・奥尔特曼（Sam Altman）坚称，到今年年底，人工智能模型将能够超越“低级别”软件工程师，但该公司研究人员的最新研究却表明，即使是目前最...

2025-02-24 · 浏览273次

DeepSeek 代码库开源进度 1/5：为 Hopper GPU 优化的高效 MLA 解码内核 FlashMLA

DeepSeek今日启动“开源周”，首个开源的代码库为FlashMLA——针对 Hopper GPU 优化的高效 MLA 解码内核，支持可变长度序列。...

2025-02-24 · 浏览304次

Grok 3冲击诺奖级突破，成证明「黎曼猜想」关键！AI与数学家打出终极组合拳

Grok 3冲击诺奖级突破，成证明「黎曼猜想」关键！AI与数学家打出终极组合拳...

2025-02-23 · 浏览256次

超1/3美国大学生用ChatGPT，用户数激增破4亿！AI重塑教育职场

超1/3美国大学生用ChatGPT，用户数激增破4亿！AI重塑教育职场...

2025-02-23 · 浏览235次

孙正义患DeepSeek焦虑症？首谈5000亿星际之门，每年算力暴增1000倍

孙正义患DeepSeek焦虑症？首谈5000亿星际之门，每年算力暴增1000倍...

2025-02-23 · 浏览258次

一次推理解决复合问题：基于MoE的大语言模型知识模块可扩展融合推理架构MeteoRA

在大语言模型领域中，预训练 + 微调范式已经成为了部署各类下游应用的重要基础。...

2025-02-23 · 浏览310次

干完几星期家务，1X新款人形机器人亮相，和冰箱一样安静

家用人形机器人的未来是这样。...

2025-02-23 · 浏览365次

YOLO已经悄悄来到v12，首个以Attention为核心的YOLO框架问世

YOLO 系列模型的结构创新一直围绕 CNN 展开，而让 transformer 具有统治优势的 attention 机制一直不是 YOLO 系列网络结构改进的重点。...

2025-02-23 · 浏览377次

谷歌 AI 掌门人 Jeff Dean 对话 Transformer 作者：AI 提速 300%，1000 万倍工程师要来了

Jeff Dean，谷歌的首席科学家，和 Transformer 的作者 Noam Shazeer，最近在一场深度访谈中，不仅回顾了 AI 发展的关键时刻，还大胆预测了未来的方...

2025-02-23 · 浏览210次

OpenAI 员工公开指责 xAI：Grok 3 基准测试结果具有误导性

本周，OpenAI 的一名员工公开指责埃隆・马斯克旗下的 xAI 公司，称其发布的最新 AI 模型 Grok 3 的基准测试结果具有误导性。对此，xAI 的联合创始人伊戈尔・巴...

2025-02-23 · 浏览273次

消息称美国 AI 安全研究所大裁员，专家警告将削弱关键研究能力

据 Axios 报道，美国国家标准与技术研究院（NIST）可能将裁减多达 500 名员工，其中美国人工智能安全研究所（AISI）和“美国芯片计划”（Chips for Amer...

2025-02-23 · 浏览166次

刚刚，奥特曼晒出早产娃引爆全网！两个爸爸孕育人类首个「AGI宝宝」？

刚刚，奥特曼晒出早产娃引爆全网！两个爸爸孕育人类首个「AGI宝宝」？...

2025-02-23 · 浏览304次

14岁出道编程天才：新一代码农不会写代码了，AI正培养「文盲程序员」！

14岁出道编程天才：新一代码农不会写代码了，AI正培养「文盲程序员」！...

2025-02-23 · 浏览331次

10美元成功复现DeepSeek顿悟时刻，3B模型爆发超强推理！微软论文实锤涌现

10美元成功复现DeepSeek顿悟时刻，3B模型爆发超强推理！微软论文实锤涌现...

2025-02-22 · 浏览250次

英伟达 CEO 黄仁勋首次公开回应 DeepSeek：投资者误解，AI 发展仍需强大算力

在周四的一场线上活动中，英伟达公司首席执行官黄仁勋（Jensen Huang）表示，投资者对 DeepSeek 在人工智能领域取得的进展存在误解，这导致了市场对英伟达股票的错误...

2025-02-21 · 浏览346次

Meta 为使用盗版素材训练 AI 辩护：下载不分享即合法

本周 Meta 在法庭文件中声称，尽管其从“影子图书馆”中下载了 82TB 的盗版版权资料用于训练其 LLaMA 人工智能模型，但公司员工已采取措施，确保在下载过程中未对任何文...

2025-02-21 · 浏览335次

两万字长文深度解密DeepSeek-R1、Kimi 1.5，强推理模型凭什么火出圈？

刚刚过去的春节，DeepSeek-R1 推理大模型引爆了国内外 AI 社区，并火出了圈。...

2025-02-21 · 浏览592次

踹了OpenAI后，Figure光速发布具身大模型Helix，能力前所未有、创多项第一

本地 GPU 运行，7B 系统 2 模型 + 80M 系统 1 模型，可多机器人共用「大脑」。...

2025-02-21 · 浏览390次

大模型扩展新维度：Scaling Down、Scaling Out

近年来， Scaling Up 指导下的 AI 基础模型取得了多项突破。...

2025-02-21 · 浏览316次