AI 中文社区

Ilya错了？Scaling另有他用，ViT大佬力挺谷歌1000亿数据新发现

Ilya错了？Scaling另有他用，ViT大佬力挺谷歌1000亿数据新发现...

2025-03-09 · 浏览277次

精度效率双冠王！时序预测新范式TimeDistill：跨架构知识蒸馏，全面超越SOTA

精度效率双冠王！时序预测新范式TimeDistill：跨架构知识蒸馏，全面超越SOTA...

2025-03-09 · 浏览193次

马斯克「大闹白宫」！美政府12000人将被GSAi优化，xAI 100万块GPU巨兽年底建成

马斯克「大闹白宫」！美政府12000人将被GSAi优化，xAI 100万块GPU巨兽年底建成...

2025-03-09 · 浏览260次

Nature封面：探索真菌网络，用机器人进行高通量延时成像研究

为了监测 AM 网络的构建过程，来自荷兰阿姆斯特丹 AMOLF 研究所等机构的研究者设计了一款定制机器人，用于高通量延时成像，能够同时追踪超过 50 万个真菌节点。研究登上《N...

2025-03-09 · 浏览257次

纳米世界的实时电影，科学家首次使用AI以毫秒级分辨率观察原子移动，登Science

实现了在温和电子束剂量下对气体环境中金属纳米颗粒表面进行毫秒级时间分辨率的原子尺度观察。...

2025-03-09 · 浏览192次

ICLR 2025 Spotlight |「免费」多模态信息助力3D小样本分割

当人形机器人能够辨识身边的一切，VR/AR 设备呈现出定制化的虚拟世界，自动驾驶汽车实时捕捉路面状况，这一切都依赖于对 3D 场景的精确理解。...

2025-03-09 · 浏览250次

微软甩开OpenAI自研大模型，还计划用DeepSeek

思维链引发的战争。...

2025-03-09 · 浏览231次

目标超级智能，前DeepMind科学家离职创业，获1.3亿刀融资

从来没见过人类做出这样的决策……太优美了。...

2025-03-09 · 浏览226次

7B级形式化推理与验证小模型，媲美满血版DeepSeek-R1，全面开源！

随着 DeepSeek-R1 的流行与 AI4Math 研究的深入，大模型在辅助形式化证明写作方面的需求日益增长。...

2025-03-09 · 浏览220次

让SFT重新伟大！CMU等华人学者提出全新「批判式微调」，媲美复刻版DeepSeek

让SFT重新伟大！CMU等华人学者提出全新「批判式微调」，媲美复刻版DeepSeek...

2025-03-09 · 浏览239次

Manus火到国外？网友实测惊呆！00后博士生0天复刻霸榜开源第一

Manus火到国外？网友实测惊呆！00后博士生0天复刻霸榜开源第一...

2025-03-08 · 浏览435次

DeepSeek占比升至9.6%，稳居全球第二！「全球生成式AI行业趋势」发布

DeepSeek占比升至9.6%，稳居全球第二！「全球生成式AI行业趋势」发布...

2025-03-08 · 浏览147次

狂揽1.3亿美金！AlphaGo大神组队Gemini大牛，用RL打造超级智能，英伟达抢投

狂揽1.3亿美金！AlphaGo大神组队Gemini大牛，用RL打造超级智能，英伟达抢投...

2025-03-08 · 浏览138次

英伟达提出首个Mamba-Transformer视觉骨干网络！打破精度/吞吐瓶颈 | CVPR 2025

英伟达提出首个Mamba-Transformer视觉骨干网络！打破精度/吞吐瓶颈 | CVPR 2025...

2025-03-08 · 浏览281次

DeepSeek的MLA，任意大模型都能轻松迁移了

DeepSeek-R1 作为 AI 产业颠覆式创新的代表轰动了业界，特别是其训练与推理成本仅为同等性能大模型的数十分之一。...

2025-03-07 · 浏览335次

DeepSeek行业实战指南：下周四这场闭门会速来围观！

模型选型→场景部署→应用实战，这场闭门会一网打尽。...

2025-03-07 · 浏览217次

FP8训练新范式：减少40%显存占用，训练速度提高1.4倍

近期DeepSeek V3 引爆国内外的社交媒体，他们在训练中成功应用了 FP8 精度，显著降低了 GPU 内存使用和计算开销。...

2025-03-07 · 浏览354次

谷歌创始人拉里·佩奇出山成立大模型公司，目标智能制造

谷歌联合创始人、全球第七富豪拉里・佩奇 (Larry Page) 已经成立了一个 AI 创业公司。...

2025-03-07 · 浏览216次

全球首发：QwQ-32B本地一键部署、3090单卡可跑，共享算力成关键

个人设备进入最强模型时代。...

2025-03-07 · 浏览443次

消息称 Meta 的 Llama 4 模型将聚焦语音交互，全力开拓 AI 商业版图

据英国金融时报报道，社交媒体巨头 Meta 正在加速其人工智能的语音功能开发，计划在未来几周内推出其最新开源大语言模型 Llama 4，并将语音交互作为核心功能之一。据知情人士...

2025-03-07 · 浏览342次

消息称微软正开发内部 AI 推理模型，并测试 xAI、DeepSeek 等多种 OpenAI 替代方案

外媒The Information 今晚发布消息称，微软正在开发内部人工智能推理模型，以与OpenAI竞争，并可能向开发者出售。...

2025-03-07 · 浏览267次

谁是最强AI研究助手？Meta等提出全新基准MLGym：LLM智能体大排名

谁是最强AI研究助手？Meta等提出全新基准MLGym：LLM智能体大排名...

2025-03-07 · 浏览241次

32B击败DeepSeek-R1、o3-mini，成本暴降100倍！GRPO让小模型称霸推理

32B击败DeepSeek-R1、o3-mini，成本暴降100倍！GRPO让小模型称霸推理...

2025-03-07 · 浏览390次

Ilya再融20亿SSI估值300亿！20人王牌团队首曝光，阵容超豪华

Ilya再融20亿SSI估值300亿！20人王牌团队首曝光，阵容超豪华...

2025-03-07 · 浏览234次