Ilya错了?Scaling另有他用,ViT大佬力挺谷歌1000亿数据新发现
Ilya错了?Scaling另有他用,ViT大佬力挺谷歌1000亿数据新发现...
2025-03-09
·
浏览277次
精度效率双冠王!时序预测新范式TimeDistill:跨架构知识蒸馏,全面超越SOTA
精度效率双冠王!时序预测新范式TimeDistill:跨架构知识蒸馏,全面超越SOTA...
2025-03-09
·
浏览193次
马斯克「大闹白宫」!美政府12000人将被GSAi优化,xAI 100万块GPU巨兽年底建成
马斯克「大闹白宫」!美政府12000人将被GSAi优化,xAI 100万块GPU巨兽年底建成...
2025-03-09
·
浏览260次
Nature封面:探索真菌网络,用机器人进行高通量延时成像研究
为了监测 AM 网络的构建过程,来自荷兰阿姆斯特丹 AMOLF 研究所等机构的研究者设计了一款定制机器人,用于高通量延时成像,能够同时追踪超过 50 万个真菌节点。研究登上《N...
2025-03-09
·
浏览257次
纳米世界的实时电影,科学家首次使用AI以毫秒级分辨率观察原子移动,登Science
实现了在温和电子束剂量下对气体环境中金属纳米颗粒表面进行毫秒级时间分辨率的原子尺度观察。...
2025-03-09
·
浏览192次
ICLR 2025 Spotlight |「免费」多模态信息助力3D小样本分割
当人形机器人能够辨识身边的一切,VR/AR 设备呈现出定制化的虚拟世界,自动驾驶汽车实时捕捉路面状况,这一切都依赖于对 3D 场景的精确理解。...
2025-03-09
·
浏览250次
7B级形式化推理与验证小模型,媲美满血版DeepSeek-R1,全面开源!
随着 DeepSeek-R1 的流行与 AI4Math 研究的深入,大模型在辅助形式化证明写作方面的需求日益增长。...
2025-03-09
·
浏览220次
让SFT重新伟大!CMU等华人学者提出全新「批判式微调」,媲美复刻版DeepSeek
让SFT重新伟大!CMU等华人学者提出全新「批判式微调」,媲美复刻版DeepSeek...
2025-03-09
·
浏览239次
DeepSeek占比升至9.6%,稳居全球第二!「全球生成式AI行业趋势」发布
DeepSeek占比升至9.6%,稳居全球第二!「全球生成式AI行业趋势」发布...
2025-03-08
·
浏览147次
狂揽1.3亿美金!AlphaGo大神组队Gemini大牛,用RL打造超级智能,英伟达抢投
狂揽1.3亿美金!AlphaGo大神组队Gemini大牛,用RL打造超级智能,英伟达抢投...
2025-03-08
·
浏览138次
英伟达提出首个Mamba-Transformer视觉骨干网络!打破精度/吞吐瓶颈 | CVPR 2025
英伟达提出首个Mamba-Transformer视觉骨干网络!打破精度/吞吐瓶颈 | CVPR 2025...
2025-03-08
·
浏览281次
DeepSeek的MLA,任意大模型都能轻松迁移了
DeepSeek-R1 作为 AI 产业颠覆式创新的代表轰动了业界,特别是其训练与推理成本仅为同等性能大模型的数十分之一。...
2025-03-07
·
浏览335次
FP8训练新范式:减少40%显存占用,训练速度提高1.4倍
近期DeepSeek V3 引爆国内外的社交媒体,他们在训练中成功应用了 FP8 精度,显著降低了 GPU 内存使用和计算开销。...
2025-03-07
·
浏览354次
消息称 Meta 的 Llama 4 模型将聚焦语音交互,全力开拓 AI 商业版图
据英国金融时报报道,社交媒体巨头 Meta 正在加速其人工智能的语音功能开发,计划在未来几周内推出其最新开源大语言模型 Llama 4,并将语音交互作为核心功能之一。据知情人士...
2025-03-07
·
浏览342次
消息称微软正开发内部 AI 推理模型,并测试 xAI、DeepSeek 等多种 OpenAI 替代方案
外媒The Information 今晚发布消息称,微软正在开发内部人工智能推理模型,以与OpenAI竞争,并可能向开发者出售。...
2025-03-07
·
浏览267次
32B击败DeepSeek-R1、o3-mini,成本暴降100倍!GRPO让小模型称霸推理
32B击败DeepSeek-R1、o3-mini,成本暴降100倍!GRPO让小模型称霸推理...
2025-03-07
·
浏览390次
AI 中文社