Meta 新旗舰 AI 模型 Llama 4 Maverick 测试成绩遭质疑,被指针对性优化
Meta发布新旗舰AI模型Maverick,在LM Arena测试中排名第二,但被质疑测试版本与公开版本不一致,存在针对性优化。研究人员指出公开版与测试版行为差异明显,Meta...
2025-04-07
·
浏览256次
CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo
本文介绍了 FoundationStereo,一种用于立体深度估计的基础模型,旨在实现强大的零样本泛化能力。...
2025-04-07
·
浏览283次
从0到1玩转MCP:AI的「万能插头」,代码手把手教你!
在人工智能飞速发展的今天,LLM 的能力令人叹为观止,但其局限性也日益凸显 —— 它们往往被困于训练数据的「孤岛」,无法直接触及实时信息或外部工具。...
2025-04-07
·
浏览406次
Meta深夜开源Llama 4!首次采用MoE,惊人千万token上下文,竞技场超越DeepSeek
万万没想到。Meta 选择在周六日,发布了最新 AI 模型系列 ——Llama 4,这是其 Llama 家族的最新成员。...
2025-04-07
·
浏览272次
大语言模型变身软体机器人设计「自然选择器」,GPT、Gemini、Grok争做最佳
大型语言模型 (LLM) 在软体机器人设计领域展现出了令人振奋的应用潜力。...
2025-04-06
·
浏览209次
刚刚,Llama 4深夜开源击败DeepSeek V3!2万亿多模态巨兽抢回王座
刚刚,Llama 4深夜开源击败DeepSeek V3!2万亿多模态巨兽抢回王座...
2025-04-06
·
浏览226次
Meta 发布 Llama 4 系列 AI 模型,引入“混合专家架构”提升效率
Meta推出Llama 4系列AI模型,含Scout、Maverick和尚在训练的Behemoth。已上架Scout和Maverick,性能各有亮点。#Meta #Llama4...
2025-04-06
·
浏览266次
三思而后行,让大模型推理更强的秘密是「THINK TWICE」?
近年来,大语言模型(LLM)的性能提升逐渐从训练时规模扩展转向推理阶段的优化,这一趋势催生了「测试时扩展(test-time scaling)」的研究热潮。...
2025-04-05
·
浏览316次
微软诞生50周年,比尔・盖茨撰文忆往昔,并发布了Altair BASIC源代码
1975 年 4 月 4 日,比尔・盖茨和保罗・艾伦在美国新墨西哥州阿尔伯克基市创立了微软公司。...
2025-04-05
·
浏览334次
7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来?
语言是离散的,所以适合用自回归模型来生成;而图像是连续的,所以适合用扩散模型来生成。...
2025-04-05
·
浏览252次
谷歌迄今最贵 AI 模型:Gemini 2.5 Pro API 定价公布,每百万输入 tokens 1.25 美元起
而对于超过200000个tokens的输入,费用为每百万输入tokens 2.50美元(现汇率约合 18.2 元人民币),输出tokens为每百万15美元(现汇率约合 109 ...
2025-04-05
·
浏览292次
消息称 Meta Llama 4 AI 大语言模型将于本月发布,但数学处理及推理能力尚待改进
,据 The Information 报道,Meta 的下一代大语言模型 Llama 4 仍在开发中,但相应模型在内部基准测试中“表现不佳”。尤其是在数学处理能力和推理能力方面...
2025-04-05
·
浏览276次
消息称谷歌 Gemini AI 部门高层调整:掌门人 Sissie Hsiao 下台、原 Google Labs 主管上位
据外媒 Semafor 报道,谷歌旗下 Gemini AI 部门近期发生重大人事变动,长期担任该部门负责人的 Sissie Hsiao 卸任,由负责开发 NotebookLM ...
2025-04-05
·
浏览274次
AI 中文社