Karpathy后悔了:2015年就看到了语言模型的潜力,却搞了多年强化学习
上个周末,OpenAI 创始成员、研究科学家、原特斯拉前 AI 高级总监、AI 领域的大神 Andrej Karpathy 一直在后悔。后悔自己没有早点带领 OpenAI 开创...
2024-11-19
·
浏览297次
蛋白预测从数月缩短至数小时,MassiveFold出于AlphaFold而胜于AlphaFold3
MassiveFold是 AlphaFold 的优化和可定制版本,可将蛋白质结构预测的计算时间从数月大幅缩短至数小时。...
2024-11-19
·
浏览324次
精度与通用性不可兼得,北大华为理论证明低精度下scaling law难以实现
大模型量化通过将模型参数从较高的精度(如 bfoat16)压缩到低精度(如 int8 或 int4)来降低模型推理的开销,提高模型推理的速度。在大语言模型的实际部署中,量化技术...
2024-11-19
·
浏览248次
扩散模型版CS: GO!世界模型+强化学习:2小时训练登顶Atari 100K
扩散模型版CS: GO!世界模型+强化学习:2小时训练登顶Atari 100K...
2024-11-18
·
浏览226次
Grok 3证明黎曼猜想,训练遭灾难性事件?数学家称不夸张,两年内AI将解出千禧年难题
Grok 3证明黎曼猜想,训练遭灾难性事件?数学家称不夸张,两年内AI将解出千禧年难题...
2024-11-18
·
浏览256次
月之暗面创始人杨植麟:AI 的下一个重要方向是具备“思考能力”
据新浪科技报道,杨植麟认为,接下来AI发展的很重要的一个方向是使AI能够具备思考的能力,数学产品则最适合让AI得到锻炼。...
2024-11-18
·
浏览384次
前谷歌 AI 研究员:ChatGPT 原本可以更早出现的
在今年 10 月的 TED AI 大会上,被称为“谷歌八子”之一的雅各布・乌斯克尔特(Jakob Uszkoreit)接受了媒体的采访。在访谈中,他分享了 Transforme...
2024-11-18
·
浏览355次
微软 GraphRAG AI 提效:改善数据检索,tokens 成本降低 77%
科技媒体 winbuzzer 昨日(11 月 15 日)发布博文,报道称微软研究院已更新 GraphRAG 系统,新增了动态社区(dynamic community)选择功能,...
2024-11-17
·
浏览281次
Scaling Law或将终结?哈佛MIT预警:低精度量化已无路可走,重磅研究掀翻AI圈
Scaling Law或将终结?哈佛MIT预警:低精度量化已无路可走,重磅研究掀翻AI圈...
2024-11-17
·
浏览269次
「谍战」开启!基建狂魔马斯克122天交付10万卡超算,对手大恐慌派间谍飞机侦查
「谍战」开启!基建狂魔马斯克122天交付10万卡超算,对手大恐慌派间谍飞机侦查...
2024-11-17
·
浏览289次
Nature:「人类亲吻难题」彻底难倒LLM,所有大模型全部失败!LLM根本不会推理,只是工具
Nature:「人类亲吻难题」彻底难倒LLM,所有大模型全部失败!LLM根本不会推理,只是工具...
2024-11-16
·
浏览337次
过程奖励模型PRM成版本答案!谷歌DeepMind全自动标注逐步骤奖励PAV,准确率提升8%
过程奖励模型PRM成版本答案!谷歌DeepMind全自动标注逐步骤奖励PAV,准确率提升8%...
2024-11-16
·
浏览538次
OpenAI 回应 AI 在教育界争议:12 种方法让学生合理使用 ChatGPT
OpenAI 公司昨日(11 月 14 日)发布《学生使用 ChatGPT 写作指南》博文,认为 ChatGPT 可以作为教育工具,帮助学生提升严谨思维和清晰写作的能力。...
2024-11-16
·
浏览357次
AI 中文社