更长思维并不等于更强推理性能,强化学习可以很简洁

更长思维并不等于更强推理性能,强化学习可以很简洁

更长思维并不等于更强推理性能,强化学习可以很简洁
今天早些时候,著名研究者和技术作家 Sebastian Raschka 发布了一条推文,解读了一篇来自 Wand AI 的强化学习研究,其中分析了推理模型生成较长响应的原因。...
2025-04-15 · 浏览129次
10万奖金×认知升级!OceanBase首届AI黑客松广发英雄帖,你敢来么?

10万奖金×认知升级!OceanBase首届AI黑客松广发英雄帖,你敢来么?

10万奖金×认知升级!OceanBase首届AI黑客松广发英雄帖,你敢来么?
从 ChatGPT 引发认知革命到 GPT-4o 实现多模态跨越,AI 技术的每次跃迁都在印证一个底层逻辑 —— 数据质量决定智能高度。...
2025-04-15 · 浏览110次
AI诺曼底时刻的“技术破壁者”:九章云极DataCanvas公司亮相2025 AI算力产业大会

AI诺曼底时刻的“技术破壁者”:九章云极DataCanvas公司亮相2025 AI算力产业大会

AI诺曼底时刻的“技术破壁者”:九章云极DataCanvas公司亮相2025 AI算力产业大会
在2025 AI算力产业大会,剑指当前AI算力产业‌成本高企、技术门槛高、供需错配三大痛点‌,九章云极DataCanvas公司以“弹性调度+智能开发+资源普惠”的全栈技术布局,...
2025-04-15 · 浏览88次
合成数据助力视频生成提速8.5倍,上海AI Lab开源AccVideo

合成数据助力视频生成提速8.5倍,上海AI Lab开源AccVideo

合成数据助力视频生成提速8.5倍,上海AI Lab开源AccVideo
虽然扩散模型在视频生成领域展现出了卓越的性能,但是视频扩散模型通常需要大量的推理步骤对高斯噪声进行去噪才能生成一个视频。...
2025-04-15 · 浏览113次
刚刚,DeepSeek公布了推理引擎开源路径,OpenAI也将开始连续一周发布

刚刚,DeepSeek公布了推理引擎开源路径,OpenAI也将开始连续一周发布

刚刚,DeepSeek公布了推理引擎开源路径,OpenAI也将开始连续一周发布
今天下午,DeepSeek 默默地在自己的 open-infra-index 库中发布了一份题为「开源 DeepSeek 推理引擎的路径」的文档,宣布将开源自己的内部推理引擎(...
2025-04-15 · 浏览93次
诺奖得主震撼宣言:AI一年完成10亿年「博士研究时间」!

诺奖得主震撼宣言:AI一年完成10亿年「博士研究时间」!

诺奖得主震撼宣言:AI一年完成10亿年「博士研究时间」!
诺奖得主震撼宣言:AI一年完成10亿年「博士研究时间」!...
2025-04-14 · 浏览124次
OpenAI 前首席科学家 Ilya Sutskever 的公司估值达 320 亿美元

OpenAI 前首席科学家 Ilya Sutskever 的公司估值达 320 亿美元

OpenAI 前首席科学家 Ilya Sutskever 的公司估值达 320 亿美元
报道称,这家初创公司已经筹集了 10 亿美元,另外一轮 10 亿美元的融资正在进行中。SSI 没有对新一轮融资发表评论,据说这笔融资由 Greenoaks 领投。
2025-04-14 · 浏览153次
刚刚,AI破解50年未解数学难题!南大校友用OpenAI模型完成首个非平凡数学证明

刚刚,AI破解50年未解数学难题!南大校友用OpenAI模型完成首个非平凡数学证明

刚刚,AI破解50年未解数学难题!南大校友用OpenAI模型完成首个非平凡数学证明
刚刚,AI破解50年未解数学难题!南大校友用OpenAI模型完成首个非平凡数学证明...
2025-04-14 · 浏览106次
一套算法控制机器人军团!纯模拟环境强化学习,Figure学会像人一样走路

一套算法控制机器人军团!纯模拟环境强化学习,Figure学会像人一样走路

一套算法控制机器人军团!纯模拟环境强化学习,Figure学会像人一样走路
一套算法控制机器人军团!纯模拟环境强化学习,Figure学会像人一样走路...
2025-04-14 · 浏览118次
GitHub中国IP访问崩了又复活!OpenAI API新政恐锁死GPT-5?

GitHub中国IP访问崩了又复活!OpenAI API新政恐锁死GPT-5?

GitHub中国IP访问崩了又复活!OpenAI API新政恐锁死GPT-5?
GitHub中国IP访问崩了又复活!OpenAI API新政恐锁死GPT-5?...
2025-04-14 · 浏览90次
微软研究:AI 编程助手软件调试能力堪忧

微软研究:AI 编程助手软件调试能力堪忧

微软研究:AI 编程助手软件调试能力堪忧
微软最新研究表明,包括Claude 3.7 Sonnet和OpenAI o3-mini在内的多款AI模型在软件调试任务中表现不佳,最高成功率不足50%。研究指出,缺乏足够的调试...
2025-04-14 · 浏览142次
AI“推理”模型兴起,基准测试成本飙升

AI“推理”模型兴起,基准测试成本飙升

AI“推理”模型兴起,基准测试成本飙升
AI推理模型测试成本高昂,OpenAI的o1模型测试费用高达2767美元,是普通模型的数倍。专家指出,高昂成本源于token生成量大,且基准测试复杂度提升。#AI测试成本# #...
2025-04-14 · 浏览146次
OPPO 小布助手网页版上线,接入满血版 DeepSeek

OPPO 小布助手网页版上线,接入满血版 DeepSeek

OPPO 小布助手网页版上线,接入满血版 DeepSeek
据IT之家网友反馈,OPPO 的小布助手已推出网页版,点击 xiaobu.coloros.com 即可体验,登录 OPPO 账号还可以同步手机端的历史对话记录。...
2025-04-14 · 浏览124次
扬州海关测试应用“机器狗”,搭载全景摄像头与实时通信系统

扬州海关测试应用“机器狗”,搭载全景摄像头与实时通信系统

扬州海关测试应用“机器狗”,搭载全景摄像头与实时通信系统
据“海关发布”消息,4 月 8 日,南京海关所属扬州海关联合科技公司探索四足式、轮足式机器人(网称“机器狗”)技术在海关远程口岸监管领域的创新应用,并开展了多场景测试。...
2025-04-14 · 浏览136次
强化学习带来的改进只是「噪音」?最新研究预警:冷静看待推理模型的进展

强化学习带来的改进只是「噪音」?最新研究预警:冷静看待推理模型的进展

强化学习带来的改进只是「噪音」?最新研究预警:冷静看待推理模型的进展
「推理」已成为语言模型的下一个主要前沿领域,近期学术界和工业界都取得了突飞猛进的进展。...
2025-04-14 · 浏览99次
因用欧洲用户数据训练 Grok,马斯克的 X 公司遭爱尔兰调查

因用欧洲用户数据训练 Grok,马斯克的 X 公司遭爱尔兰调查

因用欧洲用户数据训练 Grok,马斯克的 X 公司遭爱尔兰调查
爱尔兰数据保护委员会(DPC)宣布对X公司展开调查,因其涉嫌使用欧洲用户个人数据训练AI聊天机器人Grok。此前DPC曾对Meta等公司开出高额罚单。#数据隐私##人工智能#...
2025-04-13 · 浏览152次
面对杂乱场景,灵巧手也能从容应对!NUS邵林团队发布DexSinGrasp基于强化学习实现物体分离与抓取统一策略

面对杂乱场景,灵巧手也能从容应对!NUS邵林团队发布DexSinGrasp基于强化学习实现物体分离与抓取统一策略

面对杂乱场景,灵巧手也能从容应对!NUS邵林团队发布DexSinGrasp基于强化学习实现物体分离与抓取统一策略
在物流仓库、生产线或家庭场景中,机器人常常需要在大量杂乱摆放的物体中高效地抓取目标。...
2025-04-13 · 浏览134次
魔改AlphaZero后,《我的世界》AI老玩家问世,干活不用下指令

魔改AlphaZero后,《我的世界》AI老玩家问世,干活不用下指令

魔改AlphaZero后,《我的世界》AI老玩家问世,干活不用下指令
人和智能体共享奖励参数,这才是强化学习正确的方向?...
2025-04-13 · 浏览134次
Science子刊 | 基于公平贝叶斯扰动,首个面向医学图像生成公平性的方法FairDiffusion来了

Science子刊 | 基于公平贝叶斯扰动,首个面向医学图像生成公平性的方法FairDiffusion来了

Science子刊 | 基于公平贝叶斯扰动,首个面向医学图像生成公平性的方法FairDiffusion来了
来自哈佛大学和纽约大学等机构的研究者首次探讨了医学影像生成中的公平性问题。...
2025-04-13 · 浏览100次
扩散模型奖励微调新突破:Nabla-GFlowNet让多样性与效率兼得

扩散模型奖励微调新突破:Nabla-GFlowNet让多样性与效率兼得

扩散模型奖励微调新突破:Nabla-GFlowNet让多样性与效率兼得
扩散模型奖励微调新突破:Nabla-GFlowNet让多样性与效率兼得...
2025-04-13 · 浏览124次
3710亿数学tokens,全面开放!史上最大高质量开源数学预训练数据集MegaMath发布

3710亿数学tokens,全面开放!史上最大高质量开源数学预训练数据集MegaMath发布

3710亿数学tokens,全面开放!史上最大高质量开源数学预训练数据集MegaMath发布
在大模型迈向推理时代的当下,数学推理能力已成为衡量语言模型智能上限的关键指标。...
2025-04-13 · 浏览106次
只因论文「碰瓷」,ICLR 2025区域主席直接拒稿!最强rebuttal,赢回荣耀

只因论文「碰瓷」,ICLR 2025区域主席直接拒稿!最强rebuttal,赢回荣耀

只因论文「碰瓷」,ICLR 2025区域主席直接拒稿!最强rebuttal,赢回荣耀
只因论文「碰瓷」,ICLR 2025区域主席直接拒稿!最强rebuttal,赢回荣耀...
2025-04-13 · 浏览142次
吉卜力爆红背后,关键推手另有其人!GPT-4o竟封奥特曼为AGI之王

吉卜力爆红背后,关键推手另有其人!GPT-4o竟封奥特曼为AGI之王

吉卜力爆红背后,关键推手另有其人!GPT-4o竟封奥特曼为AGI之王
吉卜力爆红背后,关键推手另有其人!GPT-4o竟封奥特曼为AGI之王...
2025-04-13 · 浏览118次
AI席卷校园:百万条对话揭秘,Claude是代码救星还是作弊工具?

AI席卷校园:百万条对话揭秘,Claude是代码救星还是作弊工具?

AI席卷校园:百万条对话揭秘,Claude是代码救星还是作弊工具?
AI席卷校园:百万条对话揭秘,Claude是代码救星还是作弊工具?...
2025-04-13 · 浏览95次
第一页 · 上一页 · 下一页 · 当前第73页