4o 标签,匹配到约427个结果, 耗时0.0306秒


AI 模型 4o → o3:OpenAI 升级 Operator 智能体,浏览器交互更稳定、更准确

科技媒体 bleepingcomputer 今天(5 月 24 日)发布博文,报道称 OpenAI 升级 Operator 智能体,从 4o 升级到 o3 模型,大幅提升推理能力。...
2025-05-24
·
浏览41次


OpenAI 扩展 Responses API:支持 MCP、图像生成等

OpenAI 公司昨日(5 月 21 日)发布博文,宣布扩展 Responses API,支持远程连接 MCP 服务器、图像生成、Code Interpreter 以及文件搜索优化等,帮助开发者构建更智能的智能体应用。...
2025-05-22
·
浏览57次



新研究发现 AI 无法读懂模拟时钟,还不能告诉你某天是周几

爱丁堡大学研究员、论文作者 Rohit Saxena 表示:“人类从小就能掌握时间与日历概念,而 AI 在这方面的不足,是一个值得警惕的信号。”...
2025-05-18
·
浏览64次

谢赛宁等新作,统一多模态BLIP3-o登场!先理解后生成,端掉VAE刷新SOTA

谢赛宁等新作,统一多模态BLIP3-o登场!先理解后生成,端掉VAE刷新SOTA...
2025-05-16
·
浏览73次

OpenAI 上线安全评估中心,定期公开 AI 模型评估结果以提升透明度

OpenAI宣布上线安全评估中心,将定期公开AI模型在有害内容生成、模型越狱等方面的测试结果,以提高透明度。此举旨在让用户更清晰了解系统安全性能变化,并支持行业透明度努力。#OpenAI# #AI安全#...
2025-05-15
·
浏览72次


OpenAI 升级 ChatGPT AI 聊天机器人,GPT-4.1 编程专家模型登场

OpenAI 官方账号在 X 平台发布推文,宣布将于昨日(5 月 14 日)开始,在 ChatGPT AI 聊天机器人中,引入 GPT-4.1 模型。...
2025-05-15
·
浏览78次


OpenAI 发布并开源医疗测试基准 HealthBench,旨在更好地衡量 AI 系统在医疗健康领域能力

与以往测试集不同的是,HealthBench 的 5000 段核心测试对话,由来自 60 个国家 / 地区的 26 个专业 262 名医生打造,极大增强了该测试集的难度、真实性以及丰富度。...
2025-05-13
·
浏览102次

OpenAI ChatGPT 更新后过度讨好用户,两周过去问题仍未解决

OpenAI更新ChatGPT-4o后,AI表现出过度讨好用户的行为,甚至对荒谬想法也大加赞赏。CEO奥尔特曼撤回更新,但问题仍未解决。专家指出,AI的奉承倾向源于训练机制,可能引发社会问题。#AI伦理##ChatGPT#...
2025-05-11
·
浏览80次

卡内基梅隆大学推出 AI 模型“乐高 GPT”,敲敲键盘就能生成可搭建积木

据外媒Tom's Hardware今日报道,卡内基梅隆大学的研究团队开发出一款名为 LegoGPT 的 AI 模型,能够根据文字指令生成可实际搭建的乐高设计。...
2025-05-10
·
浏览84次

OpenAI 突破传统微调,RFT 技术可精准定制 o4-mini 模型

OpenAI 公司在其 o4-mini 推理模型上,推出了强化微调技术(Reinforcement Fine-Tuning, 简称 RFT),为定制基础模型以适应特定任务带来了突破性工具。...
2025-05-09
·
浏览85次

研究发现:要求 AI 简洁作答可能致其出现更多“幻觉”

巴黎AI公司Giskard研究发现,要求AI聊天机器人简短回答问题时,其产生“幻觉”(输出虚假信息)的概率会显著增加。包括GPT-4o在内的主流模型均存在此现象,因简洁回答缺乏反驳错误的空间。#AI幻觉##ChatGPT#...
2025-05-08
·
浏览78次

欧洲黑马Mistral Medium 3来了!跑分对标最强Claude,实测大翻车

欧洲黑马Mistral Medium 3来了!跑分对标最强Claude,实测大翻车...
2025-05-08
·
浏览95次

Gemini 2.5 Pro登顶三冠王!AI最强编程屠榜,全面碾压Claude 3.7

Gemini 2.5 Pro登顶三冠王!AI最强编程屠榜,全面碾压Claude 3.7...
2025-05-07
·
浏览126次



超越 DeepSeek-R1,英伟达开源模型 Llama-Nemotron 登顶

超越 DeepSeek-R1 的英伟达开源新王 Llama-Nemotron,是怎么训练出来的?刚刚放出的论文,把一切细节毫无保留地全部揭秘了!...
2025-05-06
·
浏览118次

医疗自诊依赖 AI 聊天机器人存风险,专家呼吁谨慎使用

牛津大学研究发现,人们使用聊天机器人获取健康建议时,往往难以提供关键信息,导致建议质量不佳。研究显示,聊天机器人不仅增加识别健康问题的难度,还可能低估问题严重性。#AI医疗##健康科技#...
2025-05-06
·
浏览86次

超越DeepSeek-R1,英伟达开源新王登顶!14万H100小时训练细节全曝光

超越DeepSeek-R1,英伟达开源新王登顶!14万H100小时训练细节全曝光...
2025-05-06
·
浏览95次