3.5 标签,匹配到约161个结果, 耗时0.1696秒


OpenAI 揭秘 ChatGPT 两年半前爆火背后轶事:原计划命名“Chat with GPT-3.5”

OpenAI首席研究官马克·陈表示,更名决定是在一次深夜做出的:“我们发现原来的名字太拗口,于是临时想了一个更简洁的替代方案。”...
2025-07-04
·
浏览119次


ChatGPT惨败Llama!MIT官宣AI开飞船0%失败率,马斯克火星殖民不再是梦

ChatGPT惨败Llama!MIT官宣AI开飞船0%失败率,马斯克火星殖民不再是梦...
2025-07-02
·
浏览92次







OpenAI 发布并开源医疗测试基准 HealthBench,旨在更好地衡量 AI 系统在医疗健康领域能力

与以往测试集不同的是,HealthBench 的 5000 段核心测试对话,由来自 60 个国家 / 地区的 26 个专业 262 名医生打造,极大增强了该测试集的难度、真实性以及丰富度。...
2025-05-13
·
浏览202次

马斯克:Grok 3.5“仍太粗糙”,需一周左右打磨

有网友日前提问“Grok 3.5、GPT-o3 Pro 和 GTA 6 哪个会最先发布?”对此,埃隆・马斯克的 X 账号回复称:“3.5 还是有点太粗糙了。还需要一周左右的时间。”...
2025-05-12
·
浏览160次

68 页论文再锤大模型竞技场:Llama4 发布前私下测试 27 个版本,只取最佳成绩

最近一篇名为《排行榜幻觉》(The Leaderboard Illusion)的论文在学术圈引发关注。...
2025-05-02
·
浏览245次

马斯克称下周推出 Grok 3.5:首个能准确回答有关火箭发动机问题的 AI

马斯克宣布下周将向SuperGrok订阅者发布Grok 3.5早期测试版,称这是首个能准确回答火箭发动机或电化学技术问题的AI。Grok 3.5能从第一原理推理并得出互联网上不存在的答案。#AI##马斯克#...
2025-04-29
·
浏览174次


OpenAI 遭实锤:研究称其 AI 模型“记住”了受版权保护的内容

华盛顿大学等研究为OpenAI用受版权保护内容训练模型指控提供依据。研究人员用新方法测试,发现GPT - 4记住部分小说和《纽约时报》文章内容。#OpenAI版权争议#...
2025-04-07
·
浏览157次

OpenAI深夜大招暴打Manus!智能体全家桶杀器一统API,4行代码轻松上手

OpenAI深夜大招暴打Manus!智能体全家桶杀器一统API,4行代码轻松上手...
2025-03-12
·
浏览285次

REVOLVE:响应演化驱动的智能优化框架,破解传统AI优化瓶颈

本文将介绍REVOLVE的核心概念、创新机制,并探讨其在解决方案优化、提示优化和代码优化等任务中的应用,分析其在多种场景中的实际效果。...
2025-03-04
·
浏览227次

微软原WizardLM团队:代码大模型WarriorCoder,性能新SOTA

近年来,大型语言模型(LLMs)在代码相关的任务上展现了惊人的表现,各种代码大模型层出不穷。...
2025-03-02
·
浏览211次

GPT-4.5被DeepSeek 500倍吊打!基准测试全班垫底,OpenAI痛失护城河

GPT-4.5被DeepSeek 500倍吊打!基准测试全班垫底,OpenAI痛失护城河...
2025-03-01
·
浏览191次

刚刚,GPT-4.5震撼上线情商逆天!OpenAI最大最贵模型最像人类,奥特曼带娃缺席

刚刚,GPT-4.5震撼上线情商逆天!OpenAI最大最贵模型最像人类,奥特曼带娃缺席...
2025-02-28
·
浏览321次


TOMG-Bench:大语言模型开放域分子生成新基准

香港理工大学、上海交通大学、上海人工智能实验的研究者提出了基于文本的开放分子生成基准测试(TOMG-Bench),旨在评估 LLM 在分子领域的开放域生成能力。...
2025-02-19
·
浏览209次

超过o1-mini、逼近o3-mini,DeepSeek-R1在新的贪吃蛇基准上拿下1801分

ARC Prize,曾在去年底 OpenAI 12 天连发的最后一天赚尽了眼球,其发布已经 5 年的基准 ARC-AGI 首次迎来了得分达到优良等级的挑战者:o3 系列模型。...
2025-02-18
·
浏览260次