mod 标签,匹配到约497个结果, 耗时0.0284秒

性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源

阿里通义千问今日宣布正式推出 Qwen3-235B-A22B 思考模型升级版本:Qwen3-235B-A22B-Thinking-2507。...
2025-07-26
·
浏览40次

智谱 GLM-4.5 系列 AI 模型踪迹曝光,预估采用新混合专家架构

根据 modelscope / ms-swift 代码库显示的 commit 记录,智谱即将发布 GLM-4.5 系列模型,预估采用全新的混合专家(MoE)结构,是一款多模态可扩展大模型。...
2025-07-25
·
浏览44次

阿里云通义千问宣布 Qwen-MT 机器翻译模型:支持 92 种语言互译,每百万输出 token 低至 2 元

Qwen-MT 在中英、英德多领域翻译以及 WMT24 多语言翻译任务中,显著优于 GPT-4.1-mini、Gemini-2.5-Flash 和 Qwen3-8B 同规模模型,甚至与 GPT-4.1、Gemini-2.5-Pro、Qwen...
2025-07-25
·
浏览73次

阿里云通义千问 Qwen3-Coder 宣布开源:480B 参数、原生支持 256K 上下文,可与 Claude Sonnet4 媲美

Qwen3-Coder 拥有多个尺寸,今天率先开源当前最强大版本:Qwen3-Coder-480B-A35B-Instruct 模型。它是一个 MoE 模型,拥有 480B 参数,激活 35B 参数,原生支持 256K 上下文,并可通过 Y...
2025-07-23
·
浏览81次

阿里云通义千问 Qwen 3 旗舰版模型宣布更新:性能全面提升,超越 Kimi、DeepSeek 等行业顶尖水平

阿里云今天更新了旗舰版 Qwen3 模型,推出 Qwen3-235B-A22B-FP8 非思考模式(Non-thinking)的更新版本,命名为 Qwen3-235B-A22B-Instruct-2507-FP8。...
2025-07-22
·
浏览94次

苹果发布论文坚称 AI 训练符合道德原则,且尊重出版商权益

苹果公司补充道:“我们不会在训练基础模型时使用用户的私人数据或用户交互信息。我们还采取措施应用过滤器,去除个人身份信息,排除粗俗和不安全的内容。”...
2025-07-22
·
浏览55次











AGI 这个词“过时”了?硅谷大佬开始重金押注“超级智能”

硅谷科技巨头正从“通用人工智能”(AGI)转向更雄心勃勃的“超级智能”(Superintelligence)。Meta、OpenAI等公司纷纷投入巨资,吸引顶尖人才。专家认为,超级智能可能带来巨大商业机遇,但也伴随严峻风险。#AI未来##超...
2025-07-06
·
浏览74次




阿里通义开源旗下首个音频生成模型 ThinkSound:可像“专业音效师”一样思考

ThinkSound 首次将 CoT(Chain-of-Thought,思维链)应用到音频生成领域,让 AI 学会一步步“想清楚”画面事件与声音之间的关系,从而实现高保真、强同步的空间音频生成 —— 不只是“看图配音”,而是真正“听懂画面”...
2025-07-04
·
浏览87次


ChatGPT惨败Llama!MIT官宣AI开飞船0%失败率,马斯克火星殖民不再是梦

ChatGPT惨败Llama!MIT官宣AI开飞船0%失败率,马斯克火星殖民不再是梦...
2025-07-02
·
浏览91次

AI 冲击就业:报告称 2025 英国初级职位招聘数较 2022 年降低 32%

据Adzuna的数据显示,自2022年ChatGPT发布以来,英国初级职位的数量下降了三分之一。非技术或专业化程度较低的工作,如客户服务,面临被AI替代的最大风险。...
2025-07-02
·
浏览93次