再加一把火、造福全人类,Hugging Face 号召打造完全开源版 DeepSeek R1 大模型
Hugging Face 称这项工作非常重要,因为 DeepSeek R1 非常高效,可以作为创新的基础模型。它也可以被研究人员、科学家和企业用作促进创新和突破的负担得起的模型...
2025-01-29
·
浏览419次
OpenAI:有证据表明 DeepSeek 使用了我们的模型进行训练
OpenAI 向《金融时报》表示,他们发现了 DeepSeek 使用“蒸馏”技术的证据。这是一种常见的开发手段,开发者通过从更大、更强大的模型中提取数据来训练自己的 AI 模型...
2025-01-29
·
浏览596次
能思考会搜索的国产大模型,全网疯测的 DeepSeek 牛在哪?
一家来自杭州的“小公司” DeepSeek,却给整个 AI 行业带来了新思路,这两天可以说是火遍了全网。...
2025-01-29
·
浏览541次
阿斯麦 CEO:DeepSeek 的出现是好消息
荷兰光刻机制造商 ASML Holding NV 的首席执行官克里斯托夫・福凯(Christophe Fouquet)在周三的新闻发布会上表示,对于 ASML 而言,任何能够降...
2025-01-29
·
浏览253次
DeepSeek绕开CUDA垄断,V3论文细节再挖出!英伟达护城河不存在了?
DeepSeek绕开CUDA垄断,V3论文细节再挖出!英伟达护城河不存在了?...
2025-01-29
·
浏览516次
DeepSeek独立发现o1核心思路,OpenAI首席研究官亲自证实!奥特曼被迫发声
DeepSeek独立发现o1核心思路,OpenAI首席研究官亲自证实!奥特曼被迫发声...
2025-01-29
·
浏览355次
锌电池「返老还童」:电子科大联手湖北大学破解枝晶难题,效率提升99.95%!
来自电子科技大学、南洋理工大学和湖北大学的研究团队,提出了一种创新的电解质设计——混合双盐电解质(HDE),有望解决这些关键难题。...
2025-01-27
·
浏览239次
执行推理时能对齐语言模型吗?谷歌InfAlign带来一种对齐新思路
在根据某个奖励微调生成式语言模型时,使用 KL 正则化的强化学习(KL-RL)来对齐生成式语言模型是一种常用框架。...
2025-01-27
·
浏览210次
支持 100 万 Tokens 上下文,阿里通义千问推出 Qwen2.5-1M 开源模型
通义千问本次发布了两个新的开源模型,分别是 Qwen2.5-7B-Instruct-1M 和 Qwen2.5-14B-Instruct-1M,这是通义千问首次将开源的 Qwen...
2025-01-27
·
浏览555次
深度求索 DeepSeek 登顶苹果 App Store 免费应用榜
深度求索旗下 AI 智能助手应用 DeepSeek 已在美区下载榜上超越 ChatGPT,并登顶苹果 App Store 免费应用榜。...
2025-01-27
·
浏览364次
预定最强 AI:xAI Grok-3 有望下周登场,推理性能超 OpenAI o1
科技媒体 testingcatalog 今天(1 月 27 日)发布博文,报道称 xAI 官方虽然尚未公布,但 Grok-3 已短暂现身独立平台和 X 平台,开启内部测试,有望...
2025-01-27
·
浏览337次
《黑神话:悟空》制作人冯骥“暴论”:DeepSeek 可能是个国运级别的科技成果
游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥昨日发文评价了深度求索旗下的 DeepSeek,称其拥有比肩 O1 的推理能力,并表示很开心这样震撼的突破来自一个纯粹的中国公...
2025-01-27
·
浏览399次
朱啸虎称 DeepSeek 是技术理想主义者的胜利:专注于技术和创新,远胜投放买流量和 PR
深度求索旗下 AI 智能助手应用 DeepSeek 已在美区下载榜上超越 ChatGPT,并登顶苹果 App Store 免费应用榜。...
2025-01-27
·
浏览381次
DeepSeek 回应两天故障两次:技术服务的稳定性受多重因素影响
对于 DeepSeek 如何看待“两天两崩”,DeepSeek 回复称,技术服务的稳定性受多重因素影响,可能涉及突发流量、系统升级适配或底层基础设施的临时波动等。我们的团队始终...
2025-01-27
·
浏览404次
对话中国工程院院士郑纬民:DeepSeek,究竟厉害在哪里
1 月 27 日,DeepSeek 应用登顶苹果美国地区应用商店免费 App 下载排行榜,在美区下载榜上超越了 ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSe...
2025-01-27
·
浏览288次
消息称 Meta 成立 4 个小组研究 DeepSeek,基于此来改进自家 Llama
据 Information 网站,Facebook 母公司 Meta 成立了四个专门研究小组来研究量化巨头幻方量化旗下的国产大模型 DeepSeek 的工作原理,并基于此来改进...
2025-01-27
·
浏览226次
DeepSeek 多岗位招人,实习生日薪最高达上千元
据红星资本局报道,深度求索公司的北京子公司目前正在招聘 52 个岗位,涵盖深度学习研究员、核心系统研发工程师及资深 UI 设计师等职位,均为 14 薪。其中,核心系统研发工程师...
2025-01-27
·
浏览471次
史上首次,DeepSeek登顶中美AppStore!NYU教授:全球「AI霸权」之争已结束
史上首次,DeepSeek登顶中美AppStore!NYU教授:全球「AI霸权」之争已结束...
2025-01-27
·
浏览252次
高灵敏探索质谱,滑铁卢、中原AI院团队基于深度学习的端到端方法
DeepSearch 利用对比学习框架下改进的基于 Transformer 的编码器-解码器架构。...
2025-01-25
·
浏览294次
AI 中文社