英伟达提出全新Star Attention,10倍加速LLM推理!登顶Hugging Face论文榜

英伟达提出全新Star Attention,10倍加速LLM推理!登顶Hugging Face论文榜

英伟达提出全新Star Attention,10倍加速LLM推理!登顶Hugging Face论文榜
英伟达提出全新Star Attention,10倍加速LLM推理!登顶Hugging Face论文榜...
2024-12-05 · 浏览266次
1-bit大模型还能再突破!新一代BitNet架构启用4位激活值

1-bit大模型还能再突破!新一代BitNet架构启用4位激活值

1-bit大模型还能再突破!新一代BitNet架构启用4位激活值
1-bit大模型还能再突破!新一代BitNet架构启用4位激活值...
2024-12-05 · 浏览260次
阿尔特曼:ChatGPT AI 聊天机器人周活跃用户超 3 亿,日均消息发送量突破 10 亿条

阿尔特曼:ChatGPT AI 聊天机器人周活跃用户超 3 亿,日均消息发送量突破 10 亿条

阿尔特曼:ChatGPT AI 聊天机器人周活跃用户超 3 亿,日均消息发送量突破 10 亿条
在纽约时报本周三举办的 DealBook 峰会上,OpenAI 公司首席执行官山姆・阿尔特曼(Sam Altman)发布喜讯,ChatGPT 聊天机器人周活跃用户超过 3 亿,...
2024-12-05 · 浏览327次
OpenAI 将进行 12 场直播:一大堆东西要发布

OpenAI 将进行 12 场直播:一大堆东西要发布

OpenAI 将进行 12 场直播:一大堆东西要发布
当地时间 12 月 4 日,OpenAI CEO 阿尔特曼在社交媒体透露,接下来每个工作日将进行一场直播,总共12场直播,其中包括发布或演示,其中包括一些大型活动和一些圣诞礼物...
2024-12-05 · 浏览297次
关于LLM-as-a-judge范式,终于有综述讲明白了

关于LLM-as-a-judge范式,终于有综述讲明白了

关于LLM-as-a-judge范式,终于有综述讲明白了
评估和评价长期以来一直是人工智能 (AI) 和自然语言处理 (NLP) 中的关键挑战。...
2024-12-05 · 浏览413次
扩散模型、最优传输存在什么关系?法国数学家4页论文引网友围观

扩散模型、最优传输存在什么关系?法国数学家4页论文引网友围观

扩散模型、最优传输存在什么关系?法国数学家4页论文引网友围观
扩散模型和最优传输之间到底存在怎样的联系?对很多人来说还是一个未解之谜。...
2024-12-05 · 浏览276次
ChatGPT遇到这些人名开始自闭,OpenAI回应了

ChatGPT遇到这些人名开始自闭,OpenAI回应了

ChatGPT遇到这些人名开始自闭,OpenAI回应了
最近几天,ChatGPT 惊现神秘 Bug,当被问及「David Mayer」这个名字时,它拒绝回答问题。...
2024-12-05 · 浏览419次
质量超越o1,成本仅4%,UCSD张怡颖教授团队开源生成式AI工作流自动优化器

质量超越o1,成本仅4%,UCSD张怡颖教授团队开源生成式AI工作流自动优化器

质量超越o1,成本仅4%,UCSD张怡颖教授团队开源生成式AI工作流自动优化器
近几年在生成式 AI 技术和商业创新飞速发展的背景下,创建高质量且低成本的生成式 AI 应用在业界仍有相当难度,主要原因在于缺乏系统化的调试和优化方法。...
2024-12-05 · 浏览325次
被忽略的起点?Karpathy揭秘最初的注意力论文被Transformer光芒掩盖的故事

被忽略的起点?Karpathy揭秘最初的注意力论文被Transformer光芒掩盖的故事

被忽略的起点?Karpathy揭秘最初的注意力论文被Transformer光芒掩盖的故事
几个小时前,著名 AI 研究者、OpenAI 创始成员之一 Andrej Karpathy 发布了一篇备受关注的长推文,其中分享了注意力机制背后一些或许少有人知的故事。...
2024-12-05 · 浏览294次
昨晚的「云计算春晚」,大模型、芯片连发,比OpenAI、谷歌上新都猛

昨晚的「云计算春晚」,大模型、芯片连发,比OpenAI、谷歌上新都猛

昨晚的「云计算春晚」,大模型、芯片连发,比OpenAI、谷歌上新都猛
亚马逊云科技上演了一场生成式 AI 能力的「王者归来」。...
2024-12-05 · 浏览322次
刚刚,DeepMind最强「基础世界模型」诞生!单图生1分钟游戏世界,解锁下一代智能体

刚刚,DeepMind最强「基础世界模型」诞生!单图生1分钟游戏世界,解锁下一代智能体

刚刚,DeepMind最强「基础世界模型」诞生!单图生1分钟游戏世界,解锁下一代智能体
刚刚,DeepMind最强「基础世界模型」诞生!单图生1分钟游戏世界,解锁下一代智能体...
2024-12-05 · 浏览238次
亚马逊祭出地表最强全家桶,多模态Nova却败给Claude 3.5!

亚马逊祭出地表最强全家桶,多模态Nova却败给Claude 3.5!

亚马逊祭出地表最强全家桶,多模态Nova却败给Claude 3.5!
亚马逊祭出地表最强全家桶,多模态Nova却败给Claude 3.5!...
2024-12-04 · 浏览279次
28岁IOI金牌华人得主打造「AI程序员军团」,6个月创估值20亿独角兽!人类编程效率暴涨8倍

28岁IOI金牌华人得主打造「AI程序员军团」,6个月创估值20亿独角兽!人类编程效率暴涨8倍

28岁IOI金牌华人得主打造「AI程序员军团」,6个月创估值20亿独角兽!人类编程效率暴涨8倍
28岁IOI金牌华人得主打造「AI程序员军团」,6个月创估值20亿独角兽!人类编程效率暴涨8倍...
2024-12-04 · 浏览385次
万亿美元AI市场还能成吗?这里是12位业内人士的看法

万亿美元AI市场还能成吗?这里是12位业内人士的看法

万亿美元AI市场还能成吗?这里是12位业内人士的看法
万亿美元AI市场还能成吗?这里是12位业内人士的看法...
2024-12-04 · 浏览227次
惊掉下巴!被字节起诉800万实习生,拿下NeurIPS 2024最佳论文

惊掉下巴!被字节起诉800万实习生,拿下NeurIPS 2024最佳论文

惊掉下巴!被字节起诉800万实习生,拿下NeurIPS 2024最佳论文
惊掉下巴!被字节起诉800万实习生,拿下NeurIPS 2024最佳论文...
2024-12-04 · 浏览416次
3个月估值10亿,李飞飞空间智能首个模型诞生!一张图生成3D世界,视频游戏要变天

3个月估值10亿,李飞飞空间智能首个模型诞生!一张图生成3D世界,视频游戏要变天

3个月估值10亿,李飞飞空间智能首个模型诞生!一张图生成3D世界,视频游戏要变天
3个月估值10亿,李飞飞空间智能首个模型诞生!一张图生成3D世界,视频游戏要变天...
2024-12-03 · 浏览305次
李飞飞团队ReKep荣获CoRL-LEAP研讨会最佳论文奖,具身智能又下一城!

李飞飞团队ReKep荣获CoRL-LEAP研讨会最佳论文奖,具身智能又下一城!

李飞飞团队ReKep荣获CoRL-LEAP研讨会最佳论文奖,具身智能又下一城!
李飞飞团队ReKep荣获CoRL-LEAP研讨会最佳论文奖,具身智能又下一城!...
2024-12-03 · 浏览288次
MIT 76页深度报告:AI加速创新马太效应,科学家产出分化加剧!缺乏判断力将被淘汰

MIT 76页深度报告:AI加速创新马太效应,科学家产出分化加剧!缺乏判断力将被淘汰

MIT 76页深度报告:AI加速创新马太效应,科学家产出分化加剧!缺乏判断力将被淘汰
MIT 76页深度报告:AI加速创新马太效应,科学家产出分化加剧!缺乏判断力将被淘汰...
2024-12-03 · 浏览337次
全自动组装家具! 斯坦福发布IKEA Video Manuals数据集:首次实现「组装指令」真实场景4D对齐

全自动组装家具! 斯坦福发布IKEA Video Manuals数据集:首次实现「组装指令」真实场景4D对齐

全自动组装家具! 斯坦福发布IKEA Video Manuals数据集:首次实现「组装指令」真实场景4D对齐
全自动组装家具! 斯坦福发布IKEA Video Manuals数据集:首次实现「组装指令」真实场景4D对齐...
2024-12-03 · 浏览323次
OpenAI 称考虑在人工智能产品中引入广告,开辟新的收入来源

OpenAI 称考虑在人工智能产品中引入广告,开辟新的收入来源

OpenAI 称考虑在人工智能产品中引入广告,开辟新的收入来源
据英国《金融时报》今晚报道,OpenAI 正在考虑在其人工智能产品中引入广告。目前该公司正处于向盈利性企业转型的过程,试图开辟新的收入来源。...
2024-12-02 · 浏览293次
Andrej Karpathy:神奇大模型不存在的,只是对人类标注的拙劣模仿

Andrej Karpathy:神奇大模型不存在的,只是对人类标注的拙劣模仿

Andrej Karpathy:神奇大模型不存在的,只是对人类标注的拙劣模仿
也许是时候寻找新的方法了?...
2024-12-02 · 浏览487次
关于计算机视觉中的自回归模型,这篇综述一网打尽了

关于计算机视觉中的自回归模型,这篇综述一网打尽了

关于计算机视觉中的自回归模型,这篇综述一网打尽了
本文是一篇关于自回归模型在视觉领域发展的综述论文,由港大、清华、普林斯顿、杜克、俄亥俄州立、UNC、苹果、字节跳动、香港理工大学等多所高校及研究机构的伙伴联合发布。...
2024-12-02 · 浏览580次
NeurIPS 2024|杜克大学&谷歌提出SLED解码框架,无需外部数据与额外训练,有效缓解大语言模型幻觉,提高事实准确性

NeurIPS 2024|杜克大学&谷歌提出SLED解码框架,无需外部数据与额外训练,有效缓解大语言模型幻觉,提高事实准确性

NeurIPS 2024|杜克大学&谷歌提出SLED解码框架,无需外部数据与额外训练,有效缓解大语言模型幻觉,提高事实准确性
大语言模型(LLM)在各种任务上展示了卓越的性能。...
2024-12-02 · 浏览265次
DeepMind用语言游戏让大模型学AlphaGo自我博弈,数据限制不存在了

DeepMind用语言游戏让大模型学AlphaGo自我博弈,数据限制不存在了

DeepMind用语言游戏让大模型学AlphaGo自我博弈,数据限制不存在了
自我博弈,很神奇吧?...
2024-12-02 · 浏览308次
第一页 · 上一页 · 下一页 · 当前第175页