如何高效桥接视觉和语言,字节&中大提出全新多模态大模型连接器ParGo
在多模态大语言模型(MLLMs)的发展中,视觉 - 语言连接器作为将视觉特征映射到 LLM 语言空间的关键组件,起到了桥梁作用。...
2025-01-12
·
浏览307次
迈向System 2推理,100页论文硬核讲述Meta-CoT
Meta-CoT 通过显式建模生成特定思维链(CoT)所需的底层推理过程,扩展了传统的思维链方法。...
2025-01-12
·
浏览280次
个人跑大模型,英伟达「皮衣刀客」新出的Project DIGITS与M4 Mac Mini到底哪个好?
前些天,英伟达发布了一大堆东西,其中包括一款 AI 超级计算机 Project DIGITS,机器之心也在第一时间进行了报道,参阅《RTX5090 震撼发布,国行 16499 ...
2025-01-11
·
浏览527次
一行代码Post-Train任意长序列!360智脑开源360-LLaMA-Factory
大模型长序列的处理能力已越来越重要,像复杂长文本任务、多帧视频理解任务、以及 OpenAI 近期发布的 o1、o3 系列模型的高计算量模式,需要处理的输入 + 输出总 toke...
2025-01-11
·
浏览240次
引领人机交互革命?微软研究团队发布80页的大模型GUI智能体综述
图形用户界面(Graphical User Interface, GUI)作为数字时代最具代表性的创新之一,大幅简化了人机交互的复杂度。...
2025-01-09
·
浏览469次
逆向设计电路,深度学习开辟全新的自动综合道路
来自美国普林斯顿大学与印度理工学院的联合团队展示了一种通用的逆向设计方法,用于具有设计辐射和散射特性的任意形状复杂多端口电磁结构,与有源电路共同设计。...
2025-01-09
·
浏览407次
马斯克:现实世界中用于训练 AI 模型的数据已经所剩无几
在周三晚间与Stagwell董事会主席马克·佩恩的直播对话中,马斯克表示:“我们现在基本上已经消耗掉了所有人类知识的积累……用于人工智能训练的数据。这个现象基本上是去年发生的。...
2025-01-09
·
浏览311次
马斯克旗下 AI 聊天机器人 Grok 将推出“无拘束模式” ,提供更具争议性回答
根据 FAQ 页面的描述,Grok 在“无拘束模式”下将提供“可能令人反感、不恰当甚至冒犯性”的回答,类似于“一位仍在学习技艺的业余单口喜剧演员的表现”。目前,这一模式似乎尚未...
2025-01-09
·
浏览486次
一篇推文看一年!Jim Fan力荐2025必读清单:50篇论文,扫盲「全领域AI实战」
一篇推文看一年!Jim Fan力荐2025必读清单:50篇论文,扫盲「全领域AI实战」...
2025-01-09
·
浏览386次
2000万美元AI联创惨遭绿卡拒绝!怒斥美国移民局,马斯克Jeff Dean安慰
2000万美元AI联创惨遭绿卡拒绝!怒斥美国移民局,马斯克Jeff Dean安慰...
2025-01-09
·
浏览269次
AI 中文社