击败25个分子设计算法,佐治亚理工、多伦多大学、康奈尔提出大语言模型MOLLEO
佐治亚理工学院、多伦多大学和康奈尔大学研究者合作提出了分子语言增强进化优化(MOLLEO),通过将拥有化学知识的预训练大语言模型(LLMs)整合到进化算法中,显著改善了进化算法...
2024-07-01
·
浏览328次
力压70B Llama 3,Gemma 2成最强开源模型!大佬质疑用榜单prompt微调引全网热议
力压70B Llama 3,Gemma 2成最强开源模型!大佬质疑用榜单prompt微调引全网热议...
2024-07-01
·
浏览810次
Meta 推出 LLM Compiler 代码优化模型,可搭配其他 AI 改善代码生成 / 编译能力
Meta 前天推出了一款名为“LLM Compiler”的模型,该模型基于 Meta 现有的 Code Llama 打造,主打代码优化,目前相关模型已登陆 Hugging Fa...
2024-07-01
·
浏览482次
字节大模型团队Depth Anything V2模型入选苹果最新CoreML模型
苹果公司在HuggingFace上发布了20个新的Core ML模型和4个数据集,字节大模型团队的单目深度估计模型 Depth Anything V2入选其中。...
2024-07-01
·
浏览518次
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
想要达成通用人工智能 AGI 的终极目标,首先要达成的是模型要能完成人类所能轻松做到的任务。...
2024-07-01
·
浏览296次
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM...
2024-06-30
·
浏览311次
全美 TOP 5 机器学习博士:痛心,实验室 H100 数量为 0!同实验室博士用 GPU 得靠抢
全美 TOP 5 高校的机器学习博士,实验室却连一块 H100 都没有?...
2024-06-30
·
浏览1098次
ICML 2024|Transformer究竟如何推理?基于样例还是基于规则
本文探究了 transformers 在做数学推理问题时究竟是采用 case-based reasoning 还是 rule-based reasoning...
2024-06-30
·
浏览483次
MIT辍学,27岁华裔亿万富翁崛起内幕!创业8年公司估值138亿美元,和奥特曼有私交
MIT辍学,27岁华裔亿万富翁崛起内幕!创业8年公司估值138亿美元,和奥特曼有私交...
2024-06-29
·
浏览305次
OpenAI 与《时代》达成合作协议:可用其杂志内容训练 ChatGPT
通过此次合作,OpenAI将能够访问《时代》杂志过去101年来的海量档案中的当前、历史内容,以增强其产品并响应用户查询——在Time.com上提供引文和原始来源的链接。...
2024-06-29
·
浏览349次
90/270 亿参数,谷歌发布 Gemma 2 开源 AI 模型:性能力压同级、单 A100 / H100 GPU 可运行
谷歌公司昨日发布新闻稿,面向全球研究人员和开发人员发布 Gemma 2 大语言模型,共有 90 亿参数(9B)和 270 亿参数(27B)两种大小。...
2024-06-29
·
浏览370次
比尔・盖茨喊话环保人士:不要“过分担心”AI 用电问题
据《金融时报》北京时间今日报道,针对当前AI系统导致能源消耗加快的问题,比尔·盖茨发起了“辩护”,他认为AI技术最终将会“抵消”其耗电量。...
2024-06-29
·
浏览395次
Meta 发布基于 Code Llama 的 LLM 编译器:优化代码大小、反汇编
Meta在HuggingFace上公开了LLM编译器的 7B 和 13B 模型,采用宽松的许可协议,允许用于研究和商业用途。...
2024-06-29
·
浏览355次
微软 AI 部门 CEO:网上几乎所有内容都可免费用于 AI 训练,但也有灰色地带
去年至今已有多家新闻出版机构或作家起诉微软和OpenAI,指控旗下聊天机器人“窃取”自己的作品训练AI模型,侵犯版权。...
2024-06-29
·
浏览285次
GPT-4批评GPT-4实现「自我提升」!OpenAI前超级对齐团队又一力作被公开
GPT-4批评GPT-4实现「自我提升」!OpenAI前超级对齐团队又一力作被公开...
2024-06-28
·
浏览311次
专给 ChatGPT“找茬”,OpenAI 训练 CriticGPT 模型以检索输出内容错误
当地时间27日,OpenAI宣布基于GPT-4训练了一个名为CriticGPT的模型,用于查找ChatGPT聊天机器人输出内容中的错误。它可以撰写评论,强调 ChatGPT 生...
2024-06-28
·
浏览291次
字节跳动发布“豆包MarsCode”智能开发工具,面向国内开发者免费
6 月 26 日,字节跳动在北京发布了基于豆包大模型打造的智能开发工具 - 豆包MarsCode ,面向国内开发者免费开放。...
2024-06-28
·
浏览718次
展览综述 | 期待值拉满!WAIC 2024展览新品首曝,硬核看展攻略来袭!
全球人工智能领域正迎来历史性变革与迅猛发展,上海抢抓新一代人工智能发展机遇,以人工智能驱动形成新质生产力,加快打造世界级高端产业集群。...
2024-06-28
·
浏览502次
AI 中文社