AI 中文社区

人刚毕业，颠覆整个AI界：扒一扒Sora两带头人博士论文

看看这个时代最伟大 AI 学者的研究脉络。...

2024-07-01 · 浏览356次

击败25个分子设计算法，佐治亚理工、多伦多大学、康奈尔提出大语言模型MOLLEO

佐治亚理工学院、多伦多大学和康奈尔大学研究者合作提出了分子语言增强进化优化（MOLLEO），通过将拥有化学知识的预训练大语言模型（LLMs）整合到进化算法中，显著改善了进化算法...

2024-07-01 · 浏览328次

从零开始，用英伟达T4、A10训练小型文生视频模型，几小时搞定

很翔实的一篇教程。...

2024-07-01 · 浏览341次

力压70B Llama 3，Gemma 2成最强开源模型！大佬质疑用榜单prompt微调引全网热议

力压70B Llama 3，Gemma 2成最强开源模型！大佬质疑用榜单prompt微调引全网热议...

2024-07-01 · 浏览810次

《奇点更近了》作者再预言：2045年，智能将扩展到100万倍

《奇点更近了》作者再预言：2045年，智能将扩展到100万倍...

2024-07-01 · 浏览514次

Meta 推出 LLM Compiler 代码优化模型，可搭配其他 AI 改善代码生成 / 编译能力

Meta 前天推出了一款名为“LLM Compiler”的模型，该模型基于 Meta 现有的 Code Llama 打造，主打代码优化，目前相关模型已登陆 Hugging Fa...

2024-07-01 · 浏览482次

字节大模型团队Depth Anything V2模型入选苹果最新CoreML模型

苹果公司在HuggingFace上发布了20个新的Core ML模型和4个数据集，字节大模型团队的单目深度估计模型 Depth Anything V2入选其中。...

2024-07-01 · 浏览518次

Bengio团队提出多模态新基准，直指Claude 3.5和GPT-4o弱点

想要达成通用人工智能 AGI 的终极目标，首先要达成的是模型要能完成人类所能轻松做到的任务。...

2024-07-01 · 浏览296次

AI正在抢走谁的工作？一个人使用ChatGPT取代了60名员工

AI正在抢走谁的工作？一个人使用ChatGPT取代了60名员工...

2024-06-30 · 浏览450次

菲尔兹奖得主亲测GPT-4o，经典过河难题破解失败！最强Claude 3.5回答离谱，LeCun嘲讽LLM

菲尔兹奖得主亲测GPT-4o，经典过河难题破解失败！最强Claude 3.5回答离谱，LeCun嘲讽LLM...

2024-06-30 · 浏览311次

全美 TOP 5 机器学习博士：痛心，实验室 H100 数量为 0！同实验室博士用 GPU 得靠抢

全美 TOP 5 高校的机器学习博士，实验室却连一块 H100 都没有？...

2024-06-30 · 浏览1098次

谷歌「诚意之作」，开源9B、27B版Gemma2，主打高效、经济！

性能翻倍的Gemma 2，让同量级的Llama3怎么玩？...

2024-06-30 · 浏览505次

双向赋能：AI与数据库的修行之道

在这个数据为王的时代，数据是人工智能的三大支柱之一，其重要性不言而喻。...

2024-06-30 · 浏览284次

ICML 2024｜Transformer究竟如何推理？基于样例还是基于规则

本文探究了 transformers 在做数学推理问题时究竟是采用 case-based reasoning 还是 rule-based reasoning...

2024-06-30 · 浏览483次

MIT辍学，27岁华裔亿万富翁崛起内幕！创业8年公司估值138亿美元，和奥特曼有私交

MIT辍学，27岁华裔亿万富翁崛起内幕！创业8年公司估值138亿美元，和奥特曼有私交...

2024-06-29 · 浏览305次

OpenAI 与《时代》达成合作协议：可用其杂志内容训练 ChatGPT

通过此次合作，OpenAI将能够访问《时代》杂志过去101年来的海量档案中的当前、历史内容，以增强其产品并响应用户查询——在Time.com上提供引文和原始来源的链接。...

2024-06-29 · 浏览349次

90/270 亿参数，谷歌发布 Gemma 2 开源 AI 模型：性能力压同级、单 A100 / H100 GPU 可运行

谷歌公司昨日发布新闻稿，面向全球研究人员和开发人员发布 Gemma 2 大语言模型，共有 90 亿参数（9B）和 270 亿参数（27B）两种大小。...

2024-06-29 · 浏览370次

比尔・盖茨喊话环保人士：不要“过分担心”AI 用电问题

据《金融时报》北京时间今日报道，针对当前AI系统导致能源消耗加快的问题，比尔·盖茨发起了“辩护”，他认为AI技术最终将会“抵消”其耗电量。...

2024-06-29 · 浏览395次

Meta 发布基于 Code Llama 的 LLM 编译器：优化代码大小、反汇编

Meta在HuggingFace上公开了LLM编译器的 7B 和 13B 模型，采用宽松的许可协议，允许用于研究和商业用途。...

2024-06-29 · 浏览355次

微软 AI 部门 CEO：网上几乎所有内容都可免费用于 AI 训练，但也有灰色地带

去年至今已有多家新闻出版机构或作家起诉微软和OpenAI，指控旗下聊天机器人“窃取”自己的作品训练AI模型，侵犯版权。...

2024-06-29 · 浏览285次

GPT-4批评GPT-4实现「自我提升」！OpenAI前超级对齐团队又一力作被公开

GPT-4批评GPT-4实现「自我提升」！OpenAI前超级对齐团队又一力作被公开...

2024-06-28 · 浏览311次

专给 ChatGPT“找茬”，OpenAI 训练 CriticGPT 模型以检索输出内容错误

当地时间27日，OpenAI宣布基于GPT-4训练了一个名为CriticGPT的模型，用于查找ChatGPT聊天机器人输出内容中的错误。它可以撰写评论，强调 ChatGPT 生...

2024-06-28 · 浏览291次

字节跳动发布“豆包MarsCode”智能开发工具，面向国内开发者免费

6 月 26 日，字节跳动在北京发布了基于豆包大模型打造的智能开发工具 - 豆包MarsCode ，面向国内开发者免费开放。...

2024-06-28 · 浏览718次

展览综述 | 期待值拉满！WAIC 2024展览新品首曝，硬核看展攻略来袭！

全球人工智能领域正迎来历史性变革与迅猛发展，上海抢抓新一代人工智能发展机遇，以人工智能驱动形成新质生产力，加快打造世界级高端产业集群。...

2024-06-28 · 浏览502次