训大模型为啥这么贵?专家:一半以上算力被浪费了
9月13日,在百度智能云举办的媒体技术沙龙上,百度杰出系统架构师、百度智能云AI计算部负责人王雁鹏表示,2024年大模型市场发展迅速,很多企业加大了在大模型领域的投入,但大家在...
2024-09-14
·
浏览1542次
OpenAI o1模型问世,五级AGI再突破!推理极限超博士,清北复旦华人立功
OpenAI o1模型问世,五级AGI再突破!推理极限超博士,清北复旦华人立功...
2024-09-13
·
浏览507次
音频驱动人像视频模型:字节Loopy、CyberHost研究成果揭秘
近期,来自字节跳动的视频生成模型 Loopy,一经发布就在 X 上引起了广泛的讨论。...
2024-09-12
·
浏览1183次
60亿AI独角兽Mistral祭出磁力链,首个多模态Pixtral 12B登场!但被大佬曝出评测造假
60亿AI独角兽Mistral祭出磁力链,首个多模态Pixtral 12B登场!但被大佬曝出评测造假...
2024-09-12
·
浏览469次
OpenAI 65亿融资成形,估值暴涨至1500亿美元!微软苹果英伟达相继「输血」
OpenAI 65亿融资成形,估值暴涨至1500亿美元!微软苹果英伟达相继「输血」...
2024-09-12
·
浏览308次
《人工智能安全治理框架》1.0 版发布
据央视新闻今日报道,在 2024 年国家网络安全宣传周主论坛上,全国网络安全标准化技术委员会发布《人工智能安全治理框架》1.0 版(下称《框架》)。...
2024-09-11
·
浏览418次
TPAMI 2024 | 计算机视觉中基于图神经网络和图Transformers的方法和最新进展
近年来,由于在图表示学习(graph representation learning)和非网格数据(non-grid data)上的性能优势,基于图神经网络(Graph Neu...
2024-09-10
·
浏览574次
天下苦英伟达久矣!PyTorch官方免CUDA加速推理,Triton时代要来?
近日,PyTorch 官方分享了如何实现无 CUDA 计算,对各个内核进行了微基准测试比较,并讨论了未来如何进一步改进 Triton 内核以缩小与 CUDA 的差距。...
2024-09-10
·
浏览656次
TPAMI 2024 | 计算机视觉中基于图神经网络和图Transformers的方法和最新进展
近年来,由于在图表示学习(graph representation learning)和非网格数据(non-grid data)上的性能优势,基于图神经网络(Graph Neu...
2024-09-10
·
浏览421次
天下苦英伟达久矣!PyTorch官方免CUDA加速推理,Triton时代要来?
近日,PyTorch 官方分享了如何实现无 CUDA 计算,对各个内核进行了微基准测试比较,并讨论了未来如何进一步改进 Triton 内核以缩小与 CUDA 的差距。...
2024-09-10
·
浏览586次
科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电
科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电...
2024-09-10
·
浏览511次
苹果史上第一台AI手机诞生,iPhone 16屠版热搜!中文版明年登场,3nm芯片封神
苹果史上第一台AI手机诞生,iPhone 16屠版热搜!中文版明年登场,3nm芯片封神...
2024-09-10
·
浏览587次
大模型边推理边纠错,有可能做到吗?这是ICML爆火的演讲
即便是最强大的语言模型(LLM),仍会偶尔出现推理错误。除了通过提示词让模型进行不太可靠的多轮自我纠错外,有没有更系统的方法解决这一问题呢?...
2024-09-09
·
浏览626次
AI 中文社