医疗AI智能体全面综述:行业爆发,年增长130%!
【导读】AI智能体正把医疗AI从「看片子」升级成会思考、能行动的「医生搭档」。研究人员发表的最新综述,用通俗语言拆解智能体如何读懂多模态数据、像专家一样规划决策,又能扮演医生、护士、健康管家等多重角色;同时提醒:越智能越危险,必须配套严格评估、隐私保护与伦理护栏,才敢让它走进真实诊疗。
近年来,大模型的快速发展推动了AI智能体(AI Agents)技术的兴起。医疗健康作为一个知识密集、决策复杂且不确定性高的领域,正是智能体发挥价值的理想场景。
在智能体的加持下,医疗AI不再局限于医学影像分析等单一任务,而是有望升级为能够理解上下文、整合信息并进行复杂规划的医生合作伙伴。
AI智能体的核心优势在于其具备一定程度的自主性,能够执行比传统模型更复杂的任务。
然而,这种自主性也带来了医疗场景下的特殊挑战。
作为一个高风险的领域,医疗应用对安全性、隐私保护、伦理合规和可信度的要求远高于其他行业。
我们该如何设计、管理并信任这些具备自主能力的智能体系统?
在这一背景下,来自圣母大学、约翰·霍普金斯大学和埃默里大学的研究团队联合发布了医疗健康AI智能体的全面综述,系统性地梳理了医疗智能体从数据感知、核心能力、应用生态到评估框架的全生命周期,并总结了当前方法的局限性与未来研究方向。

论文链接:https://www.techrxiv.org/doi/full/10.36227/techrxiv.176240542.22279040/v2
论文仓库:https://github.com/AgenticHealthAI/Awesome-AI-Agents-for-Healthcare
研究人员已将本次综述所涵盖的200+篇论文在github整理为一份持续更新的资源列表。每篇论文均附有发表时间、所属类别、项目链接与GitHub星星数,旨在为社区提供一个动态发展的学术地图。

为什么是现在?
医疗智能体迎来爆发

arXiv预印平台上医疗智能体(蓝)和通用智能体(橙)论文数量增长曲线
医疗智能体研究正经历指数级增长。
数据显示,截至2025年,相关论文数量已较2024年全年增长超过130%,这一爆发既得益于通用智能体、多模态基础模型和临床API等关键技术的成熟,也源于医疗场景中对高效、可解释AI工具的迫切需求。

医疗智能体研究热点分析:数据、技术与应用
同时,研究前沿也在迅速扩展。
数据模态不断丰富:研究重点正从传统的文本(如对话、临床笔记)、医学图像和电子健康记录,转向时间序列信号(来自可穿戴设备)和基因组学等新兴数据源,标志着AI从分析静态记录迈入动态、高维生物数据时代。
关键技术持续演进:除框架开发、推理增强和多智能体协作外,知识图谱与强化学习成为新的技术焦点,推动智能体实现更可靠的结构化知识推理与奖励驱动型决策。
应用领域深入核心:智能体的应用正从公共卫生、精神健康等广泛领域,进一步拓展至药物研发与基因组学等生物医学核心环节,承担起科学假设验证与复杂数据解读的关键任务。
医疗智能体的全生命周期框架
要系统理解医疗智能体,一个贯穿其全生命周期的概念框架至关重要。它从感知环境开始,到核心能力构建,最终融入应用生态,完整地解剖了智能体在医疗场景中被构建、思考并发挥价值的完整链条。

医疗智能体从感知、能力到应用的生态全景图
感知:智能体如何理解医疗数据?
医疗数据的多模态与异构性是所有医疗AI应用的核心挑战。从医患对话到基因组序列,每种模态的数据结构、临床意义和处理范式截然不同。
因此,按数据类型进行系统性梳理,是构建能真正读懂医疗场景的智能体的第一步,也决定了其后续能力的上限和专精度。
智能体需具备处理多模态医疗数据的能力,具体包括:
对话与临床笔记:如医患对话、治疗文本、FHIR资源映射;
医学影像:涵盖2D图像(X光、病理切片)和3D体积数据(CT、MRI);
电子健康记录:结构化表格与医疗图谱;
时间序列信号:如心电图、光电容积脉搏波等来自可穿戴设备的数据;
基因组学与生物标志物:如基因集合、突变信息等。

医疗智能体的感知模态、智能体角色与代表系统概览
核心能力:智能体的「大脑」与「工具箱」
尽管记忆、规划、工具使用等能力是通用智能体的共性,但一旦置于医疗背景下,其内涵与权重便发生偏移。
例如,「工具使用」在医疗中意味着调用经过严格验证的计算模型,而「推理」则必须遵循循证医学的逻辑,使得通用架构被赋予了坚实的医疗专业性与安全性考量。这是实现智能决策的关键,也是区别于传统模型的核心:
记忆机制:分为情景记忆(维护当前会话上下文)、知识记忆(存储通用医学知识)和长期记忆(存储患者画像和健康记录);
知识检索与工具使用:智能体可自主调用外部资源,如查阅医学文献、调用临床计算器或专用图像分割模型;
规划与推理:将「诊断疾病」等复杂目标分解为可执行步骤,形成假设并验证;
模拟能力:智能体可扮演不同角色,如医患数字孪生、器官模型等,用于治疗推演与方案评估;
多智能体协作:模拟真实世界的多学科会诊,由放射科、药剂科、外科等专业智能体协同制定诊疗方案。

医疗多智能体系统的三种协调机制:(a) 任务分解:由协调者分配子任务。 (b) 辩论共识:同级智能体通过辩论达成一致 。 (c) 环境驱动:通过共享环境(如患者模拟器)进行异步协调 。

智能体架构、核心能力、典型系统与关键贡献一览
应用生态:以核心角色界定智能体的价值与风险
在医疗健康领域,智能体的服务对象直接决定了其定位、被赋予的自主权、以及潜在的风险等级。
例如,辅助医生的智能体多为「人类主导」的合作模式;而直接面向患者的智能体,因患者缺乏医学知识,其安全容错率极低,需内置更严格的监护与升级协议;
至于用于医学教育或医院管理的智能体,其影响范围则从个体扩展到整个系统
因此,依据智能体服务的核心角色进行划分有助于理解其应用生态:
医生:作为智能协作伙伴,辅助诊断、手术规划与临床决策;
患者:担任全天候健康管家,提供心理支持与个性化管理;
研究与教育者:成为科研加速器与虚拟导师,推动医学发现与人才培养;
管理者:承担运营协调角色,优化资源调度与合规审查。
更重要的是,智能体的价值正体现在打通这些角色间的壁垒,催生创新的混合应用。
例如,在远程诊疗中,智能体同时服务于医生与患者,协调问诊与随访;在公共卫生监测中,它则连接起研究者与管理者,将科研成果转化为监管决策。这彰显了智能体作为核心枢纽,重塑未来医疗协作模式的潜力。

医疗智能体的应用领域、智能体角色、自主级别与代表系统概览
评估框架
将智能体应用于临床,必须建立一套严格的评估标准,以确保其可靠性与安全性。一个完整的评估体系应涵盖以下三个层面:
任务与智能体性能:需超越单一的准确率指标,系统评估其在完整诊疗流程中的表现,包括规划执行能力、工具调用熟练度、多智能体协作效率以及任务完成成本。
仿真与临床集成:通过在虚拟医院等仿真环境中测试智能体在复杂场景下的综合能力与安全性,监测其是否违背临床指南,并验证其与真实电子病历数据及专家判断的一致性。
高效评估与校准:面对开放式临床任务,可采用大语言模型作为评委进行高效评估,但关键在于必须依据临床专家标注进行结果校准,并公开评判标准,以保证评估结果的可靠与公正。
通过多层次的综合评估才能确保智能体的进步不仅是技术指标的提升,更能转化为真实世界中的临床价值。
挑战与未来方向
尽管前景广阔,医疗智能体在实际部署中仍面临诸多挑战:
可靠的多模态融合:智能体需在信息不完整的情况下,融合异构数据(如信号与文本),并主动规划数据采集,避免错误决策链传播;
临床工作流整合:系统应能感知上下文(如ICU紧急性),支持人机交互,并与现有医院信息系统实现无缝互操作;
数据隐私的架构保障:针对智能体实时查询患者数据的特点,需构建最小权限访问、不可篡改的审计追踪等机制,确保动态交互中的隐私安全;
可信AI的可解释性:不仅要解释预测结果,更应展示推理过程,包括目标设定、备选方案与决策依据,并传达不确定性以建立临床信任;
适应性与复现性:开发能够适应不同临床环境、克服「域偏移」的自进化系统,并通过开放代码与模型提升可复现性,助力规模化部署。

医疗智能体所面临的核心挑战
在当前实践中,多数医疗智能体仍聚焦于相对孤立的子任务。只有系统性地解决上述挑战,这些系统才可能从「点状工具」扩展为贯穿全流程的协调中枢:在单一路径内感知患者状态、规划检查与干预、调用合适的模型与工具,并与多方临床角色协同决策。
未来,这一演化趋势指向面向复杂临床工作流的智能体式 AI 协调系统(Agentic AI),能够围绕长期治疗目标进行跨时序的计划、执行与校正,并在安全、隐私与可追责性保障下实现可规模化部署。
总结
综合分析揭示,医疗智能体的发展正汇聚于一个明确目标:构建一个能感知复杂环境、具备核心能力、并在真实场景中安全应用的临床协作者。
这一愿景的实现,必须由贯穿始终的严格评估来保驾护航。
目前,我们已在技术层面取得关键进展,但在多模态融合、系统互操作与数据治理等方面仍需深入探索。
未来的医疗AI,将超越单一工具的定位,演进为深度融入诊疗全流程、安全可信的智能合作伙伴。
参考资料:
https://www.techrxiv.org/doi/full/10.36227/techrxiv.176240542.22279040/v2
秒追ASI⭐点赞、转发、在看一键三连⭐点亮星标,锁定极速推送!
声明:本文转载自新智元,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。
游客
- 鸟过留鸣,人过留评。
- 和谐社区,和谐点评。
AI 中文社