2026年5月30日,在广州举办的“2026南山呼吸健康论坛”上,京东健康与广州医科大学附属第一医院(以下简称“广医一院”)等机构合作,正式发布了中国首个通过权威4级评估的“呼吸医学人工智能数据集v1.0”。这一宝贵的数据资源问世,标志着我国在医疗AI应用于实际临床场景方面取得了里程碑式的进展,为解决医疗AI规模化应用中“数据瓶颈”问题提供了重要的基础。
权威4级认证,百位专家层层质控 在人工智能大模型时代,高质量行业数据集是基础与核心。这次发布的数据集由广医一院国家呼吸医学中心、国家临床医学研究中心的李时悦教授团队牵头,联合百余位呼吸医学专家以及算法和产品工程师共同打造。

经中国信息通信研究院依据国家标准《高质量数据集质量评测规范》及行业标准《面向人工智能的数据集质量通用评估方法 总体要求》(YD/T 6486-2025)严格评估,该数据集成为国内首个通过权威4级评估的呼吸医学高质量数据资源。核心数据历经文献/指南共识凝练、病案筛选、出题点提炼、大模型初筛、逐题复核等层层质控,专为AI与大模型训练、验证而设计,代表了当前国内数据集质量的顶尖水平。
超越信息罗列,训练AI“临床思维” 与常规数据集简单的“信息罗列”不同,该数据集致力于一个更高阶的目标——训练AI的“临床思维”。它覆盖常见、疑难呼吸系统疾病及高危人群,融合电子病历、影像、肺功能、呼吸介入、病理等多模态专科数据,贯穿入院评估、动态决策、出院随访等关键诊疗环节。
数据集将复杂的临床决策点(如证据整合、诊疗路径取舍优先级排序等)纳入评测体系,重点考查大模型在信息压力下的“下一步决策能力”,让AI真正学习并模仿呼吸科专家的思考方式。

落地门诊应用,构建智能化闭环 数据集的价值在于实际应用。基于这一高质量“燃料”,京东健康与广医一院已在呼吸专科门诊中探索出一条智能化闭环路径:患者挂号后,AI数字人自动发起预问诊,围绕主诉、现病史、过敏史等六类核心信息进行结构化采集,并智能分析患者上传的院内外报告;患者进入诊室前,一份整理好的结构化病历已同步至医生工作站。由此形成的标准化流程,让医生从繁琐的录入工作中解放出来,真正实现了“数据多跑路,医患少等待”。