知识数据在健康医疗领域是数字化转型与智能化服务升级的核心驱动力,主要应用于 医药大模型训练,及医疗软件平台多场景化的 AI 功能支持。但目前, 数据作为要素原材料 在应用层面有以下难点 : 1. 数据基座建设中,高质量语料资源短缺:国内中文数据语料加工缺乏经验和投入, 数据加工和治理缺乏统一规范,高质量医疗数据资源稀缺。 2. 临床诊疗中,数据复用价值受限:高质量的医疗数据对于辅助决策和提供诊疗方案 参考至关重要。医疗数据的复杂性和特殊性,导致文本处理自动化程度低,效率低且易出错, 限制了医疗数据在提高诊疗效率和质量方面的应用价值。 3. 智能服务业务场景中,数据要素流通与融合难度大:AI 技术潜力巨大,但在满足医 院业务需求、符合医生诊疗逻辑方面仍面临数据流通的困难、多方协同的复杂性,数据融 合的专业性等问题。
方案以权威医学知识库为基础,重构规则库、模型库,将临床诊疗思维及推理过程数 据化,结合大模型技术,通过构建医学科研、CDSS 和虚拟患者大模型三大系统,实现对 医疗数据集成、智能分析和决策支持的应用路径。方案将高质量医疗数据、临床数据、真 实世界数据应用于大模型训练及 AI 系统中,满足了专业增强模型训练、幻觉消除纠正、数 据协同融合及共享流通下的业务应用,即提升临床诊疗医疗高质高效的核心问题。创新应 用情况如下: 1. 主题词数据要素 × 医学科研,打造核心数据基座,提高数据供给水平 高标准数据加工,开发医学专业文献数据库 CHKD。开发独有的医学专业主题分类智 能系统(MCI) ,通过智能标引,实现标引检索、语言转换、语言关联、语言查获,确保 数据语料化、规范化、精准化应用。 2. 规则数据要素 × 临床诊疗,挖掘数据应用场景,提升数据复用价值 基于健康数据互联互通根本要求,构建医学知识型数据体系和医学知识图谱;建设并 关联十三类医学规则数据库,实现医疗数据价值二次挖掘,提高医疗数据复用价值。开发 临床诊疗决策支持系统 CDSS,实现风险预警、辅助诊疗,进而规范医疗行为。 3. 数据要素流通、融合 × 大模型应用创新生态,儿科虚拟患者大模型探索应用。与 华为携手打造“华知”大模型,打破数据孤岛,实现数据要素高效流通和优化。与北京儿童医院、北京思普科等单位合作,结合大语言模型、医学文献数据,临床病例数据、知名 专家的诊疗逻辑数据,共建“儿科辅助诊疗大模型”,创建了多方共建共治的健康医疗数 据融合模式。
技术创新方面,运用自然语言处理、深度学习、切片向量化、知识图谱、大语言模型 等先进技术,实现高效处理和分析;采用模型优化算法,提升智慧医疗大模型的准确性和 泛化能力,确保模型实际应用的稳定性和可靠性。 应用创新方面,将医疗文献数据和临床数据作为核心数据要素,将数据资源向生产要 素和高质量生产力转变。强化数据资产化及数据资产入表的服务能力,推动跨来源、跨学 科的知识融合,利用大模型技术,助力医疗智能化决策。 模式创新方面,按照“数据资源化—资源产品化—产品价值化”的思路,依托数字出 版资源优势和数据加工技术优势,推动医疗数据标准化体系建设。试点医疗大模型场景化 应用,探索数据流通与商业模式,形成多方共建共享的健康医疗数据生态。
经济效益方面,一是“中国医院数字图馆”依托《中国医院知识总库 CHKD》等文献 知识库,驱动科研创新,累积服务 230 多个省市地区 3000 余家医院;提升了医学文献数 据供给质量,加强了学科实力,提升了学术品牌影响力,每月吸引活跃用户 45.6 万人, 创造了极高的学术价值。二是数据挖掘赋能《临床诊疗决策支持系统 CDSS》,成功助力 300 余家医院达成 4-6 电子病历评级,累计整体提示数 29.9 亿次。有效辅助医生医疗服务, 提升患者满意度,推动医疗机构整体服务效能与经济效益双重提升。三是以人工智能技术 挖掘更多数据应用场景,开发《肿瘤防治数字化平台》,整合“防 - 筛 - 诊 - 治 - 康”全生 命周期健康数据,提供“县域医疗智能化服务整体解决方案”,助力分级诊疗、优质医疗 资源扩容下沉,预计第一批服务 205 家县级医院智慧医院建设,促进医疗健康产业协同发 展。四是大模型技术全面整合各类数据要素,模拟真实临床场景,为 140 余万医学院校学 生提供“医药科研教学数字化服务整体解决方案”,为培养医学人才提供支持,有效降低 医学教育的经济成本和时间成本。 社会效益方面,项目实施促进了数据流通和共享,优化了医疗资源配置,降低了医疗 成本,减轻了医生的工作负担,提高了医疗保障水平,不仅有效推动了分级诊疗制度实施, 还缓解了医疗资源不足问题;患者享受到优质的医疗服务,满意度提高,医患关系改善, 促进了社会和谐稳定。